最近公開された機械学習の最新論文の中から「ソースコード、事前学習済みのモデル、データセット」が与えられているホットなものを選んで紹介。実際にAIを動かして座学から抜け出そう!
バックナンバーはこちら
今週のラインナップ
1. オールインワンの音声処理ツール
2. 初学者でも機械学習が可能に
3. 顔認証システムのなりすましを防止する
4. 自然言語処理のための新しい事前トレーニング
5. 画像分類モデルResNetの改善
※エントリーについて
各論文・Githubや公式サイトで示されている実装手法に基づいて、何らかの題材をもとに技術を活用した/する意欲がある方は、各トピックスにある「エントリー」よりご連絡ください。結果にかかわらず取材させていただき、メディアでPRさせていただきます。
オールインワンの音声処理ツール
音声処理ツールであるESPnetの機能を拡張することで、オールインワンのツールキットにします。
ESPnetは自動音声認識(ASR)、機械翻訳(MT)を実装することができます。
この論文では、ESPnetの機能を拡張したESPnet-STというモデルを提案しています。
ESPnet-STは特に音声翻訳(ST)を対象としており、1つのフレームワークで音声合成を迅速に開発するために設計されています。また、ASR、MT、STを統一しているため、トレーニングデータとモデルのカスタマイズが非常に簡単です。
実装してみよう!
初学者でも機械学習が可能に
プログラミング初学者でも扱いやすいように機械学習のライブラリが改良されました。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。