重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。
最近公開された機械学習の最新論文の中から「ソースコード、事前学習済みのモデル、データセット」が与えられているホットなものを選んで紹介。実際にAIを動かして座学から抜け出そう!
バックナンバーはこちら
今週のラインナップ
1. AIの人間らしい音声の実現
2. 2Dから3Dで人間の関節を推定
3. AIによる読唇術
4. グラフ比較の効率化
5. ロボットの効率的な強化学習
AIの人間らしい音声の実現
NVIDIAが、リアルで表現力のある音声合成モデルを発表しました。
既存の音声合成モデルの多くは、感情や人間のような表現に欠けていることが大きな課題となっています。
この論文の著者であるNVIDIAのRafael Valleらは、既存のモデルよりもリアルな表現を生成し、ユーザーコントロールを向上させた最先端のモデルであるFlowtronを提案しています。
Flowtronはラベルなしで音声合成が可能であり、類似または異なるテキストを持つ文を使用して別の話者に話をさせたり、単調な音声をより表現力のある音声にしたりすることができます。更に他のモデルとは異なりトレーニングデータの可能性を最大化することによって最適化されることで、トレーニングをシンプルかつ安定させます。
実装してみよう!
関連記事▶️人間が楽しめる「落語」音声を合成
2Dから3Dで人間の関節を推定
2D検出器から3Dで人間の関節を推定します。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。