Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:個人の振る舞いや考え方を模倣するアバターをLLMで構…(公開予定日:2025年03月28日)

音声

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
Metaのリアルタイム多言語間翻訳システム『Seamless(シームレス)』は話し方のトーンや抑揚も反映
自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
キーボード打鍵音から入力文字を特定するハッキング技術の精度が高いことが判明
大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大
人間の脳活動から音楽を再構築する:Brain2Musicの紹介
MRIデータから音声を合成する手法 UCバークレーなどが開発
AudioGPT:音声認識から歌声合成まで

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP