論文データベース(β版)
お知らせ
アカウント作成
ログイン
クリップ一覧
プレミアム会員について
次回の更新記事:
LLM-as-a-Judge入門 仕組み・バイアス・実務活用を…
(公開予定日:2026年01月17日)
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。
見てみる
記事一覧
HOME
記事一覧
音声の記事一覧
投稿の記事一覧が表示されるページです。
注目論文まとめ
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
2023.12.29
深堀り解説
🔒 Metaのリアルタイム多言語間翻訳システム『Seamless(シームレス)』は話し方のトーンや抑揚も反映
2023.12.06
2025.03.08
深堀り解説
🔒 自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
2023.11.06
2025.03.08
深堀り解説
🔒 キーボード打鍵音から入力文字を特定するハッキング技術の精度が高いことが判明
2023.08.10
2025.03.08
深堀り解説
🔒 大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大
2023.07.31
2025.03.08
深堀り解説
🔒 人間の脳活動から音楽を再構築する:Brain2Musicの紹介
2023.07.26
2025.03.08
深堀り解説
🔒 MRIデータから音声を合成する手法 UCバークレーなどが開発
2023.07.18
2025.03.08
深堀り解説
🔒 AudioGPT:音声認識から歌声合成まで
2023.05.16
2025.03.08
トップページ
AIDBとは
プレミアム会員規約
運営会社
お問い合わせ
よくある質問
Copyright © Parks, Inc. All rights reserved.
論文データベース(β版)
お知らせ
アカウント作成
ログイン
クリップ一覧
プレミアム会員について