次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

LLM科学者と人間の協力で実験の効率化 Googleなど

本記事では、LLMを活用した科学実験の進...
Read More

100万ドル分のソフトウェアエンジニアリング業務に挑む

LLMがめざましく高度化しているにもかか...
Read More

「LLM活用で文書作成」社会でどこまで導入されている

本記事では、LLMが社会のさまざまな分野...
Read More

LLMを擬人化することに対する見解

本記事では、LLMを「人間らしいもの」と...
Read More

LLM専用の「新しい言葉」を導入 Google DeepMind

本記事では、LLMの理解と制御に向けて新...
Read More

AIDBプレミアム会員特典のお知らせ

情報収集と学習を継続されている皆さまに対...
Read More

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

ソフトウェアを自然言語で操作する新しい手...
Read More

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査 

これまで広い視野での「LLMによる仕事の...
Read More

o3-miniクイズ

*前回はDeepSeekについてのクイズ...
Read More

音声

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
Metaのリアルタイム多言語間翻訳システム『Seamless(シームレス)』は話し方のトーンや抑揚も反映
自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
キーボード打鍵音から入力文字を特定するハッキング技術の精度が高いことが判明
大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大
人間の脳活動から音楽を再構築する:Brain2Musicの紹介
MRIデータから音声を合成する手法 UCバークレーなどが開発
AudioGPT:音声認識から歌声合成まで
PAGE TOP