包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでLlama-3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果

LLMの性能が、様々な分野でどれほど進歩...
Read More

LLMで因果推論を行うためのプロンプト手法

因果推論とは、ある出来事が別の出来事にど...
Read More

音声

マルチモーダルLLMの技術や開発トレンド、26種類のモデル例を網羅的にまとめた報告
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
Metaのリアルタイム多言語間翻訳システム『Seamless(シームレス)』は話し方のトーンや抑揚も反映
自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
キーボード打鍵音から入力文字を特定するハッキング技術の精度が高いことが判明
大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大
人間の脳活動から音楽を再構築する:Brain2Musicの紹介
MRIデータから音声を合成する手法 UCバークレーなどが開発

業界/カテゴリー

PAGE TOP