包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでLlama-3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果

LLMの性能が、様々な分野でどれほど進歩...
Read More

LLMで因果推論を行うためのプロンプト手法

因果推論とは、ある出来事が別の出来事にど...
Read More

医療・ヘルスケア

認知症の早期介入にLLMチャットボットが役に立つ ハーバードなどが検証
GPT-4にRAG(検索拡張生成)を適用するケーススタディ 臨床問題で人間の医師よりも高い精度を達成
医療におけるLLMの現状をまとめた報告 原則、タスク、アプリケーションそして課題
基盤モデル(GPT-4)はプロンプトの工夫で専門特化モデルに匹敵するほど性能が向上することが「医学分野」で示唆される
医療AIの性能を検証する大規模プロジェクト、MITやハーバード、マイクロソフトなど始動
MRIデータから音声を合成する手法 UCバークレーなどが開発
SkinGPT:大規模言語モデルがビジョンベースで診断を下す皮膚科ツール 概要から仕組みまで
ChatDoctor: 医療分野特化の大規模言語モデル

業界/カテゴリー

PAGE TOP