包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでLlama-3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果

LLMの性能が、様々な分野でどれほど進歩...
Read More

LLMで因果推論を行うためのプロンプト手法

因果推論とは、ある出来事が別の出来事にど...
Read More

エンタメ・アート

「ゲームでのLLM」における調査結果 プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理
ハーバード研究者などがLLMを創造的にすべく考案した、大喜利データセットでユーモアラスにチューニングする手法『LCoT』
マインクラフトを上手にプレイするAI『JARVIS-1』登場
LLMは「色」の概念をどれほど理解しているか
人物の「不自然さ」を極限まで取り除いて超リアルな画像を生成する『HyperHuman(ハイパーヒューマン)』
ポーカーなど不完全情報ゲームを「心の理論」で上手にプレイするGPT-4ベースの『Suspicion(疑心)-Agent』松尾研など開発
「1枚絵の3D化」が非常に手軽な操作で実行できる軽快なツール『DreamGaussian』とWebでの使い方
GPT-4などのLLMをエージェントとして既存ゲームシステムに導入し、NPCをAI化するツール『MindAgent』登場

業界/カテゴリー

PAGE TOP