反復学習でCoTによる推論性能を向上させる手法 Metaとニューヨーク大学による研究

LLMは論理的な推論をする能力が限られて...
Read More

RAGの失敗パターン7選

研究者らは、RAGの7つの失敗パターンを...
Read More

ChatGPTの「初頭効果」について

カリフォルニア大学などの研究者らは、Ch...
Read More

Googleが開発した「LLMに長文を高精度で読解させる方法論」と実行プロンプト

LLMが一度に処理できる文章の長さには限...
Read More

マルチモーダルLLMにおけるハルシネーション(幻覚)の原因と対策

テキストだけでなく画像や動画などの視覚情...
Read More

Apple開発のオープンソースLLM「OpenELM」

Appleが公開した最新のオープンソース...
Read More

LLM

LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発
RAG(検索拡張生成)において約半分のトークン数でタスクを実行できるフレームワーク『FIT-RAG』
「ゲームでのLLM」における調査結果 プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理
人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える(つまり討論に負ける)傾向にあったとの実験報告
RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍
Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す

業界/カテゴリー

PAGE TOP