次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

投稿者の過去記事

マルチモーダルLLMの高難易度ベンチマーク『MMMU-Pro』で明らかになったこと
ロングコンテキストLLM台頭の今もRAGを使用する理由
RAGの検索データにおける「ノイズ(事実とは異なる情報など)」には有益なノイズと有害なノイズがある
RAGの検索精度を実務レベルに高めるには、「情報ごとに ”質問文” を作りデータベースに入れる」のが効果的との報告
プロンプトに5つほど”価値観の例”を示すだけで、LLMは特定の文化に適応した回答ができるようになるとの報告
GPT-4oで保険、銀行、小売りなどで人間への売り込みを実験 最大35%の確率で購買決定に成功
「AIが自動的に優れたAIエージェントを設計する」新分野の提唱 数学エージェントが読解でも好成績
RAGで検索文書の要約を活用したクエリ書き換えが検索精度を大幅に向上させる AWS報告
人間を討論で言い負かすディベート上手なLLMの実装
プロンプトの影響によるLLMの性能のばらつきを考慮した評価指標「Sharpeスコア」 NAIST研究者ら考案
PAGE TOP