次回の更新記事:企業実務タスクにおけるLLMエージェントの能力を評価…(公開予定日:2024年12月23日)

動画を理解する軽量なLLM『Apollo』、オープンソースで登場(商用利用も可能)

本記事では、動画を理解する大規模マルチモ...
Read More

LLMエージェントに人間のような欲求を持たせてシミュレーションする手法

本記事では、人間らしい行動を再現するLL...
Read More

LLM同士による人工言語コミュニケーションで発見された「言語構造の創発」

本記事では、LLMが人工言語を学習・使用...
Read More

LLMを利用した「自動データクリーニング」方法

本記事では、データ活用の現場で大きな壁と...
Read More

研究活動におけるLLMの「使われ方」や「好まれ方」に関する実態調査の結果

本記事では、816名の研究者を対象とした...
Read More

LLMの開発トレンドに新たに見出された『密度化の法則』および『能力密度』の概念

本記事では、LLMにおける新しい評価指標...
Read More

LLMにおける事実性の評価&向上に役立つデータセットの作り方

本記事では、LLMが抱える「ハルシネーシ...
Read More

OpenAI o1モデルファミリー登場 その特徴の全貌

この記事では、OpenAIがついにo1モ...
Read More

LLM

米国3人に1人が生成AIを使用 ブルーカラー労働者も生産性向上 大規模調査より 
LLMの論理的推論能力をステップバイステップ以上に向上させる手法『Logic-of-Thought』プロンプティング(テンプレートつき)
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
OpenAIの新しいモデルo1-preview、従来のLLMと比べて「計画能力」で圧倒的な性能向上
LLMの「自己対話」により複雑な問題の解決能力を飛躍的に向上させる手法『Iteration of Thought』
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
医療のような専門分野におけるLLMの性能は「知識グラフと再ランキングの併用」で大幅に向上(東京大学Irene Li氏)
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
PAGE TOP