次回の更新記事:機能実装やテスト生成まで実務で使えるLLMを見極める…(公開予定日:2025年12月19日)
📢 メンテナンスのお知らせ:12/27(土) 13:00〜14:00 にサイトリニューアルのためメンテナンスを実施します。

記事スタイル

LLMは制御工学でどれほど能力があるか Claude 3、GPT-4、Gemini Ultraでの実験結果
LLMに心の目を与えるプロンプティング手法 マルチモーダルモデルに匹敵する空間推論性能を達成
LLMによりクエリを生成するアプローチで情報検索の精度を上げる方法
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
LLMの化学的能力はどれほどか 最先端LLMと人間を比較した結果
ハーバード大学の研究者らによる「現時点で、AIは研究にどう役立つのか」調査と論考
LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発
RAG(検索拡張生成)において約半分のトークン数でタスクを実行できるフレームワーク『FIT-RAG』
「ゲームでのLLM」における調査結果 プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理
人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える(つまり討論に負ける)傾向にあったとの実験報告
RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍
Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す
LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP