次回の更新記事:LLMでユースケース図の作成時間を大幅に短縮 3つの…(公開予定日:2025年11月17日)

論文

Claude 3などのLLMはコンテキスト内学習によって線形回帰・非線形回帰問題タスクもこなす
時系列分析におけるLLMの可能性
ChatGPTと実際に交わされた会話の世界最大規模データセット「WildChat」
LLMは制御工学でどれほど能力があるか Claude 3、GPT-4、Gemini Ultraでの実験結果
LLMに心の目を与えるプロンプティング手法 マルチモーダルモデルに匹敵する空間推論性能を達成
LLMによりクエリを生成するアプローチで情報検索の精度を上げる方法
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
LLMの化学的能力はどれほどか 最先端LLMと人間を比較した結果
ハーバード大学の研究者らによる「現時点で、AIは研究にどう役立つのか」調査と論考
LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発
RAG(検索拡張生成)において約半分のトークン数でタスクを実行できるフレームワーク『FIT-RAG』
「ゲームでのLLM」における調査結果 プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理
人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える(つまり討論に負ける)傾向にあったとの実験報告
RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP