Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:LLMアプリケーション1,000事例から学ぶプロンプトテ…(公開予定日:2025年04月08日)

LLM

GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』フレームワークが考案されました。
ChatGPTで実際に行われた約151万件の対話を含むデータセット『WildChat』登場
LLMにナレッジグラフ(知識グラフ)を連携させることで、タスク遂行能力を大幅に向上させるフレームワーク『Graph Neural Prompting(GNP)』
LLMをセラピストとして実行し、「認知の歪み」を診断させるためのプロンプト手法『Diagnosis of Thought (DoT)』
LLMがソフトウェアエンジリアリングにおいて現時点で役に立つこと&課題。Metaなどの研究者らが報告
LLMエージェントは同調圧力に弱く考えに固執する傾向があるため、ディベートでバイアスを和らげるのが重要との報告。導入ツールも公開
LLMは時折「一時停止」させると、より計算し深く推論するためアウトプットの品質が向上するとの検証結果。新トークン導入フレームワーク
画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い
LLMは世界モデルを持ち「物事がどのように位置づけられ、時間がどのように進行するか」を理解する可能性
プロンプトを遺伝的アルゴリズムで自動最適化するプロンプトエンジニアリング手法『Promptbreeder(プロンプトブリーダー)』
OpenAIは、DALL·E 3の論文を通して「画像生成AIの安全性は前進した」ことを報告しています。
XなどのSNSポストから精神状態を高精度に解析するLLM『MentalLLaMA(メンタルラマ)』
ポーカーなど不完全情報ゲームを「心の理論」で上手にプレイするGPT-4ベースの『Suspicion(疑心)-Agent』松尾研など開発
GPT-4などのLLMが「AはB」から「BはA」を導かない『逆転の呪い』における誤解なき解釈と対策
異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP