次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

LLM科学者と人間の協力で実験の効率化 Googleなど

本記事では、LLMを活用した科学実験の進...
Read More

100万ドル分のソフトウェアエンジニアリング業務に挑む

LLMがめざましく高度化しているにもかか...
Read More

「LLM活用で文書作成」社会でどこまで導入されている

本記事では、LLMが社会のさまざまな分野...
Read More

LLMを擬人化することに対する見解

本記事では、LLMを「人間らしいもの」と...
Read More

LLM専用の「新しい言葉」を導入 Google DeepMind

本記事では、LLMの理解と制御に向けて新...
Read More

AIDBプレミアム会員特典のお知らせ

情報収集と学習を継続されている皆さまに対...
Read More

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

ソフトウェアを自然言語で操作する新しい手...
Read More

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査 

これまで広い視野での「LLMによる仕事の...
Read More

o3-miniクイズ

*前回はDeepSeekについてのクイズ...
Read More

プロンプト

「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張
対話の中でユーザーの好みを学ぶ手法『CIPHER』 (プロンプトテンプレートあり)
専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』
LLMの論理的推論能力をステップバイステップ以上に向上させる手法『Logic-of-Thought』プロンプティング(テンプレートつき)
LLMの「自己対話」により複雑な問題の解決能力を飛躍的に向上させる手法『Iteration of Thought』
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
LLMの推論能力を戦略的に向上させる新しいプロンプト手法『SCoT』
プロンプトに5つほど”価値観の例”を示すだけで、LLMは特定の文化に適応した回答ができるようになるとの報告
プロンプトの影響によるLLMの性能のばらつきを考慮した評価指標「Sharpeスコア」 NAIST研究者ら考案
PAGE TOP