次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

LLM科学者と人間の協力で実験の効率化 Googleなど

本記事では、LLMを活用した科学実験の進...
Read More

100万ドル分のソフトウェアエンジニアリング業務に挑む

LLMがめざましく高度化しているにもかか...
Read More

「LLM活用で文書作成」社会でどこまで導入されている

本記事では、LLMが社会のさまざまな分野...
Read More

LLMを擬人化することに対する見解

本記事では、LLMを「人間らしいもの」と...
Read More

LLM専用の「新しい言葉」を導入 Google DeepMind

本記事では、LLMの理解と制御に向けて新...
Read More

AIDBプレミアム会員特典のお知らせ

情報収集と学習を継続されている皆さまに対...
Read More

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

ソフトウェアを自然言語で操作する新しい手...
Read More

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査 

これまで広い視野での「LLMによる仕事の...
Read More

o3-miniクイズ

*前回はDeepSeekについてのクイズ...
Read More

論文

スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認
「シリコンの群衆」LLM集団(12体)は人間にどれほど近づくか
「ポジティブ思考」プロンプトでLLMの性能向上 さらに自動最適化プロンプトが上をいくが、奇妙な現象も
「人間の自然言語を超えて」LLMにタスク実行時の思考を非自然言語フォーマットで行わせるプロンプト手法『AutoForm(オートフォーム)』
RAGにおいて取得された情報と事前知識が矛盾しても、情報に説得力があるときLLMは受け入れる
LLMに無礼なプロンプトを使用すると性能が低下するリスクの報告 一部、直感に反する複雑な結果も
GPT-4やGeminiなどさまざまなLLMで、プロンプトの入力が長くなるにつれて推論性能に顕著な低下が見られる
LLMの「心の理論」能力を詳しく調べるためのベンチマーク『OpenToM』 GPT-4など複数モデルの評価結果
GPT-4などに対してプロンプトのみから「新しい言葉の概念」を学習させるためのフレームワーク『FOCUS』
深層ニューラルネットワークの学習プロセスを運動方程式で表すことに成功 研究者本人が解説(NEC宮川大輝氏)
PAGE TOP