論文 | AIDB - Part 25

ホーム
過去の記事一覧

次回の更新記事：会議出席代行システム　LLMでどこまでできるか（公開予定日：2025年02月25日）

コンテンツ検索

LLM科学者と人間の協力で実験の効率化　Googleなど

By AIDB Research / 2025/02/21

本記事では、LLMを活用した科学実験の進...

100万ドル分のソフトウェアエンジニアリング業務に挑む

By AIDB Research / 2025/02/20

LLMがめざましく高度化しているにもかか...

「LLM活用で文書作成」社会でどこまで導入されている

By AIDB Research / 2025/02/19

本記事では、LLMが社会のさまざまな分野...

LLMを擬人化することに対する見解

By AIDB Research / 2025/02/18

本記事では、LLMを「人間らしいもの」と...

LLM専用の「新しい言葉」を導入　Google DeepMind

By AIDB Research / 2025/02/17

本記事では、LLMの理解と制御に向けて新...

AIDBプレミアム会員特典のお知らせ

By AIDB Research / 2025/02/15

情報収集と学習を継続されている皆さまに対...

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

By AIDB Research / 2025/02/14

ソフトウェアを自然言語で操作する新しい手...

天井が見え始めたこれまでのLLMベンチマークを超える究極の問題集 DeepSeek-R1もテスト

By AIDB Research / 2025/02/13

LLMの性能は日々進化を続けています。そ...

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査　

By AIDB Research / 2025/02/12

これまで広い視野での「LLMによる仕事の...

o3-miniクイズ

By AIDB Research / 2025/02/11

*前回はDeepSeekについてのクイズ...

スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認

2024/3/6
LLM 論文

GPT-4などに対してプロンプトのみから「新しい言葉の概念」を学習させるためのフレームワーク『FOCUS』

2024/2/23
論文

AIDB

コンテンツ検索

LLM科学者と人間の協力で実験の効率化　Googleなど

100万ドル分のソフトウェアエンジニアリング業務に挑む

「LLM活用で文書作成」社会でどこまで導入されている

LLMを擬人化することに対する見解

LLM専用の「新しい言葉」を導入　Google DeepMind

AIDBプレミアム会員特典のお知らせ

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

天井が見え始めたこれまでのLLMベンチマークを超える究極の問題集 DeepSeek-R1もテスト

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査

o3-miniクイズ

論文

スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認

「シリコンの群衆」LLM集団（12体）は人間にどれほど近づくか

「ポジティブ思考」プロンプトでLLMの性能向上　さらに自動最適化プロンプトが上をいくが、奇妙な現象も

「人間の自然言語を超えて」LLMにタスク実行時の思考を非自然言語フォーマットで行わせるプロンプト手法『AutoForm（オートフォーム）』

RAGにおいて取得された情報と事前知識が矛盾しても、情報に説得力があるときLLMは受け入れる

LLMに無礼なプロンプトを使用すると性能が低下するリスクの報告　一部、直感に反する複雑な結果も

GPT-4やGeminiなどさまざまなLLMで、プロンプトの入力が長くなるにつれて推論性能に顕著な低下が見られる

LLMの「心の理論」能力を詳しく調べるためのベンチマーク『OpenToM』 GPT-4など複数モデルの評価結果

GPT-4などに対してプロンプトのみから「新しい言葉の概念」を学習させるためのフレームワーク『FOCUS』

深層ニューラルネットワークの学習プロセスを運動方程式で表すことに成功　研究者本人が解説（NEC宮川大輝氏）

コンテンツ検索

おすすめポスト

コンテンツ検索

論文

コンテンツ検索

直近1ヶ月で読まれている記事

おすすめポスト