論文 | AIDB - Part 19

ホーム
過去の記事一覧

次回の更新記事：Web3向けLLMエージェントOS登場オープンソースの新…（公開予定日：2025年01月20日）

コンテンツ検索

Googleが実践するLLMを活用したコードマイグレーション

By AIDB Research / 2025/01/17

本記事では、Googleが取り組む”LL...

生成AIシステムのセキュリティ評価マイクロソフトが100事例から得た教訓

By AIDB Research / 2025/01/16

本記事では、マイクロソフトの研究チームに...

単一のLLMから２つのエージェントを作成し自分（たち）で改善させる手法が有効

By AIDB Research / 2025/01/15

本記事では、言語モデルの"自己改善"に新...

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

By AIDB Research / 2025/01/14

表やグラフといった構造化された画像は、私...

科学研究の自動化だけでなく人間と協働する「コパイロットモード」も備えるLLMエージェント登場

By AIDB Research / 2025/01/10

本記事では、研究者のアイデアを自動的に実...

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

By AIDB Research / 2025/01/09

本記事では、人間が思いついたゲーム理論的...

産業界における生成AIガイドラインを網羅したデータセット登場

By AIDB Research / 2025/01/08

本記事では、企業における大規模言語モデル...

LLMのマルチエージェントによる仮想通貨ポートフォリオ運用の自動化

By AIDB Research / 2025/01/07

本記事では、仮想通貨投資の判断をAIで支...

LLMは個人の金銭管理を適切にサポートできるのか？

By AIDB Research / 2025/01/06

本記事では、LLMを利用した個人財務サポ...

LLMによるニュース報道の広がり分析を活用した株価変動予測手法

By AIDB Research / 2025/01/03

本記事では、株式市場におけるニュースの影...

2024/6/21
LLM エージェントオープンソース論文

オープンソースモデルでも力を合わせればGPT-4oに匹敵することを示す「Mixture-of-Agents（MoA）」アーキテクチャ

2024/6/20
LLM 論文

現実世界の確率分布における言語モデルの推定能力と改善方法　Googleが検証

2024/6/19
LLM サーベイプロンプト論文

『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その3　プロンプトエンジニアリングのケーススタディ〜

『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その2　マルチモーダルとエージェント〜

2024/6/17
LLM サーベイプロンプト論文

『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その1　重要な用語と各種プロンプト手法〜

2024/6/14
LLM RAG ベンチマーク論文

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

2024/6/13
LLM 論文

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

2024/6/12
LLM 政治・社会論文

AIDB

コンテンツ検索

Googleが実践するLLMを活用したコードマイグレーション

生成AIシステムのセキュリティ評価マイクロソフトが100事例から得た教訓

単一のLLMから２つのエージェントを作成し自分（たち）で改善させる手法が有効

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

科学研究の自動化だけでなく人間と協働する「コパイロットモード」も備えるLLMエージェント登場

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

産業界における生成AIガイドラインを網羅したデータセット登場

LLMのマルチエージェントによる仮想通貨ポートフォリオ運用の自動化

LLMは個人の金銭管理を適切にサポートできるのか？

LLMによるニュース報道の広がり分析を活用した株価変動予測手法

論文

オープンソースモデルでも力を合わせればGPT-4oに匹敵することを示す「Mixture-of-Agents（MoA）」アーキテクチャ

現実世界の確率分布における言語モデルの推定能力と改善方法　Googleが検証

『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その3　プロンプトエンジニアリングのケーススタディ〜

『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その2　マルチモーダルとエージェント〜

『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その1　重要な用語と各種プロンプト手法〜

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

LLMは与えられたペルソナ（役割）に応じてバイアスが変化することが明らかに

コンテンツ検索

おすすめポスト

コンテンツ検索

論文

コンテンツ検索

直近1ヶ月で読まれている記事

おすすめポスト