論文 | AIDB - Part 20

ホーム
過去の記事一覧

次回の更新記事：Web3向けLLMエージェントOS登場オープンソースの新…（公開予定日：2025年01月20日）

コンテンツ検索

Googleが実践するLLMを活用したコードマイグレーション

By AIDB Research / 2025/01/17

本記事では、Googleが取り組む”LL...

生成AIシステムのセキュリティ評価マイクロソフトが100事例から得た教訓

By AIDB Research / 2025/01/16

本記事では、マイクロソフトの研究チームに...

単一のLLMから２つのエージェントを作成し自分（たち）で改善させる手法が有効

By AIDB Research / 2025/01/15

本記事では、言語モデルの"自己改善"に新...

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

By AIDB Research / 2025/01/14

表やグラフといった構造化された画像は、私...

科学研究の自動化だけでなく人間と協働する「コパイロットモード」も備えるLLMエージェント登場

By AIDB Research / 2025/01/10

本記事では、研究者のアイデアを自動的に実...

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

By AIDB Research / 2025/01/09

本記事では、人間が思いついたゲーム理論的...

産業界における生成AIガイドラインを網羅したデータセット登場

By AIDB Research / 2025/01/08

本記事では、企業における大規模言語モデル...

LLMのマルチエージェントによる仮想通貨ポートフォリオ運用の自動化

By AIDB Research / 2025/01/07

本記事では、仮想通貨投資の判断をAIで支...

LLMは個人の金銭管理を適切にサポートできるのか？

By AIDB Research / 2025/01/06

本記事では、LLMを利用した個人財務サポ...

LLMによるニュース報道の広がり分析を活用した株価変動予測手法

By AIDB Research / 2025/01/03

本記事では、株式市場におけるニュースの影...

2024/6/11
LLM マルチモーダル論文

マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上　Googleが報告

2024/6/10
LLM 論文

難しいベンチマークで高性能なLLMでも単純な問題で間違えてしまう現象について「不思議の国のアリス問題」とGPT-4o、Claude-3、Llama 3などで分析

2024/6/7
LLM エージェント論文

仮想の翻訳会社「TRANSAGENTS」に学ぶ　マルチLLMエージェントによる効果的な翻訳システム

2024/6/6
LLM 論文

AIDB

コンテンツ検索

Googleが実践するLLMを活用したコードマイグレーション

生成AIシステムのセキュリティ評価マイクロソフトが100事例から得た教訓

単一のLLMから２つのエージェントを作成し自分（たち）で改善させる手法が有効

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

科学研究の自動化だけでなく人間と協働する「コパイロットモード」も備えるLLMエージェント登場

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

産業界における生成AIガイドラインを網羅したデータセット登場

LLMのマルチエージェントによる仮想通貨ポートフォリオ運用の自動化

LLMは個人の金銭管理を適切にサポートできるのか？

LLMによるニュース報道の広がり分析を活用した株価変動予測手法

論文

マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上　Googleが報告

難しいベンチマークで高性能なLLMでも単純な問題で間違えてしまう現象について「不思議の国のアリス問題」とGPT-4o、Claude-3、Llama 3などで分析

仮想の翻訳会社「TRANSAGENTS」に学ぶ　マルチLLMエージェントによる効果的な翻訳システム

LLMの出力が信頼できるかを判定する手法　Google DeepMindが新しく考案

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果

グラフニューラルネットワークを活用したRAG手法『GNN-RAG』　7BのLLMでも最先端性能

LLMで因果推論を行うためのプロンプト手法

LLMエージェントの認知バイアス

コンテンツ検索

おすすめポスト

コンテンツ検索

論文

コンテンツ検索

直近1ヶ月で読まれている記事

おすすめポスト