AIDB
menu
AIDBとは
AI用語集
AI問題集
文献調査サービス
アカウント作成
ログイン
サイトQ&A
コンテンツ検索
検索:
62292
直近1ヶ月で読まれている記事
専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
日本ディープラーニング協会
お問い合わせはこちら
コンテンツ検索
Search for:
LLM
エージェント
論文
計画のステップが増えるほど、LLMは最初の目標を見失っていく傾向がある
By AIDB Research
/ 2024/10/22
本記事では、LLMを活用したエージェント...
Read More
LLM
論文
500以上の実世界のマルチモーダルタスクを含む、過去最大規模の評価ベンチマーク『MEGA-BENCH』登場
By AIDB Research
/ 2024/10/21
本記事では、マルチモーダルAIモデルの能...
Read More
LLM
論文
「o1-preview」は自己評価メカニズムを持つ 計画立案中に自分の行動をチェックして修正
By AIDB Research
/ 2024/10/18
本記事では、OpenAIの最新モデル「o...
Read More
LLM
RAG
ファインチューニング
論文
ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない
By AIDB Research
/ 2024/10/17
本記事では、長い文脈を扱えるLLMをRA...
Read More
LLM
エージェント
論文
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
By AIDB Research
/ 2024/10/16
本記事では、OpenAIが開発した「機械...
Read More
LLM
プロンプト
論文
LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上 最大で30%改善
By AIDB Research
/ 2024/10/15
本記事では、LLMの多段階推論能力を向上...
Read More
LLM
プロンプト
論文
「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張
By AIDB Research
/ 2024/10/11
本記事では、LLMのシステムプロンプトに...
Read More
LLM
論文
複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場 最新モデルでも60%
By AIDB Research
/ 2024/10/10
本記事では、LLMのプログラミング能力を...
Read More
画像生成
画像認識
論文
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
By AIDB Research
/ 2024/10/09
本記事では、1枚の画像から高精度な奥行き...
Read More
LLM
RAG
論文
ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告(作成されたデータセットも公開)
By AIDB Research
/ 2024/10/08
本記事では、RAGシステムの性能を総合的...
Read More
2024/9/27
LLM
論文
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
2024/9/26
LLM
論文
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
2024/9/25
LLM
エージェント
プロンプト
論文
LLMの「自己対話」により複雑な問題の解決能力を飛躍的に向上させる手法『Iteration of Thought』
LLMの「自己対話」により複雑な問題の解決能力を飛躍的に向上させる手法『Iteration of Thought』
2024/9/24
LLM
プロンプト
論文
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
2024/9/23
LLM
医療・ヘルスケア
論文
医療のような専門分野におけるLLMの性能は「知識グラフと再ランキングの併用」で大幅に向上(東京大学Irene Li氏)
医療のような専門分野におけるLLMの性能は「知識グラフと再ランキングの併用」で大幅に向上(東京大学Irene Li氏)
2024/9/20
LLM
エージェント
プロンプト
論文
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
2024/9/19
LLM
論文
単純に生成回数を増やすとLLMの性能が大幅に向上する「推論時のスケーリング則」
単純に生成回数を増やすとLLMの性能が大幅に向上する「推論時のスケーリング則」
2024/9/18
LLM
エージェント
論文
リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発
リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発
<
1
2
3
4
5
…
218
>
コンテンツ検索
検索:
11710
直近1ヶ月で読まれている記事
専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
日本ディープラーニング協会
お問い合わせはこちら
PAGE TOP
Copyright ©
AIDB
All rights reserved.