AIDB
menu
AIDBとは
AI用語集
AI問題集
文献調査サービス
アカウント作成
ログイン
サイトQ&A
ホーム
過去の記事一覧
コンテンツ検索
Search for:
LLM
論文
「o1-preview」は自己評価メカニズムを持つ 計画立案中に自分の行動をチェックして修正
By AIDB Research
/ 2024/10/18
本記事では、OpenAIの最新モデル「o...
Read More
LLM
RAG
ファインチューニング
論文
ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない
By AIDB Research
/ 2024/10/17
本記事では、長い文脈を扱えるLLMをRA...
Read More
LLM
エージェント
論文
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
By AIDB Research
/ 2024/10/16
本記事では、OpenAIが開発した「機械...
Read More
LLM
プロンプト
論文
LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上 最大で30%改善
By AIDB Research
/ 2024/10/15
本記事では、LLMの多段階推論能力を向上...
Read More
LLM
プロンプト
論文
「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張
By AIDB Research
/ 2024/10/11
本記事では、LLMのシステムプロンプトに...
Read More
LLM
論文
複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場 最新モデルでも60%
By AIDB Research
/ 2024/10/10
本記事では、LLMのプログラミング能力を...
Read More
画像生成
画像認識
論文
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
By AIDB Research
/ 2024/10/09
本記事では、1枚の画像から高精度な奥行き...
Read More
LLM
RAG
論文
ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告(作成されたデータセットも公開)
By AIDB Research
/ 2024/10/08
本記事では、RAGシステムの性能を総合的...
Read More
LLM
エージェント
論文
100万体のLLMエージェントによるシミュレーションを実験できる環境が登場
By AIDB Research
/ 2024/10/07
本記事では、LLMを活用した大規模マルチ...
Read More
LLM
論文
「o1」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い
By AIDB Research
/ 2024/10/04
本記事では、OpenAIが開発した新しい...
Read More
LLM
2024/3/6
LLM
論文
「シリコンの群衆」LLM集団(12体)は人間にどれほど近づくか
「シリコンの群衆」LLM集団(12体)は人間にどれほど近づくか
2024/3/5
プロンプト
論文
「ポジティブ思考」プロンプトでLLMの性能向上 さらに自動最適化プロンプトが上をいくが、奇妙な現象も
「ポジティブ思考」プロンプトでLLMの性能向上 さらに自動最適化プロンプトが上をいくが、奇妙な現象も
2024/3/4
LLM
エージェント
プロンプト
論文
「人間の自然言語を超えて」LLMにタスク実行時の思考を非自然言語フォーマットで行わせるプロンプト手法『AutoForm(オートフォーム)』
「人間の自然言語を超えて」LLMにタスク実行時の思考を非自然言語フォーマットで行わせるプロンプト手法『AutoForm(オートフォーム)』
2024/3/1
LLM
RAG
論文
RAGにおいて取得された情報と事前知識が矛盾しても、情報に説得力があるときLLMは受け入れる
RAGにおいて取得された情報と事前知識が矛盾しても、情報に説得力があるときLLMは受け入れる
2024/2/29
LLM
プロンプト
論文
LLMに無礼なプロンプトを使用すると性能が低下するリスクの報告 一部、直感に反する複雑な結果も
LLMに無礼なプロンプトを使用すると性能が低下するリスクの報告 一部、直感に反する複雑な結果も
2024/2/28
LLM
プロンプト
論文
GPT-4やGeminiなどさまざまなLLMで、プロンプトの入力が長くなるにつれて推論性能に顕著な低下が見られる
GPT-4やGeminiなどさまざまなLLMで、プロンプトの入力が長くなるにつれて推論性能に顕著な低下が見られる
2024/2/27
LLM
メンタルヘルス・心理学
論文
LLMの「心の理論」能力を詳しく調べるためのベンチマーク『OpenToM』 GPT-4など複数モデルの評価結果
LLMの「心の理論」能力を詳しく調べるためのベンチマーク『OpenToM』 GPT-4など複数モデルの評価結果
2024/2/26
LLM
プロンプト
論文
GPT-4などに対してプロンプトのみから「新しい言葉の概念」を学習させるためのフレームワーク『FOCUS』
GPT-4などに対してプロンプトのみから「新しい言葉の概念」を学習させるためのフレームワーク『FOCUS』
<
1
…
18
19
20
21
22
…
43
>
コンテンツ検索
検索:
94218
直近1ヶ月で読まれている記事
専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
PAGE TOP
Copyright ©
AIDB
All rights reserved.