『LLM-as-a-judge』のさまざまな応用と分野の展望

AI分野では、テキストの品質評価が大きな...
Read More

LLMを「評価者」として活用する『LLM-as-a-judge』の基本

本記事では、新たな評価手法として注目され...
Read More

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)

本記事では、視覚と言語を組み合わせたマル...
Read More

LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

プロンプト

LLMでWikipediaのような文書を作成する方法「STORM」スタンフォード大学研究者ら開発
プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案
LLMにおける、長いコンテキストから欲しい情報を見つけ出す「needle-in-a-haystack(干し草の中の針)」テスト結果とプロンプト例
プロンプトに例を多く載せるほど、どんなタスクでも性能が上がるのか?DeepMindによる『Many-shot Learning』の実験結果
LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング
LLMに心の目を与える『Visualization-of-Thought』プロンプティング マルチモーダルモデルに匹敵する空間推論性能を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍
LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す
PAGE TOP