『LLM-as-a-judge』のさまざまな応用と分野の展望

AI分野では、テキストの品質評価が大きな...
Read More

LLMを「評価者」として活用する『LLM-as-a-judge』の基本

本記事では、新たな評価手法として注目され...
Read More

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)

本記事では、視覚と言語を組み合わせたマル...
Read More

LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

プロンプト

『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
LLMで因果推論を行うためのプロンプト手法
多くの「長いコンテキストを要するタスク」を、短いコンテキストウィンドウのLLMで解決する手法
時系列データの異常検知にLLMを使用する手法と実行プロンプト
スタンフォード大学の研究者ら、GPT-4oとGemini1.5 Proで「マルチモーダルモデルにおける『Many-Shot』の効果」を検証
ChatGPTの「初頭効果」について
LLMのプロンプトに数百から数千の例を含める超長尺のコンテキスト内学習(In-context learning)とファインチューニングの性能比較
LLMに対して、「人間には意味が分からない滅茶苦茶な文」でプロンプトを送る手法『LM Babel』
PAGE TOP