『LLM-as-a-judge』のさまざまな応用と分野の展望

AI分野では、テキストの品質評価が大きな...
Read More

LLMを「評価者」として活用する『LLM-as-a-judge』の基本

本記事では、新たな評価手法として注目され...
Read More

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)

本記事では、視覚と言語を組み合わせたマル...
Read More

LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLM

ChatGPTによる医師免許試験の成績「医学部3年生に匹敵する」米イエール大学
AIはサイコパスか?ChatGPTなど大規模言語モデルAIの性格や幸福度を評価
PAGE TOP