『LLM-as-a-judge』のさまざまな応用と分野の展望

AI分野では、テキストの品質評価が大きな...
Read More

LLMを「評価者」として活用する『LLM-as-a-judge』の基本

本記事では、新たな評価手法として注目され...
Read More

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)

本記事では、視覚と言語を組み合わせたマル...
Read More

LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

A判定で東大に落ちる確率は?計算してみた!(2)~MAP推定編~【東大生AI初心者の学習日誌 Day6】
違法取引ツイートを自動BAN!?機械学習で絶滅危惧種を守る(AI×環境)【論文】
E資格の勉強内容まとめDay1「ディープラーニングの概要」
AIが「匂い」からワインの品質を評価!(AI×食品)【論文】
IPO投資の爆益を手助け?機械学習で最適ポートフォリオを構築(AI×金融)【論文】
外科医の手術の上手さをVRシミュレーションでランク付け(AI×VR)【論文】
ツイートから暗号通貨の価格を予測!稼げる投資戦略のヒントに(AI×金融)【論文】
A判定でも東大に落ちる確率は?計算してみた!(1)~最尤推定編~【東大生AI初心者の学習日誌 Day5】
PAGE TOP