次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

LLM科学者と人間の協力で実験の効率化 Googleなど

本記事では、LLMを活用した科学実験の進...
Read More

100万ドル分のソフトウェアエンジニアリング業務に挑む

LLMがめざましく高度化しているにもかか...
Read More

「LLM活用で文書作成」社会でどこまで導入されている

本記事では、LLMが社会のさまざまな分野...
Read More

LLMを擬人化することに対する見解

本記事では、LLMを「人間らしいもの」と...
Read More

LLM専用の「新しい言葉」を導入 Google DeepMind

本記事では、LLMの理解と制御に向けて新...
Read More

AIDBプレミアム会員特典のお知らせ

情報収集と学習を継続されている皆さまに対...
Read More

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

ソフトウェアを自然言語で操作する新しい手...
Read More

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査 

これまで広い視野での「LLMによる仕事の...
Read More

o3-miniクイズ

*前回はDeepSeekについてのクイズ...
Read More

マルチモーダル

LLMを活用した「Text to CAD」 テキスト指示から高品質な3Dモデルを作成する
マルチモーダルLLMによる表やグラフの理解力を向上させる方法
時系列データをグラフにしてLLMに見せると文字だけより最大120%性能向上 トークンも節約
画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど
500以上の実世界のマルチモーダルタスクを含む、過去最大規模の評価ベンチマーク『MEGA-BENCH』登場
マルチモーダルLLMの高難易度ベンチマーク『MMMU-Pro』で明らかになったこと
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その2 マルチモーダルとエージェント〜
マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告
GPT-4o、Gemini、Claude 3などにおける「長いプロンプトのマルチモーダルタスク」性能を測定した結果
スタンフォード大学の研究者ら、GPT-4oとGemini1.5 Proで「マルチモーダルモデルにおける『Many-Shot』の効果」を検証
PAGE TOP