次回の更新記事:「すべてのソフトウェアをエージェントとして使う」…(公開予定日:2025年02月14日)

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査 

これまで広い視野での「LLMによる仕事の...
Read More

o3-miniクイズ

*前回はDeepSeekについてのクイズ...
Read More

DeepSeek‑R1クイズ

2025年1月20日に最新版「DeepS...
Read More

継続利用・累計利用特典企画のお知らせ

AIDBプレミアム会員の継続利用6ヶ月(...
Read More

学習者の目標達成をサポートするLLMシステムの開発

本記事では、効率的なスキルアップを支援す...
Read More

推論モデル

DeepSeek-R1の性能を検証 4つの主要LLMと比較
OpenAIの思考プロセスを重視した言語モデルo3-mini その能力と安全性
OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果 
DeepSeek R1が実現した教師なし強化学習による推論性能の向上
OpenAI o1モデルファミリー登場 その特徴の全貌
OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
o1-previewが人間のように6つの思考パターンを使い分けているとの実験結果
「o1-preview」は自己評価メカニズムを持つ 計画立案中に自分の行動をチェックして修正 
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
PAGE TOP