次回の更新記事:多様なキャラクターを柔軟に演じることのできるLLMの…(公開予定日:2025年02月10日)

学習者の目標達成をサポートするLLMシステムの開発

本記事では、効率的なスキルアップを支援す...
Read More

OpenAIの思考プロセスを重視した言語モデルo3-mini その能力と安全性

本記事では、OpenAIがリリースした新...
Read More

OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果 

本記事では、OpenAIの新しい言語モデ...
Read More

ハルシネーションが創薬研究を進展させる可能性 LLMの新たな活用法

本記事では、LLMにおける「ハルシネーシ...
Read More

LLMにおける「計画立案能力」を高めるプロンプト手法の新提案

本記事では、LLMの自律的な計画立案能力...
Read More

マルチエージェントシステムで発生する同調バイアスを緩和する方法

本記事では、LLMのマルチエージェントシ...
Read More

三段論法でLLMの推論能力を高める プロンプト手法の新提案

本記事では、LLMに三段論法による推論能...
Read More

o1

OpenAI o1モデルファミリー登場 その特徴の全貌
OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
o1-previewが人間のように6つの思考パターンを使い分けているとの実験結果
「o1-preview」は自己評価メカニズムを持つ 計画立案中に自分の行動をチェックして修正 
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
「o1-preview」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い
OpenAIの新しいモデルo1-preview、従来のLLMと比べて「計画能力」で圧倒的な性能向上
PAGE TOP