LLMが自分で「より賢いLLMの作り方」を発見するSelf-Developingフレームワーク(NEC 石橋陽一氏)

本記事は、研究者が自ら著書の論文を解説す...
Read More

LLMに対するオープンソース安全性評価ツールの比較

本記事では、LLMの安全性を自動的にチェ...
Read More

開発企業や言語ごとに異なるLLMのイデオロギー、価値観や態度

本記事では、最新の研究から明らかになった...
Read More

コンテキスト内で重要な情報同士が離れすぎるとLLMの性能は大幅に下がる

本記事では、LLMの長文理解における「情...
Read More

o1モデルが人間のように6つの思考パターンを使い分けているとの実験結果

本記事では、AIの性能向上における「推論...
Read More

o1

o1モデルが人間のように6つの思考パターンを使い分けているとの実験結果
「o1-preview」は自己評価メカニズムを持つ 計画立案中に自分の行動をチェックして修正 
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
「o1」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
PAGE TOP