Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:標準作業手順書(SOP)をもとにLLMエージェントシス…(公開予定日:2025年03月31日)

オープンソース

スマートフォンアプリにおけるLLM活用の開発実態
DeepSeek-R1の性能を検証 4つの主要LLMと比較
DeepSeek R1が実現した教師なし強化学習による推論性能の向上
ブラウザでLLMをローカル展開する手法
18兆トークンで学習されたオープンソースLLM『Qwen2.5』シリーズの性能
動画を理解する軽量なLLM『Apollo』、オープンソースで登場(商用利用も可能)
OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
オープンソースのコード生成LLMが商用LLMに追いつく Qwen2.5-Coderの能力値全容
Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持、実験で確認
IBMから日本語対応の商用可能オープンソースLLM「GRANITE 3.0」公開 8Bから
オープンソースモデルでも力を合わせれば先端モデルに匹敵することを示す「Mixture-of-Agents(MoA)」アーキテクチャ
Apple開発のオープンソースLLM「OpenELM」
強くて軽いモデルPhi-3の評価結果 Microsoftの論文(テクニカルレポート)より
GPT-4レベルの質問応答タスク性能をオープンソースモデルのLlama 2で実現する「ChatQA」NVIDIAが開発

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP