AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

検索対象: 記事(854件) 短信(643件) 🔒 論文(17,946件) 🔒

オープンソースのコード生成LLMが商用LLMに追いつく　Qwen2.5-Coderの能力値全容

2024.11.182025.04.27

深堀り解説

本記事では、コード生成に特化したLLM「Qwen2.5-Coder」の研究成果を紹介します。

このモデルは、GPT-4oやClaude3.5に匹敵する性能を持つオープンソースのコードLLMとして注目を集めており、0.5Bから32Bまでの6つのサイズ展開で、40以上のプログラミング言語に対応しています。

5.5兆トークンという膨大なデータでの学習で、コード生成・デバッグ・SQL生成など多岐にわたる機能を備え、開発者の実用的なニーズに応えることを目指して開発されました。

参照文献情報

タイトル：Qwen2.5-Coder Technical Report

著者：Binyuan Hui, Jian Yang, Zeyu Cui, Jiaxi Yang, Dayiheng Liu, Lei Zhang, Tianyu Liu, Jiajun Zhang, Bowen Yu, Keming Lu, Kai Dang, Yang Fan, Yichang Zhang, An Yang, Rui Men, Fei Huang, Bo Zheng, Yibo Miao, Shanghaoran Quan, Yunlong Feng, Xingzhang Ren, Xuancheng Ren, Jingren Zhou, Junyang Lin

所属：Qwen Team of Alibaba Group

背景

プログラミングに特化した言語モデルの研究が活発に行われています。これまでStarCoderシリーズ、CodeLlamaシリーズ、DeepSeek-Coderシリーズ、CodeQwen1.5、CodeStralなど、多くのコードLLMが開発されてきました。

しかし、最新の非公開モデルであるClaude-3.5-SonnetやGPT-4oと比べると、オープンソースのコードLLMには、まだ改善の余地がありました。

このような背景から、今回研究チームは以前開発したCodeQwen1.5の経験を生かし、より性能の高い新しいモデルの開発に取り組むことにしました。5.5兆を超える大量のデータを用いて、プログラミングに特化した事前学習を行うことにしたのです。

データの収集には、GitHubなどのプログラミング関連サイトやウェブから得られた情報を活用したそうです。ただし、単にデータを集めるだけでなく、質の低いコンテンツを取り除くため、機械学習を使った選別も行っています。

さらに、プログラミングだけでなく、数学や一般的な文章の理解力を持つことも目指しています。そのため、コード、数学、一般テキストをバランスよく組み合わせてデータが作成されました。

そして0.5Bから32Bまでの異なる規模のモデルを開発することで、様々な用途に対応できるようにしています。

このように、既存のコードLLMの限界を超え、より使いやすく高性能なモデルを作ることが、本研究の出発点となっています。実際の開発現場での活用を強く意識し、コードアシスタントやプログラム関連のツールとして実用的なモデルを目指していることが特徴です。

以下で本モデルの構造やいかに優れているかといった実験結果をまとめて紹介します。

プレミアム会員限定コンテンツです

無料会員でもできること

一部記事の閲覧
研究紹介短信ライブラリの基本機能

プレミアム会員の特典

全過去記事の無制限閲覧
専門家による最新リサーチ結果を記事で購読（平日毎日更新）
日本語検索対応の新着AI論文データベース
研究紹介短信ライブラリの高度な機能を開放
記事内容質問AIを使用可能に

まずはアカウントを作成

ログイン

プレミアム会員について

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

オープンソースのコード生成LLMが商用LLMに追いつく　Qwen2.5-Coderの能力値全容

背景

💬 プレミアム会員ディスカッション

記事検索

関連記事

🔒 LLMエージェント開発の実態　主要10フレームワークの課題と選び方

🔒 SkinGPT：大規模言語モデルがビジョンベースで診断を下す皮膚科ツール　概要から仕組みまで

🔒 AIが見た目に対する物理的感覚を獲得。「変形しにくい容器はどっち？」などに正確に回答

🔒 LLMの均質な回答が良いか悪いかはタスクで決まる

🔒 LLMエージェントは同調圧力に弱く考えに固執する傾向があるため、ディベートでバイアスを和らげるのが重要との報告。導入ツールも公開

🔒 LLMの検索結果をさらに正確にする手法『CRAG』（Corrective Retrieval Augmented Generation：修正型の検索拡張生成）

背景

💬 プレミアム会員ディスカッション

記事検索

関連記事

🔒 LLMエージェント開発の実態 主要10フレームワークの課題と選び方

🔒 SkinGPT：大規模言語モデルがビジョンベースで診断を下す皮膚科ツール 概要から仕組みまで

🔒 AIが見た目に対する物理的感覚を獲得。「変形しにくい容器はどっち？」などに正確に回答

🔒 LLMの均質な回答が良いか悪いかはタスクで決まる

🔒 LLMエージェントは同調圧力に弱く考えに固執する傾向があるため、ディベートでバイアスを和らげるのが重要との報告。導入ツールも公開

🔒 LLMの検索結果をさらに正確にする手法『CRAG』（Corrective Retrieval Augmented Generation：修正型の検索拡張生成）

🔒 LLMエージェント開発の実態　主要10フレームワークの課題と選び方

🔒 SkinGPT：大規模言語モデルがビジョンベースで診断を下す皮膚科ツール　概要から仕組みまで