拡散モデルで自然言語から高精度コード生成「CODEFUSION」

2023.10.31

コード生成（プログラム生成、ソフトウェア開発支援、バグ修正）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

自然言語の指示でコードを生成し、後から柔軟に修正できるツール『CODEFUSION』が登場しました。

拡散モデルとエンコーダの組み合わせといった初めての試みで、少ない計算リソースで高品質なコードが作れることが検証されました。

Microsoftの研究者らによる開発です。

@ Mukul Singh et al., “CodeFusion: A Pre-trained Diffusion Model for Code Generation”

GPT-4など自然言語からコードを生成する既存モデルには、以下のような課題があります。
1. 一度生成したコードを修正することが難しい
2. 高品質なコード生成には、多くの計算リソースが必要
3. 特定のタスクにしか適用できないモデルが多い

そこで研究者らは、全く新しいプローチで開発したフレームワーク『CODEFUSION』で解決を図っています。

■『CODEFUSION』の仕組み
以下3つの要素から構成されています。
① エンコーダ:
自然言語の指示をコンピュータが理解できる形に変換
② デノイザー（拡散モデル）:
エンコーダからの情報を使って、ノイズを除去
③ デコーダ:
ノイズが除去された情報から、最終的なコードを生成

■『CODEFUSION』ができることの具体例
① Python：
・データ分析スクリプトの生成
・ウェブスクレイピング
・API呼び出し
・機械学習モデルの設計
など
② Bash：
・シェルスクリプトの生成
・ファイル操作
・システム管理タスク
・自動化スクリプト
など
③ Microsoft Excel：
・条件付き書式ルールの生成
・マクロの作成
・複雑な数式や関数の設定
など

■性能評価結果
以下のような実験が行われました。
① Python、Bash、Microsoft Excelの条件付き書式ルールに対する自然言語からコードへの変換タスクで評価
② 既存のベンチマークデータセットを使用
その結果、既存モデルを上回る性能が確認されました。

■主な結論
① 本モデルは非常に高い精度でコード生成ができる
② 拡散モデルを使用しているためコードの改変が柔軟
③ 計算効率が高い
④ 多様なプログラミングタスクに対応

■注意点
① 訓練データの質や量が性能に大きく影響する
② 高い性能を発揮するためには、それなりの計算リソース（CPU、GPUなど）が必要な場合がある
③ 非常に複雑なプログラミングタスクに対する性能は、独自の評価が必要
④ 生成されたコードの背後にあるロジックが常に明確でない場合がある

📄 参照論文

論文情報と関連研究

📎 論文を読む（arxiv.org）

X（Twitter）で見る

拡散モデルで自然言語から高精度コード生成「CODEFUSION」

📄 参照論文

こちらもどうぞ

🔒 DeepSeek-R1の性能を検証　4つの主要LLMと比較

🔒 プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案

📄 参照論文

こちらもどうぞ

🔒 DeepSeek-R1の性能を検証 4つの主要LLMと比較

🔒 プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案

🔒 DeepSeek-R1の性能を検証　4つの主要LLMと比較