本記事では、コード品質とAIツールの性能の関係を調べた研究を紹介します。
いまソフトウェア開発の現場では、AIコーディングアシスタントの導入が一気に広がっています。ただし、こうしたツールは、どんなコードに対しても同じように力を発揮できるわけではなさそうです。
これまで長いあいだ、ソースコードは人間が読みやすいように書くべきだと言われてきました。では、AIが当たり前にコードを編集する時代において、人間のために整えられたコードはAIにとっても扱いやすいのでしょうか。反対に、人間とAIでは読みやすさの基準がずれている可能性もあります。
この疑問に対して、少し変わった切り口から答えを探った事例があります。

背景
ソフトウェア開発の世界には、昔から語り継がれてきた言葉があります。「プログラムは人間が読むために書くものだ。機械が実行できるのは、たまたまその結果にすぎない」という考え方です。つまり、コードは動作するだけでは足りません。あとから別の開発者が読んでも理解できるように書くことが大切だ、という前提があります。
ただ、AIコーディングアシスタントが広く使われるようになった今、コードを読むのは人間だけではなくなりました。AIもコードを読み取り、意図をつかみ、修正や提案を行う場面が増えています。ある調査では、2025年の時点ですでに開発者の約80%が業務でAIツールを使っていて、2028年には90%に達すると見込まれています。
こうした状況の中で、業界では興味深い見方が注目されています。AIコーディングツールは、品質の高いコードほど良い結果を出しやすい、という話です。特に、適切に分割され、整理されたコードでは、AIが見当違いの内容を出す、いわゆるハルシネーションのリスクが下がり、提案の精度が上がると言われています。
一方で、現場のコードベースには悩ましい問題もあります。技術的負債、つまり品質の低下や設計上の妥協を、仕組みとして管理できている組織は10%未満だという報告があります。加えて、開発者が低品質なコードの対応に使っている時間は、最大で42%に及ぶというデータもあります。
もしAIツールの性能がコード品質に大きく左右されるなら、多くのコードベースは、AIの効果を十分に引き出せる状態にない可能性があります。
そこで本記事では、コード品質とAIの性能の関係を数値で確かめた研究を、丁寧に追いかけていきます。