本記事では、「主要なLLMに株式投資の銘柄選定を任せた場合、どの程度の判断力を発揮するのか」を検証した事例を紹介します。
ChatGPTやClaudeなどのLLMは、すでに多くの業務で活用されています。では、「この株を買うべきかどうか」といった投資判断までAIに任せることは可能なのでしょうか。もし可能だとすれば、それはどのような条件や状況に限られるのでしょうか。

背景
ChatGPTの登場以降、LLMは様々な業界で活用が進んでいます。金融も例外ではありません。ニュースや決算報告から市場のムードを読み取るセンチメント分析や、投資戦略の立案支援など、LLMの可能性が探られています。
しかし、LLMを投資判断に使うにはいくつかの懸念があります。まず、LLMは学習データの質に大きく左右されます。また、なぜその回答に至ったのかが分かりにくい「ブラックボックス」の性質も問題視されています。さらに、同じ質問をしても毎回異なる回答が返ってくることがあり、一貫性の面でも不安が残ります。
こうした課題がある一方で、LLMにポートフォリオ構築を任せる試みはすでに始まっています。以前の研究では、GPT-4(すでに過去の存在になりましたが)にS&P500から銘柄を選ばせ、実際のインデックスと比較する実験が行われました。結果は意外にも悪くなかったといいます。
では、GPT以外のモデルではどうなのでしょうか。ClaudeやGeminiなど、異なる設計思想を持つモデルを同じ条件で比較したら、何が見えてくるのでしょうか。
本記事では、12種類のLLMにS&P500の全11セクターで銘柄選定を行わせ、その実力を検証した研究を詳しく見ていきます。12種類のモデルを同一条件で比較した結果からは、AIによる投資判断に関して、いくつかの興味深い傾向が見えてきます。