GPT・Claude・GeminiなどLLM12種で投資の銘柄選定能力を検証 S&P500全11セクターで 好成績の条件とは

深堀り解説

本記事では、「主要なLLMに株式投資の銘柄選定を任せた場合、どの程度の判断力を発揮するのか」を検証した事例を紹介します。

ChatGPTやClaudeなどのLLMは、すでに多くの業務で活用されています。では、「この株を買うべきかどうか」といった投資判断までAIに任せることは可能なのでしょうか。もし可能だとすれば、それはどのような条件や状況に限られるのでしょうか。

背景

ChatGPTの登場以降、LLMは様々な業界で活用が進んでいます。金融も例外ではありません。ニュースや決算報告から市場のムードを読み取るセンチメント分析や、投資戦略の立案支援など、LLMの可能性が探られています。

しかし、LLMを投資判断に使うにはいくつかの懸念があります。まず、LLMは学習データの質に大きく左右されます。また、なぜその回答に至ったのかが分かりにくい「ブラックボックス」の性質も問題視されています。さらに、同じ質問をしても毎回異なる回答が返ってくることがあり、一貫性の面でも不安が残ります。

こうした課題がある一方で、LLMにポートフォリオ構築を任せる試みはすでに始まっています。以前の研究では、GPT-4(すでに過去の存在になりましたが)にS&P500から銘柄を選ばせ、実際のインデックスと比較する実験が行われました。結果は意外にも悪くなかったといいます。

では、GPT以外のモデルではどうなのでしょうか。ClaudeやGeminiなど、異なる設計思想を持つモデルを同じ条件で比較したら、何が見えてくるのでしょうか。

本記事では、12種類のLLMにS&P500の全11セクターで銘柄選定を行わせ、その実力を検証した研究を詳しく見ていきます。12種類のモデルを同一条件で比較した結果からは、AIによる投資判断に関して、いくつかの興味深い傾向が見えてきます。

プレミアム会員限定コンテンツです

閲覧には、アカウント作成後の決済が必要です。

  • 全記事・論文コンテンツを無制限で閲覧可能
  • 平日毎日更新、専門家による最新リサーチを配信

関連記事