次回の更新記事:ハルシネーションは「AIのせい」だけではなく「クエ…(公開予定日:2026年03月05日)
AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

「BloombergGPT」金融分野に特化した言語モデル登場 論文から解説

2023.04.01
深堀り解説

自然言語処理技術は、近年急速に発展しており、様々な分野での応用が期待されています。特に、金融分野では、大量のテキストデータを扱う必要があるため、自然言語処理技術の活用は重要になってきています。しかし、金融分野に特化した言語モデルはまだ少なく、高い性能を発揮するものも限られています。

そこでBloomberg社は、「BloombergGPT」という金融分野に特化した言語モデルを開発しました。BloombergGPTは、同社の広範なデータソースを基にトレーニングされた50億パラメーターの言語モデルであり、金融タスクで高い性能を発揮すると考えられています。本記事では、開発背景やトレーニング方法、評価結果などについて、論文を参照して紹介いたします。論文のURLや著者情報は記事下部にて記載しています。

参照論文情報

  • タイトル:BloombergGPT: A Large Language Model for Finance
  • 著者:Shijie Wu, Ozan Irsoy, Steven Lu, Vadim Dabravolski, Mark Dredze, Sebastian Gehrmann, Prabhanjan Kambadur, David Rosenberg, Gideon Mann
  • URL:10.48550/arXiv.2303.17564

関連研究

高精度な為替(FX)予測に機械学習でチャレンジ!〜ランダムウォークと比較〜

株価を最も正確に予測できるアルゴリズムは?比較してみた結果・・・

「銅」の価格予測を行うAI手法についての研究報告を解説

目次

BloombergGPTの開発背景

Bloomberg社は、金融市場のニュースや企業の財務諸表など、広範なデータソースを持っています。このデータソースを活用することで、金融分野に特化した言語モデルの開発が可能になりました。

金融領域における言語モデルの開発には、大規模なデータセットが必要です。しかし、一般的な企業では大規模なデータセットを持っていることは稀であり、Bloombergのような金融データ企業でなければ、このようなデータセットを構築することは困難です。

Bloombergは、自社が持つ金融市場のニュースや企業の財務諸表などを収集し、これらのテキストデータを整理して大規模なデータセットを構築しました。また、一般的な目的のデータセットからもトークンを追加することで、言語モデルをより幅広い分野に対応するよう調整しました。

BloombergGPTのトレーニングには、「Hugging Face」社が提供する「Transformers」ライブラリーが使用されました。また、「Hugging Face」社が提供する「Distributed Training」機能を使用し、複数のGPUを使用して高速かつ効率的にトレーニングすることが可能でした。

評価結果

BloombergGPTは、標準的なLLMベンチマーク、オープンな金融ベンチマーク、および内部ベンチマークで検証されました。これらのベンチマークにおいて、BloombergGPTは高い性能を発揮しました。特に金融タスクにおいては、BloombergGPTは他の言語モデルよりも優れた性能を発揮しました。具体的なタスクを以下に示します。

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

記事検索

年/月/日
年/月/日

関連記事