医療におけるLLMの現状をまとめた報告原則、タスク、アプリケーションそして課題

医療におけるLLMの現状をまとめた報告　原則、タスク、アプリケーションそして課題

オックスフォード大学などの研究者らは、LLMは医療への応用にも注目されており、実用性を考えた調査が必要だと考えました。そこで、原則やタスクなど網羅的に整理しています。

本記事は、報告を詳しく読んでいきます。

参照論文情報

タイトル：A Survey of Large Language Models in Medicine: Principles Applications and Challenges

著者：Hongjian Zhou et al.（多数）

所属：オックスフォード大学、インペリアル・カレッジ・ロンドン、ウォータールー大学、他多数

URL：https://doi.org/10.48550/arXiv.2311.05112

GitHub：https://github.com/AI-in-Health/MedLLMsPracticalGuide

研究背景の整理

医療LLMの実用化への挑戦と課題

ここ最近でPaLM、LLaMA、GPTシリーズ、ChatGLMなどさまざまな大規模言語モデル（LLM）が登場し、テキスト生成や要約、質問応答といった自然言語処理（NLP）タスクを非常に高精度にこなしています。

そして当然の流れとして医療分野でのLLMの開発と応用に対する関心も高まっています。医師のサポートや患者のケアにどのように使えるのかが注目されています。

医療でのLLM応用においてよく話題にされるのは言語処理タスクですが、臨床での実用性は見落とされがちです。
最近は、電子健康記録（EHR）、退院概要の生成、健康教育、ケア計画などを扱う研究も増えています（しかし、評価は主にケーススタディに限られており、データセットの欠如が問題視されています）。

さらに、タスクは医療質問応答にフォーカスされがちで、文書要約や関係抽出、情報検索、テキスト生成といったタスクにはあまり注目されていません。

研究の目的と動機

上記のような背景から、研究者らは、医療分野におけるLLMの開発と応用に関する網羅的な調査報告を行うことにしました。

調査では、既存の医療LLM、様々なタスク、臨床応用などを総合的に取り上げています。

下記の概要図は、本調査で参照された文献などをわかりやすく整理したものです。医療領域でLLMを適用する際の研究データや方法論を視覚的に示しています。

医療分野におけるLLMの原則

研究者らはまず、医療におけるLLMの原則を以下のようにまとめています。

事前学習（プリトレーニング）

医療関連テキストの大規模なコーパスを使ってLLMをトレーニングするプロセスです。例えば、PubMedBERTはPubMedで、ClinicalBERTはMIMIC-IIIで事前学習されており、BlueBERTは両方のコーパスを利用し、BioBERTはPubMedとPMCで事前学習されています。

コーパスの内容例：

電子健康記録（EHR）

臨床ノート

DNA配列

医学文献

事前学習の目的は、医療ドメインに特化したモデリング、予測などを行うことです。

下の表は、一般ドメインの大規模言語モデルとそのトレーニングに使用されるデータセットの例を示しています。

ファインチューニング

既存のLLMを医療データで微調整（ファインチューニング）することでドメイン特有の医療知識を学ばせ、医療LLMを構築する方法が提案されています。

一般的な微調整方法には、監督された微調整（SFT）、命令型微調整（IFT）、低ランク適応（LoRA）、プレフィックスチューニングが含まれます。医療においては高品質な医療コーパスで行われるSFTや、様々な指示に従う能力を強化するためにLLMをトレーニングするIFTなどが行われています。

下の表は、推論タスクにおける微調整モデルと一般LLMのパフォーマンス（F1スコア）を比較したものです。

プロンプティング

モデルのパラメータをトレーニングせずにLLMを効率的に医療ドメインに合わせる方法として、プロンプティングもあります。

プロンプティングの種類例：

フューショットプロンプティング

CoTプロンプティング

自己整合性プロンプティング

プロンプトチューニング

プロンプトによるLLMの調整は、他の手法と比較して最小限の計算コストでの効果的なアライメントを可能にします。

下の表は、事前学習、ファインチューニング、プロンプティングそれぞれの実験事例をまとめたものです。

医療分野におけるLLMのタスク

医療分野におけるLLMのタスクは主に次の二つのカテゴリーに分類されて探求されています：

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。

※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
 プレミアム会員（記事の購読）について

■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。

ハーバード研究者などがLLMを創造的にすべく考案した、大喜利データセットでユーモアラスにチューニングする手法『LCoT』

Appleが、LLMのパラメータを「SSDなどの外部フラッシュメモリに保存し」PCで効率的にモデルを使用する手法を開発　

SNSでも発信中

企業と働き手を繋ぐマッチングサービスはこちらから

AIDBとは

AIDBは、論文などの文献に基づいてAIの科学技術や市場にキャッチアップするためのサービスです。個人の研究や仕事探し、法人の調査や採用を支援します。2019年から運営しています。

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録

医療におけるLLMの現状をまとめた報告 原則、タスク、アプリケーションそして課題