次回の更新記事:企業実務タスクにおけるLLMエージェントの能力を評価…(公開予定日:2024年12月23日)

医療AIの性能を検証する大規模プロジェクト、MITやハーバード、マイクロソフトなど始動

   

「医療AIの性能を大規模で多様な患者集団で検証」する国際的プロジェクトを、MIT、ハーバード、スタンフォード、マイクロソフトなどの機関が共同で開始しました。

医療AIが急速に開発されている一方で、その評価は十分に行われていません。そこで、このプロジェクトでは、医療AIの性能を広範で定量的に評価する新たなプラットフォームMedPerfを開発しました。

このプラットフォームでは、参加する各医療施設に医療AIモデルが安全に配布され、それぞれの施設の独自のデータを用いてモデルが評価されます。

参照論文情報

【告知】AIDB HRの人材側登録者全員に対し、業界研究の手間を削減できるように「AI事業を行う企業リスト」を配布します。無料登録後すぐに閲覧とダウンロードが可能です。▼



関連研究

MedPerfの全体像

MedPerfは、医療AIモデルのベンチマーキングを目的とした革新的なオープンプラットフォームです。異なる施設に安全にモデルを配布し、効率的かつ人間監督のプロセスでAIモデルの性能を評価することを可能にします。プライバシーの保護を最優先にし、多くの国際機関との連携が進んでいます。

背景と課題

医療AIモデルの評価は、多様な臨床データを用いた大規模な検証が必要です。しかし、データの共有にはリスクとコストが伴い、セキュリティとプライバシーの問題が常に懸念されていました。この課題は、医療AIの進展を妨げる主要な障壁となっていました。

MedPerfの解決策

MedPerfは、データの共有ではなく、モデルの共有によって評価を行う連邦型の評価を提供します。このアプローチにより、データのプライバシーリスクを大幅に削減し、多様なデータでの評価を現実的にします。さらに、異なる施設間での協力を促進し、より広範な患者集団に対するモデルの効果を正確に測定することが可能になります。

MedPerf の概要図

連携と展開

MedPerfは、国際的な規模での連携を進めており、20以上の企業、学術機関、病院などと協力しています。この連携により、医療AIのベンチマークを共同設計、運用、維持する専門家のコミュニティが形成され、医療AIの標準化と普及が促進されています。

連携地の地理的分布





パイロット調査で使用されたデータソースの場所。

MedPerfの全体構造

MedPerfは、医療人工知能のためのオープンなベンチマーキングプラットフォームで、Federated Evaluationを使用しています。このプラットフォームの主要な構成要素は以下の通りです。

  1. MedPerfサーバー: バックエンドサーバーで、Djangoで実装されています。
  2. MedPerf CLI: サーバーと対話するためのコマンドラインインターフェイス。

アーキテクチャと使用方法

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について




■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP