AIに医療的な相談を日常的にしている人が既にかなり多くいる中、ハーバード大学とMITの研究者らが「AIに診断をさせるときは”異なる会社の”モデル同士で多数決させる方法が極めて有効」と報告しています。
実際に、OpenAI・Google・Anthropicの最新モデルを組み合わせ、 希少疾患498症例と複雑な臨床症例165症例で検証。異種モデル混合チームは、 単体で弱いメンバーが含まれていても総合力で勝り、どのモデルが単体で見逃していた正解も「救済」する効果が確認されています。
難しいケースほど異種モデル混合チームにする意味が大きく、おもしろいことに各モデルの正解パターンがバラバラであるほど混合の恩恵は増すそうです。
反対に、同じ会社のモデルは似たような思考の癖 を持っているため、議論しても互いの盲点を補えず、むしろ間違いを強め合ってしまう。
もっとも、多数決の弊害として「正しい少数意見が間違った多数派に飲み込まれる」リスクも残っており、”少数派だが実は正しい”意見をどう保護するかが今後の課題として挙げられています。とはいえ基本的に異なるAIの「考え方の違い」を活かすことが、医療AIの信頼性を高めるための有望な設計原則であることが示されました。
今回の検証は医療に特化していますが、もしかしたら他の分野にも生かせる話かもしれないですね。