「GPT-5」が眼科の医学問題をどれくらい正確に解けるかを260問の専門問題を使ってテストしたところ、「GPT-5-high」は正答率96.5%を記録しました。
なお、同じ問題を2年前のGPT-3.5に解かせると55.8%、GPT-4でも75.8%でした。LLMの医学知識は急速に向上していることが分かります。
ただし、高性能なモデルほど使用料金も高くなるため、日常的な用途に向いているかもしれないのはコストが安く性能も高い「GPT-5-mini-low」だと示唆されています。
総じてAIが医療分野でますます実用的になってきており、将来的には診断のサポートや医学教育に活用される可能性が高まっています。
ただし、あくまで補助ツールとしての役割が期待されています。
📄 参照論文
Performance of GPT-5 Frontier Models in Ophthalmology Question Answering
所属: Cole Eye Institute, Cleveland Clinic, Department of Ophthalmology University of Montreal