Googleやカーネギーメロン大学など16機関からの研究者チームがGeminiの強化版を使って科学的な新しい成果を得たと報告しています。
また、その上で「いずれ人間による科学の検証が追いつかなくなる」と懸念を表しています。
研究者らはGemini Deep Thinkの強化版を使ってさまざまな分野で実際に未解決だった数学的問題を解かせてみたら多くの本質的な成果を得たとのこと。
たとえば、
■10年近く信じられていた予想に対して、反例を自力で構成して反証
■暗号学のプレプリントに致命的な論理の穴を見つけた
■物理学の問題で式や検証コード案を出し、失敗を踏まえて修正案を重ねる
ただし、AIが万能だったわけでもないという点は注意。
■偽の予想を与えると、もっともらしい嘘で論理の飛躍を埋めようとする確証バイアスがあった
■論文のみを渡すだけだと「これは未解決問題だから解けない」と拒否することもある
■代数計算で符号を間違えるような凡ミスも起こす
AI(今回はGemini)は「疲れ知らずで博識で創造的な優秀な若手共同研究者」のような存在であり、人間の研究者が方向づけをし、出力を検証し、誤りを指摘するという「指揮者」の役割を担うことで初めて成果が出ると結論づけられています。
著者らはこの流れを「vibe-proving」と呼ぶそう。(prove=証明する)
そして、まもなくAIが論文生成を劇的に加速させる一方で、その正しさを検証する側の人間の査読制度が追いつかなくなると警告しています。
科学のボトルネックが「アイデアを出すこと」から「アイデアが正しいか確かめること」へと移りつつあり、査読システムの整備が必要だと考えているそうです。
📄 参照論文
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques
所属: Google Research, Carnegie Mellon University, Purdue University