LLMに、1,200本以上の論文から抽出した問題文だけを見せて「あなたならどう解決しますか」と尋ねる実験が実施されました。
その結果、LLMは科学的に妥当で、しかも人間の提案と異なる有効な解を出せる場合があることが示されました。
記憶の再生だけではなく、新しい発想が生まれる可能性がうかがえます。
とくにGPT-OSS-120Bを内部モデルに用いた構成では、約4回に3回の割合で筋の通った解を出せました(厳格基準)。
また、学会での評価の高低が違ってもLLMのアイデア成功率は大きく変わらず、この現象の理由は明確ではありません。
📄 参照論文
AInstein: Assessing the Feasibility of AI-Generated Approaches to Research Problems
所属: Mila – Quebec AI Institute, HEC Montréal, ServiceNow Research