
AIに論文を読ませて、有望なものを選ばせたい。研究者だけでなく、技術投資の判断材料を集めたい人にとっても、社内のナレッジ整備を進めたい人にとっても、自然なニーズです。
ただ、その評価が本当に当たっているのかを確かめるのは簡単ではありません。研究の良し悪しは数年経たないと見えてこないからです。そこで過去の論文を「まだ評価が定まっていない新作」として扱い、AIの採点とその後の現実を突き合わせる実験が行われました。
AIの採点はどこまで信用できるのか。任せる前に何を見ておくべきなのか。

AIに論文を読ませて、有望なものを選ばせたい。研究者だけでなく、技術投資の判断材料を集めたい人にとっても、社内のナレッジ整備を進めたい人にとっても、自然なニーズです。
ただ、その評価が本当に当たっているのかを確かめるのは簡単ではありません。研究の良し悪しは数年経たないと見えてこないからです。そこで過去の論文を「まだ評価が定まっていない新作」として扱い、AIの採点とその後の現実を突き合わせる実験が行われました。
AIの採点はどこまで信用できるのか。任せる前に何を見ておくべきなのか。