次回の更新記事:AIエージェントのスキル文章はスリムにした方が賢く…(公開予定日:2026年04月10日)
AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

AI研究のプレプリントはarXiv以外でも出てきている。分野別サーバーの歩き方

ニュース

AI研究を追いかけるとき、arXivは欠かせない存在です。しかし、生物学のbioRxiv、医学のmedRxiv、化学のchemRxiv、社会科学のSSRNなど、分野ごとに大きなプレプリントサーバーが存在し、それぞれにAI関連の研究が日々蓄積されています。本記事では主要なプレプリントサーバーを分野別に整理し、リンク付きで一通り紹介します。

プレプリントサーバーとは何をする場所か

プレプリントサーバーは、査読前の論文原稿を著者自身が公開する場所です。学術誌に投稿する前、あるいは投稿と並行して、研究成果を世界に向けて先出しできる仕組みになっています。査読を経ていないので品質保証の意味合いは弱いものの、その分スピードが速く、議論のたたき台として機能します。

研究者にとっての利点はいくつかあります。優先権の確保、早期のフィードバック獲得、共同研究のきっかけ作り、そして何より、査読プロセスに何ヶ月もかけている間に分野が先に進んでしまうのを防げることです。読み手の側にとっても、最前線の議論にほぼリアルタイムで触れられる窓口になります。

ここで押さえておきたいのは、プレプリントサーバーは分野ごとにカルチャーが大きく異なるという点です。投稿の活発さ、扱う話題の傾向、コミュニティの読み方、すべてが場所によって違います。そのため、複数のサーバーを横断する視点を持つ必要があります。

arXiv(物理・数学・計算機科学)という原点

最初に触れるべきはやはり arXiv です。1991年に物理学者のポール・ギンスパーグが立ち上げ、当初は高エネルギー物理学のためのメーリングリストに近いものでした。それが数学、計算機科学、統計学、定量生物学、定量金融、電気工学へと拡張され、現在では数百万本の論文がホストされています。

AI研究者にとってのarXivは、もはやインフラそのものです。トップ会議に通った論文の多くは、採択前後に cs.LGcs.CLcs.CV といったカテゴリに姿を現します。最新の手法を追いかけたければ、毎朝の新着リストを眺めるのが基本動作になっている方も少なくありません。

ただし、arXivの中でも見落としがちなページもあります。q-bio(定量生物学)や q-fin(定量金融)、stat(統計学)などのカテゴリには、AI手法を別分野に応用する論文が静かに蓄積されています。cs配下だけを追っていると、こうした越境的な仕事に気づかないまま終わってしまうことがあります。

bioRxiv(生物学)

生物学の代表的なプレプリントサーバーとして知られるのが bioRxiv です。2013年にコールド・スプリング・ハーバー研究所が立ち上げました。当初は懐疑的な空気もあったと聞きますが、今では生命科学のあらゆるサブ分野で広く使われています。

ここでAIの話につながる例を挙げると、タンパク質構造予測、ゲノム解析、単一細胞トランスクリプトーム解析、創薬スクリーニングといったテーマでは、深層学習を主要な道具として使う論文が日常的に投稿されています。AlphaFoldの登場以降、構造生物学と機械学習の境界はほとんど消えかかっており、その動向を一次情報で追いたいなら、外せない巡回先になります。

cs.LGの新着だけを眺めていると、こうした応用論文の存在感を過小評価しがちです。手法の新規性そのものよりも、生物学的な発見にウェイトを置いた論文は、計算機科学者向けの場所には置かれにくい。そのため、本当に面白い応用事例が生物学側に静かに溜まっていく構造になっています。

medRxiv(医学・公衆衛生)

臨床研究を扱うプレプリントサーバーが medRxiv です。bioRxivの兄弟プロジェクトとして2019年に開設され、臨床研究、公衆衛生、医療政策などを扱う場所になっています。新しいだけあってまだ規模はbioRxivほどではありませんが、コロナ禍を経て一気に存在感を増しました。

医療分野でのAI応用は、画像診断、電子カルテ解析、臨床意思決定支援、医療対話システムなど多岐にわたります。これらの研究の多くは、最終的に医学系の学術誌を目指すため、プレプリントとしては医学側のサーバーに置かれます。AI寄りの会議論文として整理されたものとは別ルートで、臨床現場に近い議論が動いています。

最近はLLMの医療応用が急速に増えており、その種の論文も頻繁に目にするようになりました。技術的な新しさよりも、特定の臨床タスクでの性能評価や、安全性、運用上の課題に踏み込んだ内容が中心です。実装に近い視点を得たいときに参考になります。

chemRxiv(化学・材料)

化学分野の中心的なプレプリントサーバーが chemRxiv です。2017年にアメリカ化学会を中心とした複数の化学系学会が共同で立ち上げました。有機化学、無機化学、計算化学、材料科学、分析化学など、化学のほぼ全領域をカバーしています。

機械学習と化学の接点は、ここ数年で爆発的に広がりました。分子物性予測、反応経路探索、逆合成解析、材料設計、自律実験ロボットなど、AIが研究プロセスそのものに組み込まれつつあります。グラフニューラルネットワークや拡散モデルを使った分子生成の論文が上がってくる頻度は、想像以上に高いはずです。

化学者コミュニティが書く機械学習論文は、計算機科学者が書くものとは少し風合いが違います。ベンチマーク上の最高精度よりも、実験で再現できるか、化学的に意味のある説明ができるかといった観点が重視されます。AI手法の良し悪しを別の角度から眺める材料として、こうした論文群はやはり刺激になります。また化学分野では、実験のオートメーションもホットな話題で、AIが役立つ場面も多いです。

SSRN(社会科学・経済・法学)

社会科学全般を扱う論文リポジトリが SSRN(Social Science Research Network)です。1994年に設立され、経済学、金融、法学、経営学、会計学、政治学などを広くカバーしており、現在はエルゼビアの傘下にあります。プレプリントだけでなくワーキングペーパーや作業中の原稿も多く流通しているのが特徴です。

経済学者によるAIの経済影響分析、労働市場へのインパクト研究、生成AIと生産性に関する実証研究などは、多くがここを経由して世に出ます。法学者によるAI規制やアルゴリズム責任論、経営学者によるAI導入の組織研究なども同様です。技術の中身ではなく、社会への影響や制度設計を扱う議論は、こちらに集まる傾向があります。

AI研究者がのぞくメリットは、自分の研究がどう受け止められ、どう測定され、どう批判されているかを知れる点にあります。社会科学者は時として、技術者が見落としがちな前提や副作用を鋭く突いてきます。耳の痛い指摘も含めて、視野を広げる材料として使い道のある場所です。

PsyArXiv(心理学)、EdArXiv(教育学)

心理学には PsyArXiv があります。Open Science Frameworkの上に構築されており、再現性危機を経験した心理学コミュニティの透明性志向と相性のよいプラットフォームです。認知心理学、社会心理学、実験心理学、計算論的精神医学などが扱われます。

人間とLLMの比較研究、AIとの対話が人の判断や情動に与える影響、AIアシスタントの長期使用がもたらす行動変容といったテーマは、心理学者の手によって投稿されることが増えています。ヒューマンAIインタラクションを研究しているなら、見ない手はありません。

教育分野には EdArXiv があり、こちらも近年は生成AIの教育利用に関する研究で賑わっています。学習効果、不正防止、教員の働き方、学習者のメタ認知への影響など、現場感のある議論が読めます。

その他、目を配っておきたい場所

地球科学には EarthArXiv、工学には engrXiv、多分野横断型ではフランス発の HAL という選択肢があります。HALはヨーロッパ系の研究者の論文が早く出てくる場所として知っておく価値があります。中国系の研究を追うなら ChinaXiv もチェックの候補です。

プレプリントサーバーそのものではないものの、Semantic ScholarOpenReview のようなメタ的な情報源と組み合わせると、抜け漏れがぐっと減ります。とくに査読プロセスが公開される OpenReview では、ICLRやNeurIPSの議論の生々しい様子を観察できます。

横断する視点をどう保つか

ここまでで分かるとおり、プレプリントサーバーはざっと挙げるだけでも十を超えます。すべてを毎日チェックするのは現実的ではありません。とはいえ、自分の主戦場の外で何が起きているかを完全に無視するのも惜しい。折衷案として、いくつか実用的なやり方を挙げておきます。

ひとつは、キーワードベースのアラート設定です。Google Scholar や Semantic Scholar のアラート機能を使えば、複数のサーバーをまたいで新着論文を拾えます。自分の関心領域の用語と、AI関連の用語を組み合わせておくと、越境的な論文が浮かび上がってきます。

もうひとつは、信頼できる人のフォローです。各分野には、新着論文を丁寧に紹介してくれる研究者がSNS上に必ずいます。その人たちのタイムラインは、人力でキュレーションされた高品質なフィードとして機能します。自分が手薄な分野ほど、こうした道案内の価値が高くなります。

そして月に一度くらいは、普段見ない場所をあえて覗く時間を取る。生物学、医学、化学のサーバーを30分ずつでも眺めてみると、自分が知らなかった応用事例や、別の角度からの問題設定に出会えます。視野が狭まっていることに気づくきっかけとして、地味ながら役に立ちます。

もちろん、AIDBのXをフォローしたり、サイトに会員登録することで、興味深い論文情報が自ら飛び込んでくる体験を得ることもできます。

まとめ 主要プレプリントサーバー早見表

最後に、本記事で紹介した主要なプレプリントサーバーをもう一度まとめておきます。

  • arXiv(物理・数学・計算機科学・統計)
  • bioRxiv(生物学・生命科学)
  • medRxiv(医学・臨床・公衆衛生)
  • chemRxiv(化学・材料科学)
  • SSRN(経済学・法学・経営学などの社会科学)
  • PsyArXiv(心理学)
  • EdArXiv(教育学)
  • EarthArXiv(地球科学)
  • engrXiv(工学)
  • HAL(多分野・欧州中心)
  • ChinaXiv(多分野・中国)
  • OpenReview(査読プロセス公開・主要AI会議)
  • Semantic Scholar(横断検索・アラート)

おわりに

AI研究はもはや、計算機科学の一カテゴリに収まる規模ではなくなりました。生物学者も、医師も、化学者も、経済学者も、心理学者も、それぞれの言語と関心でAIを使い、AIについて書いています。その議論の入り口は、必ずしもarXivの上にあるとは限りません。

自分の知っている地図の外側に、別の地図が広がっている。しかもその地図の上で、自分の関心と地続きの議論が日々進行している。この感覚を持てるかどうかで、研究の解像度はずいぶん変わってきます。今日の終わりに、まだブックマークしていないプレプリントサーバーを一つだけ開いてみてはいかがでしょうか。

本記事の関連研究

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

記事検索

年/月/日
年/月/日

こちらもどうぞ