LLMで化学分子発見サイクルを劇的加速

2023.09.29

科学（科学研究支援、化学、生物学、タンパク質）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMで市場価値のある”化学分子”発見サイクルを加速するフレームワークが開発されました。
新市場の開発に最大で10年、最大で30億ドルかかる産業への挑戦です。

IBMの研究者らによる発表です。

○ Nikita Janakarajan et al., “Language models in molecular discovery”

市場価値のある化学分子の発見には高い失敗率が問題とされており、伝統的なアプローチには限界があると考えられています。

そこで研究者らはLLMを用いて高速な仮説生成＆検証のループを設計しました。

■フレームワーク概要
① 従来の「設計-作成-テスト-分析（DMTA）」サイクルに加えることができる
② “設計”フェーズの生成モデルが強化され、有望な仮説だけが進行するようになる

■有効性を裏付けるデータ
以下モデルの性能が有効たらしめています。
① “Multitask Text and Chemistry T5″モデル：
新分子を生成するタスクで、ChatGPTとGalacticaを凌駕する性能を示している
② “Molecular Transformer（MT）”モデル：
化学反応の結果を予測するタスクで優れた性能を発揮している
③ “MolBERT”と”ChemBERTA”モデル：
BERTのバックボーンを使用して、分子の埋め込みを学習し、化学的性質を予測するタスクで優れている

■将来の展望
① チャット形式のインタフェース：
デザインアイデアの生成と反復的な改善、合成計画、材料の購入、定期的な安全チェック、実験の検証などをできるようになる
② RLHFの導入：
人間がモデルにフィードバックを提供することで、モデルの最適化が助けられる

📄 参照論文

Language models in molecular discovery

著者: 著者：Nikita Janakarajan, Tim Erdmann, Sarath Swaminathan, Teodoro Laino, Jannis Born

📎 論文を読む（arxiv.org）

X（Twitter）で見る

LLMで化学分子発見サイクルを劇的加速

📄 参照論文

こちらもどうぞ

🔒 推論時のトークン数を80%以上削減しながら出力精度を保つプロンプト手法の新提案

🔒 今週の注目AI論文リスト（論文公開日2026/6/14～6/20）