LLMで市場価値のある”化学分子”発見サイクルを加速するフレームワークが開発されました。
新市場の開発に最大で10年、最大で30億ドルかかる産業への挑戦です。
IBMの研究者らによる発表です。
○ Nikita Janakarajan et al., “Language models in molecular discovery”
市場価値のある化学分子の発見には高い失敗率が問題とされており、伝統的なアプローチには限界があると考えられています。
そこで研究者らはLLMを用いて高速な仮説生成&検証のループを設計しました。
■フレームワーク概要
① 従来の「設計-作成-テスト-分析(DMTA)」サイクルに加えることができる
② “設計”フェーズの生成モデルが強化され、有望な仮説だけが進行するようになる
■有効性を裏付けるデータ
以下モデルの性能が有効たらしめています。
① “Multitask Text and Chemistry T5″モデル:
新分子を生成するタスクで、ChatGPTとGalacticaを凌駕する性能を示している
② “Molecular Transformer(MT)”モデル:
化学反応の結果を予測するタスクで優れた性能を発揮している
③ “MolBERT”と”ChemBERTA”モデル:
BERTのバックボーンを使用して、分子の埋め込みを学習し、化学的性質を予測するタスクで優れている
■将来の展望
① チャット形式のインタフェース:
デザインアイデアの生成と反復的な改善、合成計画、材料の購入、定期的な安全チェック、実験の検証などをできるようになる
② RLHFの導入:
人間がモデルにフィードバックを提供することで、モデルの最適化が助けられる