仮想スクリーニングを機械学習で強化することにより、15.6億個の薬物候補分子の解析時間を10倍短縮することに成功した。これは、東フィンランド大学の研究者たちが産業界と協働し、スーパーコンピュータを利用して「世界最大級のバーチャル・ドラッグ・スクリーニング」を実施したもの。
新規の薬物分子を見つけるために研究者は、大規模な化合物ライブラリの高速コンピュータ支援スクリーニングに頼っている。このような有機低分子化合物のコレクションは、ここ数年で特に急激な増加をみている。ライブラリは、これを処理するために必要となるコンピュータの改良スピードよりも速く成長しているため、最新のスーパーコンピュータを使用した場合でも、たった1つの創薬標的に対して10億個規模の化合物ライブラリをスクリーニングすることになり、これは実に数ヶ月から数年かかることもある。
高速な解析アプローチは切実に求められているが。このほどJournal of Chemical Information and Modelingから公開された研究によると、チームはまず、スーパーコンピュータを利用し、約半年かけて15.6億個の候補分子のドッキングを評価している。これは、低分子をターゲットの結合領域に当てはめ、その適合度を表す「ドッキングスコア」を計算するもの。ここから、高速な解析を実現する「HASTEN」と呼ばれる機械学習ツールを構築した。
HASTENは機械学習を使って分子の特性を学び、その特性が化合物のスコアにどのように影響するかを学習する。従来のドッキングから引き出された十分な例が提示されると、機械学習モデルは、従来アプローチよりもはるかに速く、ライブラリ内の他の化合物のドッキング・スコアを予測することができる。実際、ライブラリ全体のわずか1%がドッキングされ、トレーニングデータとして使用されただけで、このツールは10日以内に90%のベストスコア化合物を正しく同定していた。
著者らは「機械学習をブーストしたツールは、従来のドッキングで同定されたトップスコア化合物の大部分を、大幅に短縮された時間枠の中で、確実かつ繰り返し再現する」と指摘しており、大幅な時間短縮を介した計算創薬分野の急激な発展を期待している。
参照論文:
関連記事: