英オックスフォード大学とIBMなどの研究チームは、COVID-19の原因ウイルスであるSARS-CoV-2のウイルスタンパク質を標的とする新規分子を設計できる生成AIモデルを開発した。研究成果はこのほど、Science Advancesから公開されている。
チームのモデルである「Controlled Generation of Molecules(CogMol)」は、変分オートエンコーダ(VAE)と呼ばれるアーキテクチャーに基づいて構築された。生成AIに分類される同モデルは、タンパク質とその結合方法に関する一般的な情報に加え、文字列として表現された分子の大規模なデータセットでトレーニングされている。興味深いのは、モデルが「これまでに遭遇したことのない分子設計タスク」に展開できるようにするため、研究者らは意図的にSARS-CoV-2に関する情報をデータセットから除外している点だ。
CogMolは3日間で87万5000個の分子候補を生成した。次にこれらの候補を複数の予測モデルにかけて分子の数を絞り込み、それらを合成するのに必要な成分を決定した。さらにそこからターゲット毎に100の分子を選び、化学者たちは各ターゲットから最も製造しやすい4つの分子を選んでいる。そしてこれらの分子を化合物に合成し、標的阻害試験と生きたウイルスでの中和試験で検証を行った。このうち2つは主要なプロテアーゼを標的とし、もう2つはスパイクタンパク質を標的とした。後者の化合物は6つの主要なCOVID-19変異体全てを中和できることが証明されている。
このアプローチはCOVID-19に限定されないため、将来的に発生し得る新しいウイルスの脅威などに対して、抗ウイルス薬や緊急に必要とされる化合物を、迅速かつ安価に生成できる可能性があり、現在大きな注目を集めている。
参照論文:
Accelerating drug target inhibitor discovery with a deep generative foundation model
関連記事: