医療とAIのニュース医療におけるAI活用事例最新医療AI研究Diffusionモデルを用いた「新規タンパク質の創製」

Diffusionモデルを用いた「新規タンパク質の創製」

カナダ・トロント大学の研究者らは、「DALL-E」や「Midjourney」などの著名な画像生成プラットフォームの根幹にある深層学習技術「Diffusionモデル」を用いて、自然界に存在しないタンパク質を作成できるAIシステムを開発した。

生成モデルとしては敵対的生成ネットワーク(Generative Adversarial Network: GAN)が広く知られているが、与えられたシグナルから徐々にノイズを取り除くDiffusionモデルは、その登場以降、次世代生成モデルとして大きな注目を集めている。複雑なデータ分布でも学習でき、またその分布を解析的に評価できることが特徴となる。高精度な画像生成は、GANによるSOTAモデルを上回る高い精度を達成している。

Nature Computational Scienceに掲載された研究論文によると、チームが開発したシステムは、画像表現から学習を進め、非常に高い確率で完全に新しいタンパク質を生成することができる。タンパク質はアミノ酸の鎖からできており、これが3次元に折り畳まれることで、タンパク質の機能を決定している。この形は何十億年もの時をかけて進化し、多様性と複雑性を獲得している反面、数自体は限られている。既存タンパク質がどのように折り畳まれるかを理解することで、研究者らは自然界に存在しない折り畳みパターンを設計できるようになったとする。

ProteinSGMと呼ばれるこの新しいシステムは、既存タンパク質の構造を正確にコード化した画像表現の大規模データセットに基づく。これらの画像をdiffusionモデルに入力すると、各画像が全てノイズになるまで徐々にノイズが追加されていく。このモデルは、画像がどのようにノイズになったかを追跡し、そのプロセスを逆に実行することで、ランダムなピクセルを「完全な新規タンパク質」に対応する明確な画像に変換する方法を学ぶことができる。

ProteinSGMは新規治療薬開発に大きな役割を果たす可能性があり、チームと研究開発の動向に関心が集まっている。

参照論文:

Score-based generative modeling for de novo protein design

関連記事:

  1. 「AIによって設計したCOVID-19治療薬」が臨床試験へ
  2. 機械学習により「禁煙に有効な既存薬」を特定
  3. AI創薬の支援プラットフォーム

TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。
The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。

1. 岡本 将輝
信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員教授など。専門はメディカルデータサイエンス。

2. 杉野 智啓
防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事