研究者らは、「ゼロから人工酵素を生成」することができるAIシステムを構築した。実験室における検証では、人工的に生成したアミノ酸配列が既知の天然タンパク質と大きく乖離していても、これらの酵素の一部は自然界に存在するものと同等に機能したとしている。
Salesforce Researchが開発した「ProGen」と呼ばれるAIプログラムは、自然言語処理を応用した「新たなたんぱく質設計技術」を提唱している。ネクストトークン予測によりアミノ酸配列を人工タンパク質に組み立てる同技術は、元来同社の研究者が英語テキストを生成するために開発した自然言語処理モデルをベースとする。研究者らは、2億8千万種類のあらゆるタンパク質のアミノ酸配列をモデルに送り込み、2週間に渡って情報を消化させた後、5つのリゾチームファミリーにおける56,000の配列と、これらのタンパク質に関する情報を入力し、モデルの微調整を行った。
チームは「この新しい技術は、ノーベル賞を受賞したタンパク質設計技術である指向性進化法よりも強力となる可能性があり、治療薬からプラスチック分解に至るまで、ほとんどあらゆる用途に向けたタンパク質開発を実現し、50年の歴史を持つタンパク質工学の分野にさらなる活気を与えるだろう」と述べている。
参照論文:
Large language models generate functional protein sequences across diverse families
関連記事: