2024年のノーベル化学賞は、AIでたんぱく質の構造予測に成功した、ワシントン大学のデイビッド・ベイカー教授、そして DeepMind のデミス・ハサビスCEO、研究チームのジョン・ジャンパー氏の研究者ら3人が受賞しました。
BREAKING NEWS
The Royal Swedish Academy of Sciences has decided to award the 2024 #NobelPrize in Chemistry with one half to David Baker “for computational protein design” and the other half jointly to Demis Hassabis and John M. Jumper “for protein structure prediction.” pic.twitter.com/gYrdFFcD4T— The Nobel Prize (@NobelPrize) October 9, 2024
後者の DeepMind が開発したのが「AlphaFold2 (アルファフォールド)」という人工知能(AI)モデルで、タンパク質の立体構造を予測するために特化しています。
タンパク質構造予測は、生命科学や医療分野において重要な意味を持つ課題であり、AlphaFold2 はこれを効率的に解決する革新的な技術です。AlphaFold2 の開発の一環として、既知のアミノ酸配列とタンパク質の構造をすべて用いてAIモデルがトレーニングされました。
The Nobel prize website has a pretty well made 1-pager on how Alphafold works pic.twitter.com/OF12swwtbn
— Arthur Douillard (@Ar_Douillard) October 9, 2024
AlphaFold2 とは?
そもそも AlphaFold2 とは、タンパク質の3次元構造は、その機能を決定するために非常に重要ですが、実験で構造を解明するのは時間とコストがかかるため、長年の課題でした。AlphaFold2 はこの問題を大きく改善し、計算機上で非常に高精度な構造予測を可能にしました。
特に、タンパク質構造予測の精度を競う国際大会である CASP(Critical Assessment of protein Structure Prediction) 2020 では、AlphaFold2 はほぼ全てのタンパク質に対して実験結果とほぼ一致する構造予測を行い、大きな注目を集めました。
AlphaFold2 は、特にバイオインフォマティクスや生物学の分野での大きな突破口となりました。タンパク質構造予測は、DNA配列の解明に匹敵するほどの科学的インパクトを持ち、今後の生命科学、薬学、バイオテクノロジー分野での応用が期待されています。
Google DeepMind はこの技術を科学界に貢献するため、AlphaFold Protein Structure Database として公開し、世界中の研究者が利用できるようにしています。これにより、研究者たちは自由に予測された構造データを利用し、病気の治療法の開発や基礎研究を加速させることができるようになっています。
1. データの入力とデータベースの検索
構造が不明なアミノ酸配列が AlphaFold2 に入力され、類似のアミノ酸配列とタンパク質の構造を検索するためにデータベースが検索されます。
AlphaFold2 は、既知のタンパク質構造データベースを検索し、似たアミノ酸配列や構造を持つデータを見つけ出します。このデータは、構造予測の参考として使用されます。
2. 配列の分析
AIモデルは、異なる種から得られた類似のアミノ酸配列をすべて整列させ、進化の過程で保存されてきた部分を調査します。次のステップでは、AlphaFold2 が3次元のタンパク質構造において、どのアミノ酸が互いに相互作用し得るかを探索します。
相互作用するアミノ酸は共進化します。一方が電荷を持つ場合、もう一方は反対の電荷を持つため、互いに引き付け合います。一方が撥水性(疎水性)のアミノ酸に置き換わると、もう一方も疎水性になります。
この分析を使用して、AlphaFold2 は構造におけるアミノ酸同士の距離を推定する距離マップを作成します。
3. AI分析
反復プロセスを使用して、AlphaFold2 は配列分析と距離マップを改良します。AIモデルは、注目すべき重要な要素を特定する能力に優れたトランスフォーマーと呼ばれるニューラルネットワークを使用します。
ステップ1で発見された場合、他のタンパク質の構造に関するデータも利用されます。
4. 仮説構造
AlphaFold2 は、すべてのアミノ酸のパズルを組み立て、仮説上のタンパク質構造を生成する経路をテストします。これをステップ3で再度実行します。3サイクル後、AlphaFold2 は特定の構造に到達します。
AIモデルは、この構造の異なる部分が現実に対応する確率を計算します。
AlphaFold2 の意義と応用
AlphaFold2 は、従来のタンパク質構造解析に比べて、極めて高精度で構造を予測できるツールです。この技術により、研究者は新薬の設計やタンパク質の機能解明を迅速に行うことが可能になり、がん治療や希少疾患の研究に大きな影響を与えています。
また、この技術は多くの科学者によって自由に利用されており、生命科学の発展に大きく貢献しています。AlphaFold2 は、タンパク質科学に革命をもたらし、医薬品開発のスピードアップや生物学的メカニズムの理解を深めるための強力なツールとして評価されています。