Zoomy

Arc Institute が NVIDIA と共同でオープンソースの生物学的基礎モデルで「Evo 2」を公開!

 Arc Institute が NVIDIA と共同でオープンソースの生物学的基礎モデルで「Evo 2」を公開!

ゲノム研究におけるAIの役割とは、AIは膨大なデータセットと演算能力を活用することで、高度なパターンを発見するための普遍的なフレームワークを提供します。

この分野における最新の画期的な成果のひとつが、Arc Institute が NVIDIA と共同開発したオープンソースの生物学的基礎モデルである「Evo 2」のリリースです。

Arc Institute、Berkeley Bioengineer の共同創設者でゲノム編集、バイオテクノロジー、AIの研究者兼投資家 Patrick Hsu 教授が「Evo 2」を公開について言及しています。

「Evo 2」の発表

Evo 2 は、生命の系統樹全体にわたるゲノムデータで訓練された画期的なモデルです。00万トークンコンテキスト長を誇り、9兆3000億の単一塩基解像度のDNAデータで訓練されています。

このモデルには7Bと40Bの2種類のパラメータサイズがあり、重み、トレーニングおよび推論コード、事前学習データを含め、完全にオープンソースです。

生物学におけるAIの能力の拡大

Evo 2 は、一般公開されているAIモデルとしては最大級の規模を誇り、個々の分子から細菌のゲノム全体、真核生物の染色体に至るまで、さまざまなスケールにおける生物学的相互作用を分析および推論する能力を備えています。

単細胞生物でトレーニングされた以前のEvoモデルを基に構築された Evo 2 は、その適用範囲をヒトゲノムを含む生命の全領域にまで拡大しています。

AIアーキテクチャの進歩

これらの結果を達成するために、Evo 2 は StripedHyena 2 と呼ばれる新しい最先端のディープラーニングアーキテクチャを統合しています。

この技術は損失スケーリングを改善し、ベースラインの Transformer モデルや同様の規模(40Bパラメータ)の以前のハイブリッドモデルと比較して、スループットを最大3倍に高めます。

Evo 2 は何ができるのか?

Evo 2 は、遺伝子変異の病原性効果予測のための汎用モデルとして機能します。

ヒトゲノムにおけるコード変異と非コード変異の両方を評価し、疾患を引き起こす可能性を評価することができます。例えば、Evo 2 は、特殊な変異トレーニング、アーキテクチャの最適化、または多重配列アラインメントを必要とせずに、BRCA1 遺伝子における乳がん関連変異を予測することができます。

遺伝子変異解析におけるゼロショット性能の実現

このAIモデルは、非コード変異のゼロショット推論に新たな基準を打ち立てています。Evo 2の埋め込みで訓練されたシンプルな教師ありモデルと組み合わせることで、コード変異予測において最先端(SOTA)の性能を達成します。

AIモデルにおける透明性と解釈可能性

大規模言語モデル(LLM)に対する一般的な批判は、そのブラックボックス性です。

透明性を向上させるため、研究者は GoodfireAI が先駆的に開発したメカニズム解釈技術を使用して Evo 2 を分析しました。初期の調査結果では、特定のAIニューロンが制御因子に対応していることが示唆されており、Evo 2が生物学的機能をどのように理解しているかについての洞察が得られています。

Evo 2を生物学的設計に活用

予測モデリングを超えて、Evo 2 は 合成の完全性 を維持しながら、ヒトのミトコンドリアゲノム、細菌ゲノム、真核生物の染色体 を含む ゲノム全体を生成 する能力を示しています。これは 合成生物学と遺伝子工学 に幅広い影響を与えます。

事前学習を超えるスケーリング:生成エピジェノミクスの未来

Evo 2 は事前学習の規模を超えてその能力を拡張し、推論時に適応します。研究者は、モールス信号のメッセージをクロマチンのアクセス可能性にエンコードする能力を実証し、「生成エピゲノム学」として知られる新しい概念を導入しました。

AIを活用したゲノム学の未来

Evo 2 を基盤として、研究コミュニティは 「生物学のアプリストア」を構築する構えです。これは、AI によって強化された一連のツールで、創薬、遺伝子工学、疾患研究に革命をもたらします。

このモデルは、創薬と標的同定を強化するために、Arc Institute の仮想細胞モデルにも統合されています。

コミュニティのリソースとアクセス

幅広い導入をサポートするために、研究者たちは複数のツールをリリースしています。

– Evo Designer(ウェブベースのインターフェース)
– NVIDIA NIM(生成用)
– GoodfireAI のメカニズム解釈ビジュアライザー

Evo 2 はゲノムAIにおける画期的な進歩であるだけでなく、計算生物学における新時代の幕開けを象徴するものです。