
🔬 癌治験の95%の失敗率を解決するTransformerの訓練 — Ron Alfa & Daniel Bear, Noetik
- がん治療薬の95%が臨床試験で失敗するという現実。しかし、Noetikの共同創業者兼CEOであるRon Alfa(ロン・アルファ)とVP of AIのDaniel Bea...
- この技術は、製薬業界に大きな衝撃を与えている。2025年1月、NoetikはGSKと5,000万ドル規模の契約を発表した。これは、創薬パイプラインの一部ではなく、基盤モデ...
- [0:00] 95%の失敗率:臨床試験は「患者選択」の問題である がん治療薬の開発における最大のボトルネックは、薬そのものの効能ではなく、臨床試験のデザインにあるとRon...
自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。
Latent Space: The AI Engineer Podcast / Latent.Space
がん治療薬の95%が臨床試験で失敗するという現実。しかし、Noetikの共同創業者兼CEOであるRon Alfa(ロン・アルファ)とVP of AIのDaniel Bear(ダニエル・ベア)は、この失敗の原因は薬そのものの効果のなさではなく、「患者の選び方」にあると主張する。彼らの核心的なテーゼは、すでに存在する多くの治療薬が特定の患者集団には有効であるにもかかわらず、適切な患者を選別する手段がないために、臨床試験全体が失敗に終わっているというものだ。この問題を解決するために、Noetikは数千もの実際のヒト腫瘍サンプルから、空間トランスクリプトミクス(空間的に解像された遺伝子発現データ)を含む前例のない規模のマルチモーダルデータを収集し、自己教師あり学習を用いて「仮想細胞(virtual cell)」モデルを構築している。このモデルは、すべてのがん患者が標準ケアで受けるH&E染色画像(病理組織標本)だけを入力として、約19,000もの遺伝子の空間的な発現パターンを予測できる。これにより、従来の単純なバイオマーカーでは捉えきれなかった、治療反応性を決定する真の生物学的サブタイプを発見できる可能性がある。
この技術は、製薬業界に大きな衝撃を与えている。2025年1月、NoetikはGSKと5,000万ドル規模の契約を発表した。これは、創薬パイプラインの一部ではなく、基盤モデルそのものをライセンスするという、AIバイオテック分野では前例のない画期的な取引である。このエピソードでは、Noetikがどのようにしてデータ収集に2年近くを費やし、独自のモデルアーキテクチャ(TARIO-2)を開発し、マウスモデルを用いた大規模な遺伝子ノックアウト検証プラットフォーム(PerturbMap)を構築してきたかが詳細に語られる。彼らのアプローチは、AIエンジニアにとって、生物学という極めて複雑なドメインにおいて、データの質と量、そしてモデルのスケーリング則を追求することの重要性を示す、稀有なケーススタディとなっている。
95%の失敗率:臨床試験は「患者選択」の問題である
がん治療薬の開発における最大のボトルネックは、薬そのものの効能ではなく、臨床試験のデザインにあるとRon Alfaは主張する。現在、がん治療薬の90%から95%は臨床試験で失敗するが、その原因は薬理学的な能力の欠如や標的選択の誤りではない。むしろ、人類は薬剤開発の歴史においてかつてないほど優れた薬を作れるようになっている。問題は、その薬がどの患者に効くのかを事前に特定できないことにある。多くの臨床試験では、一部の患者は実際に薬に反応するにもかかわらず、適切な患者集団を選別できていないために、試験全体が「効かなかった」と判定されてしまう。この「患者選択の失敗」こそが、莫大な開発費と時間を浪費する根本原因であるというのが、Noetik創業の根底にある逆説的なテーゼだ。
従来の創薬プロセスは、この問題を悪化させている。新薬の開発は、まず試験管内(in vitro)で、40年から50年も前に樹立された「不死化細胞株(immortalized cell lines)」を用いて行われる。これらの細胞は、異常な染色体数を持ち、実際のヒトの体内には存在しない遺伝子発現パターンを示す、いわば「フランケンシュタイン細胞」である。その後、これらの細胞をマウスに移植する動物モデル実験に進むが、ここでも細胞は本来の臓器とは異なる皮下などに移植される。このような非現実的な前臨床モデルで得られたデータは、実際のヒト患者の生物学とはほとんど関連性がない。その結果、臨床試験の段階に進んだとき、治験責任医師は「この薬がどの患者に効くのか」という手がかりを何も持っていない。彼らはやむを得ず、あらゆる種類のがん患者を無差別に登録する「オープンラベル試験」を実施し、統計的に有意なシグナルが現れることを祈るしかない。このような状況では、初期段階の試験で有望なシグナルを捉えられず、多くの有望な分子が開発中止に追い込まれる。
Noetikのビジョンは、このプロセスを根本から変えることにある。彼らのモデルは、特定の分子メカニズムに基づいて「この薬はこの遺伝子プロファイルを持つ患者に効くはずだ」という仮説を生成する。そして、実際の患者の生検組織から得たデータをモデルに入力し、その患者が仮説に合致するかどうかを判定する。これは単なる遺伝子変異の有無を見る従来のバイオマーカーとは異なり、遺伝子発現、免疫環境、組織構造など、多層的な情報を統合した、より包括的な「患者の生物学的プロファイル」に基づくマッチングである。彼らは、このアプローチによって、すでに安全性が確認されているものの効能が証明されなかった「失敗薬」を、適切な患者集団に対して再評価し、救済することも視野に入れている。
データモートの構築:意図的に設計されたデータセットの重要性
Noetikの最大の差別化要因は、そのデータにある。同社は、公開データベースや既存の研究データに依存するのではなく、自社のラボでゼロからデータを生成するという戦略をとった。Ron Alfaは、この決断の背景を「AIとバイオの分野におけるもう一つの過激な見解(hot take)」として説明する。それは、生物学の分野では、他のAI分野と比較してデータの桁が根本的に異なり、単にデータをかき集めるだけでは問題を解決できないという認識だ。彼らは、タンパク質構造予測の分野で決定的な役割を果たしたPDB(Protein Data Bank)の例を挙げる。PDBは、50年以上にわたって研究者コミュニティが意図的に設計し、収集し続けてきたデータベースであり、偶然の産物ではない。同様に、Noetikは将来のモデルが何を学習する必要があるかを先見して、データを設計している。
このデータ設計の哲学は、具体的な実験プロトコルにまで及んでいる。Noetikは、患者の腫瘍サンプルを受け取ると、それを数十回にわたってサンプリングし、専用のアレイに配置する。各アレイには数百もの異なる患者サンプルがランダムに配置され、さらに各患者は複数の異なるアレイにまたがって配置される。この巧妙な実験計画は、後日のデータ解析において「バッチ効果(batch effects)」と呼ばれる技術的なノイズを除去するために不可欠である。同じ実験を異なる日に実施すると、試薬のロットや温度などの微妙な違いがデータに系統的な変動をもたらす。Noetikのデザインは、このバッチ効果を統計的に制御し、モデルが真の生物学的シグナルを学習していることを保証する。
データの規模も圧倒的である。彼らは現在、1億個以上の細胞について、空間的に解像されたトランスクリプトームデータを取得している。これは、公開されている類似のデータセットと比較して、少なくとも一桁は大きい。このデータの豊富さは、モデルの性能に直接的に寄与している。Noetikの実験では、訓練データを40%や10%に減らすと、モデルの性能、特に未知のがん種への一般化能力が著しく低下することが確認されている。この「データモート」は、競合他社が容易に模倣できない、同社の最も強力な競争優位性の一つである。
マルチモーダルデータ:H&Eから空間トランスクリプトミクスまで
Noetikが生成するデータは、単一の種類ではなく、複数のモダリティ(情報層)から構成される「スタック」である。これは、生物学のセントラルドグマ(DNA→RNA→タンパク質)を画像レベルで再現することを目指している。最下層は、すべてのがん患者が診断時に受けるH&E染色画像である。これはヘマトキシリンとエオジンという2種類の色素で組織を染色したもので、病理医が細胞の構造を観察し、腫瘍の種類を分類するための標準的な手法である。Noetikは、このH&E画像をモデルの入力として使用することで、臨床現場で広く利用可能なデータから予測を行うことを可能にしている。
次の層は、免疫細胞などの特定の細胞種を可視化するための多重蛍光タンパク質染色画像である。抗体に蛍光タンパク質を結合させ、特定の波長の光を当てることで、T細胞やB細胞など、腫瘍微小環境における免疫細胞の種類と位置を詳細にマッピングする。これにより、腫瘍が「免疫的に高温(hot)」なのか「低温(cold)」なのかを判断するための重要な情報が得られる。最も情報密度が高いのは、最上層の空間トランスクリプトミクスデータである。これは、組織切片上の各スポットにおいて、約19,000もの遺伝子の発現レベルを同時に測定する技術である。通常のRGB画像が3つの色チャンネルを持つとすれば、このデータは20,000ものチャンネルを持つ超多次元画像と考えることができる。
これらのデータを統合することで、Noetikのモデルは、組織全体の構造、個々の細胞の種類と状態、そしてそれらの細胞内で実際にどの遺伝子が働いているかという分子レベルの情報を、空間的な文脈とともに学習する。Daniel Bearは、このアプローチを「トップダウン」アプローチと表現する。彼らは、個々の細胞内のすべての生化学反応をシミュレートするような「ボトムアップ」の仮想細胞を目指すのではなく、まず患者間の治療反応性の違いを説明するのに十分なレベルの生物学的理解を得ることを優先している。これは、神経科学において、個々のニューロンの生物理学的な詳細モデルを積み上げるよりも、ニューラルネットワークという抽象化されたモデルが脳の機能予測に成功した歴史と類似している。
TARIO-2:自己回帰型トランスフォーマーとスケーリング則
Noetikは、最新の基盤モデル「TARIO-2」を発表した。これは、空間トランスクリプトミクスデータを処理するために設計された自己回帰型(autoregressive)トランスフォーマーである。従来のモデル(OctoVCなど)は、BERTと同様のマスクド・オートエンコーディング(Masked Autoencoding)という学習手法を用いていた。これは、入力データの一部をランダムにマスク(隠し)、モデルにその欠損部分を予測させるというものだ。しかし、TARIO-2は、LLM(大規模言語モデル)で成功を収めた「次のトークンの予測(next token prediction)」を採用している。このアーキテクチャの変更により、モデルのスケーリング挙動が劇的に改善された。
TARIO-2の重要な発見は、モデルの性能向上が単にパラメータ数を増やすだけでは達成されないという点にある。より大きなモデルの恩恵が顕著に現れるのは、モデルが一度に処理できる「コンテキスト長(context length)」、すなわち一度に見ることのできる組織領域のサイズが大きい場合に限られる。これは、がんの生物学を理解するためには、局所的な細胞の情報だけでなく、より広範な組織のアーキテクチャや細胞間の相互作用を捉えることが不可欠であることを示唆している。より長いコンテキストを持つことで、モデルは発現量が低いが予測的に重要な遺伝子のシグナルを捉えたり、複雑な非線形パターンを学習したりすることが可能になる。
このスケーリング則の発見は、Noetikの今後の戦略に大きな影響を与える。彼らは、現在のデータセットの規模(約1億細胞)をさらに拡大することで、モデルの性能が継続的に向上すると確信している。Daniel Bearは、現在のデータ量はImageNetが深層学習革命を引き起こした頃の規模(120万画像)に匹敵すると述べ、言語モデルが示したような劇的なスケーリング効果を生物学的データでも実現するためには、さらに一桁から二桁多いデータが必要になるだろうと見積もっている。この「データのスケーリング則」を自らの手で検証できることが、独自のデータ生成パイプラインを持つNoetikの大きな強みである。
PerturbMap:マウスモデルによるin vivo検証と「インシリコ・ヒューマナイゼーション」
Noetikは、モデルの予測を検証するための独自の実験プラットフォーム「PerturbMap」も開発している。これは、CRISPR技術を用いて一度に約100種類の異なる遺伝子をノックアウト(機能欠損)させたがん細胞を作成し、それぞれにタンパク質の「バーコード」を付与する。これらの細胞をマウスの肺に同時に注入すると、マウスの肺には100種類以上の異なる遺伝子型を持つ腫瘍が形成される。このシステムにより、一匹のマウスを用いて、異なる遺伝子変異が腫瘍の増殖や免疫環境に与える影響を、空間的に解像された形で同時に観察することができる。
このプラットフォームの真価は、Noetikのモデルがヒトのデータから学習した生物学的関係を、マウスという生体内で検証できる点にある。例えば、モデルが「遺伝子Aをノックアウトすると、腫瘍は免疫細胞が浸潤しない『低温(cold)』表現型になる」と予測したとする。PerturbMapを用いて実際に遺伝子Aをノックアウトした腫瘍をマウスで作成し、その組織を解析することで、予測が正しいかどうかを確認できる。彼らは、同一のシグナル伝達経路上にある複数の遺伝子をノックアウトすると、モデルが予測する通り、すべてが類似した表現型を示すことを確認している。これは、モデルが生物学的に意味のある因果関係を学習していることを強く示唆する。
さらにNoetikは、マウスとヒトの間のギャップを埋めるために、「インシリコ・ヒューマナイゼーション(in silico humanization)」という手法を開発している。彼らのモデルは、ヒトのH&E画像と空間トランスクリプトミクスデータで訓練されているが、驚くべきことに、このモデルをマウスのH&E画像に適用しても、正確な予測が可能である。つまり、モデルはマウスの組織像を「ヒトの生物学の言葉」に翻訳して解釈することができる。これにより、PerturbMapで得られたマウスのデータを、直接ヒトの創薬に応用することが可能になる。このアプローチは、従来の創薬において大きな障壁となっていた「マウスとヒトの種差」を、AIを用いて克服しようとする野心的な試みである。
GSKとの5,000万ドル契約:基盤モデルライセンスの新時代
2025年1月、Noetikは製薬大手のGSKと、同社の基盤モデル「OctoVC」のライセンス契約を発表した。契約総額は5,000万ドルで、 upfront payment(契約一時金)、マイルストーン支払いに加え、年間のモデルライセンス料も含まれる。この取引が画期的なのは、その構造にある。従来のAIバイオテック企業は、自ら創薬パイプラインを持ち、特定の治療薬の開発を目指すか、あるいは製薬会社と特定のプロジェクト単位で共同研究を行うケースがほとんどだった。しかし、Noetikの契約は、ソフトウェアや分子ではなく、「基盤モデルそのもの」をライセンスするという、業界初の試みである。
この契約が成立した背景には、製薬業界におけるAIへの関心の高まりがある。Ron Alfaは、製薬会社は自社のパイプライン全体にわたって活用できる汎用的な技術基盤を求めていると分析する。GSKは社内に強力なAIチームを持っており、Noetikのモデルをそのまま利用するだけでなく、自社が保有する膨大なトランスレーショナルデータ(過去の臨床試験データなど)でファインチューニングする権利も得ている。これにより、GSKは自社のデータ資産を活用して、独自の「GSK版モデル」を構築することが可能になる。この「モデル+データ」の組み合わせが、単なるソフトウェア販売を超えた、戦略的な価値を生み出している。
Noetikがこのような大型契約を獲得できたのは、彼らが「データのスケーリング」に対して長期的なコミットメントを行い、実際に実績を積み上げてきたからに他ならない。Ron Alfaは、ラボを立ち上げてから最初のモデルが訓練可能になるまでに約1年半を要したと振り返る。その間、彼らは腫瘍サンプルの調達、処理パイプラインの構築、そして2週間かかる空間トランスクリプトミクスの測定をひたすら繰り返していた。この「結果が保証されていない」期間に耐え、データ生成に投資し続けたことが、現在の競争優位性を築いた。このエピソードは、AIバイオテックのスタートアップにとって、短期的な成果を求めず、長期的なデータ資産の構築にコミットすることの重要性を如実に示している。
結びに
このエピソードがリスナーに残すものは、「AIががんを治す」という華々しい約束の裏側にある、地味で困難な現実と、それを突破するためのエンジニアリングの力強さである。Noetikの物語は、単なるアルゴリズムの改良ではなく、データの質と量に対する深い洞察、実験計画の緻密さ、そして長期的なビジョンへの揺るぎない信念が、どのようにして現実のインパクトを生み出すかを示している。特に、GSKとの契約は、AIモデルそのものが「製品」として認められ、巨額の価値を持つ時代が到来したことを告げる重要なマイルストーンである。AIエンジニアにとって、生物学という複雑なドメインに挑戦する際のロードマップとして、このエピソードは計り知れない示唆に富んでいる。
要点
- がん治療薬の95%が臨床試験で失敗する主因は薬の効能不足ではなく、適切な患者を選別できない「患者選択の失敗」にあるというのがNoetikの核心的テーゼである。
- Noetikは、公開データに依存せず、数千のヒト腫瘍サンプルからH&E画像、多重蛍光タンパク質染色、空間トランスクリプトミクスを含むマルチモーダルデータを自社で生成している。
- 同社の最新モデルTARIO-2は、自己回帰型トランスフォーマーアーキテクチャを採用し、より長いコンテキスト(広い組織領域)を処理することで顕著なスケーリング則を示す。
- モデルは、すべてのがん患者が持つH&E画像のみを入力として、約19,000の遺伝子の空間的発現パターンを予測し、治療反応性に関連する新たなサブタイプを発見できる。
- Noetikは、CRISPRを用いた大規模遺伝子ノックアウトマウスモデル「PerturbMap」を開発し、モデルの予測を生体内で検証するとともに、「インシリコ・ヒューマナイゼーション」によりマウスデータをヒトの生物学に翻訳している。
- 2025年1月、NoetikはGSKと5,000万ドル規模の基盤モデルライセンス契約を締結した。これは、AIモデルそのものをライセンスする業界初の画期的な取引である。
- Noetikの成功は、結果が不確実な中でもデータ生成に2年近く投資し続けた長期的なコミットメントと、バッチ効果を制御するための緻密な実験計画に支えられている。