
Dylan Patel — AI計算スケーリングにおける3大ボトルネックの深掘り
- Dwarkesh PatelがSemiAnalysisの創業者Dylan Patelを迎え、AIコンピュートのスケーリングを阻む3つの大きなボトルネック(ロジック、メモリ...
- 本エピソードの核心は、AIコンピュートの未来が単なるチップの性能向上だけでなく、EUV露光装置のような極めて複雑で生産拡大が容易ではない「道具を作るための道具」の供給に依...
- [0:00] AIラボの資金調達とコンピュート獲得競争の非対称性 Dwarkeshはまず、ビッグテック4社(Amazon, Meta, Google, Microsoft...
自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。
Dwarkesh Podcast / Dwarkesh Patel
Dwarkesh PatelがSemiAnalysisの創業者Dylan Patelを迎え、AIコンピュートのスケーリングを阻む3つの大きなボトルネック(ロジック、メモリ、電力)について深く掘り下げた対談。Patelは、半導体サプライチェーンの最上流から下流に至るまで、各プレイヤーが「AGIピルドネス(AGIへの確信度)」の違いによって、いかに異なる行動を取り、その結果として市場に非対称性が生まれているかを緻密なデータと共に解説する。特に、NVIDIAがTSMCの先端プロセス容量を早期に確保した戦略、Googleが情報の非対称性から出遅れた顛末、そしてASMLのEUV(極端紫外線)露光装置の生産能力が2030年に向けて究極の制約となるメカニズムが、具体的な数字と共に明らかにされる。
本エピソードの核心は、AIコンピュートの未来が単なるチップの性能向上だけでなく、EUV露光装置のような極めて複雑で生産拡大が容易ではない「道具を作るための道具」の供給に依存しているという点にある。Patelは、電力やデータセンター建設といった課題は資本主義と人間の創意工夫で解決可能である一方、半導体製造装置、特にASMLのサプライチェーンは「人間が作る最も複雑な機械」であり、その生産能力を短期間で劇的に増やすことは不可能だと論じる。この構造的な制約が、Sam AltmanやElon Muskが掲げる巨大なスケール目標の実現可能性に現実的な制限を課すこと、そしてその制約を理解し先回りして行動した者だけが莫大な利益を得られるという、投資家にとっても極めて示唆に富んだ議論が展開される。
AIラボの資金調達とコンピュート獲得競争の非対称性
Dwarkeshはまず、ビッグテック4社(Amazon, Meta, Google, Microsoft)の2025年の設備投資総額が6,000億ドルに達するというデータを提示し、この巨額の投資がいつ実際のコンピュートとして稼働するのか、そしてAIラボが調達した巨額の資金が何に使われるのかを問う。Dylan Patelは、これらの設備投資の多くは即座にコンピュートとして稼働するわけではなく、将来のデータセンター建設やタービンの着金、電力購入契約など、数年先を見越した先行投資が含まれていると説明する。例えば、Googleの1,800億ドルの設備投資の多くは2028年や2029年を見据えたものであり、今年実際に稼働するのは約20ギガワットに過ぎないという。
この文脈で、OpenAIとAnthropicのコンピュート獲得戦略の違いが浮き彫りになる。OpenAIが積極的に長期契約を結び、CoreWeaveやOracle、さらにはデータセンター建設の経験がないSoftBank Energyに至るまで、あらゆる供給元からコンピュートを確保しようと「狂ったような契約」を結んだのに対し、AnthropicのDario Amodeiは「破産しないように」と保守的な姿勢を取った。Patelは、この結果、AnthropicはOpenAIに比べてコンピュートへのアクセスで劣後し、需要が急増した現在、より低品質なプロバイダーやスポット市場に依存せざるを得なくなり、結果的に高いコストを支払っていると指摘する。Anthropicの収益が急成長しているにもかかわらず、コンピュート不足が成長のボトルネックとなっている現状は、早期に積極投資を行ったOpenAIとの差を如実に示している。
さらに、GPUの減価償却期間に関する一般的な認識(3年以内)も覆される。Patelは、新しいチップの登場によって旧型のH100の価値が下がるという従来の見方に対し、実際にはモデルの進化(GPT-5.4のような効率的なモデル)によってH100が生み出せる価値が向上しているため、H100の価値は3年前よりもむしろ高まっていると主張する。もし真のAGIが実現すれば、H1001台が人間の知識労働者並みの価値を生み出し、数ヶ月で投資を回収できる可能性すらある。このため、コンピュートの価値は時間とともに増大するという逆説が生じており、早期に長期契約を結んだ企業は大きな優位性を得ることになる。
NVIDIAの戦略的優位性とGoogleの出遅れ
NVIDIAがTSMCの3ナノメートルプロセス(N3)のウェハー容量の70%以上を2027年までに確保しているという事実は、同社の戦略的先見性を物語っている。Patelは、NVIDIAが競合他社よりもはるかに早い段階でTSMCに対して「解約不可、返品不可」の長期契約を結び、前金まで支払ったことが、この圧倒的な容量確保を可能にしたと説明する。一方、GoogleやAmazonは自社開発AIチップ(TPUやTrainium)の開発遅延や、需要予測の甘さから出遅れ、結果的にNVIDIAに先を越された格好だ。
特にGoogleの事例は象徴的である。Googleは自社のTPU V7(Ironwood)の一部をAnthropicに販売したが、これはDeepMindの研究者たちにとっては「正気の沙汰ではない」と受け止められた。Patelによれば、Anthropicのコンピュート調達チーム(元Google社員)は、Google社内の情報非対称性を突き、Google自身が需要の急増を認識する前に、この取引を成立させたという。Googleはその後、Geminiの成功を受けて「AGIピルド」に目覚め、電力会社の買収やタービンの先行発注など積極姿勢に転じたが、TSMCの容量はすでに売り切れており、増産を依頼しても「2027年なら対応できる」と言われる有様だった。
この情報非対称性は、サプライチェーン全体に浸透している。NVIDIAは自社のGPUだけでなく、NVLinkスイッチやネットワーク機器など、関連するあらゆるチップを3ナノメートルプロセスで製造する計画を早期に固め、PCB(プリント基板)やメモリのサプライヤーに対しても積極的に容量を確保した。Patelは、NVIDIAのJensen HuangはDario AmodeiやSam Altmanほど「AGIピルド」ではないかもしれないが、それでもGoogleやAmazonよりははるかに需要の大きさを理解しており、その差がサプライチェーン全体での圧倒的な優位性を生んだと分析する。
究極のボトルネック:ASMLのEUV露光装置
AIコンピュートのスケーリングにおけるボトルネックは、過去にはCoWoS(先進パッケージング)や電力、データセンター建設と移り変わってきたが、2028~2029年以降は半導体製造装置、特にASMLのEUV露光装置が究極の制約になるとPatelは予測する。EUV装置は「人類が作る最も複雑な機械」であり、1台300~400百万ドル、現在の年間生産台数は約70台、2020年代末でも100台強にしかならない。この生産台数の上限が、AIコンピュートの総量を物理的に制限することになる。
Patelは具体的な計算を示す。NVIDIAの最新チップ(Rubin)で1ギガワットのデータセンターを構築するには、約55,000枚の3ナノメートルウェハーと170,000枚のDRAMウェハーが必要となる。これらのウェハーを製造するために必要なEUV露光処理(EUVパス)の総数は約200万回に上り、これを処理するには約3.5台のEUV装置が必要になる。つまり、3.5台のEUV装置(約12億ドル相当)が、50ギガワットのデータセンター(約500億ドル相当)の建設を左右するという、極めて非対称な構造が存在する。
このEUV装置の生産拡大が容易でない理由は、そのサプライチェーンの複雑さにある。光源(Cymer、サンディエゴ)、レチクルステージ(コネチカット)、ウェハステージと光学系(Carl Zeiss、ヨーロッパ)という4つの主要コンポーネントは、それぞれが極めて特殊な技術と職人技に依存しており、簡単に生産能力を増やせない。特に、光源は錫の液滴をレーザーで3回連続して照射し、13.5ナノメートルのEUV光を発生させるという驚異的なプロセスを経ており、光学系の多層膜ミラーは原子レベルの精度が要求される。これらのサプライチェーン全体で約10,000もの個別サプライヤーが関与しており、生産拡大には長いリードタイムが必要となる。
旧世代プロセスへの回帰は可能か?
EUV装置の制約を回避する方法として、旧世代の7ナノメートルプロセスに回帰し、DUV(深紫外線)露光装置とマルチパターニング技術を活用する可能性が議論される。A100からB100への性能向上は約3倍だが、その大部分はプロセス微細化ではなくアーキテクチャの改善によるものであり、7ナノメートルでも同様の設計改善を施せば、ある程度の性能は確保できるように思える。
しかしPatelは、この考えは単純すぎると否定する。性能比較を単なるFLOPS(演算性能)で行うのは誤りであり、実際にはメモリ帯域幅やチップ間通信速度が全体の性能を大きく左右する。特に、大規模なモデルを多数のチップで実行する際、チップ内の通信速度(数十TB/秒)とチップ間の通信速度(1TB/秒未満)には桁違いの差があり、これがシステム全体の効率を決定づける。Blackwellでは1つのパッケージに2つのダイを統合し、チップ内通信の利点を拡大したが、これを旧世代のプロセスで再現しても、プロセス自体の微細化によるトランジスタ密度の向上がないため、根本的な性能差は埋まらない。
具体的な例として、DeepSeekやKimiのような最新モデルをHopperとBlackwellで実行した場合、FLOPSの差(約2~3倍)をはるかに超える、最大20倍もの性能差が生じることが示される。これは、Blackwellの大規模なスケールアップドメイン(72GPUが全対全接続)と高速なメモリ帯域幅が、モデルの推論効率を劇的に向上させるためである。したがって、旧世代プロセスへの回帰は、EUV不足を補う現実的な解決策とはなり得ない。
迫り来るメモリ危機と消費者市場への影響
AIコンピュートのスケーリングにおけるもう一つの深刻なボトルネックがメモリ、特にHBM(High Bandwidth Memory)である。HBMは通常のDRAMに比べて、同じビット数を得るために3~4倍のウェハー面積を必要とする。つまり、AI向けに1バイトのHBMを確保するためには、消費者向け製品から4バイト分のDRAM需要を破壊する必要がある。Patelは、2026年にはビッグテックの設備投資の30%がメモリに費やされるという驚愕の数字を提示する。
このメモリ需要の急増は、スマートフォンやPCといった消費者市場に深刻な影響を及ぼす。DRAM価格は高騰し、例えばiPhoneのBOM(部品原価)におけるメモリコストは50ドルから150ドルに跳ね上がる。Appleはある程度価格転嫁できるが、低価格帯のスマートフォンメーカー(XiaomiやOppoなど)は利益率が低く、価格転嫁が困難なため、生産台数を大幅に削減せざるを得なくなる。Patelの予測では、スマートフォンの年間出荷台数は14億台から5~6億台にまで減少する可能性がある。
このメモリ危機の根本原因は、メモリメーカー(Samsung, SK Hynix, Micron)が過去数年間、収益悪化を理由に新工場の建設を控えてきたことにある。需要が急増した現在、彼らは工場建設を急いでいるが、工場の建設には2年、さらに装置の導入と立ち上げに時間がかかるため、本格的な増産が可能になるのは2027年以降となる。このタイムラグが、今後数年間にわたってメモリ価格の高騰と消費者市場の縮小を引き起こすとPatelは警告する。
電力供給は解決可能な問題
電力供給については、Patelは楽観的な見方を示す。確かに、大規模ガスタービン(コンバインドサイクル)の主要サプライヤーはGE Vernova、三菱重工、シーメンスの3社しかなく、そのリードタイムは長期化している。しかし、AIデータセンターにとって重要なのは、必ずしも最も効率的な発電方式を選ぶことではなく、チップを稼働させるための電力を確保すること自体である。
Patelは、多様な代替手段が存在すると指摘する。航空機エンジンを転用した「アロ・デリバティブ」、船舶用エンジン、中速レシプロエンジン( Cumminsなど)、Bloom Energyの燃料電池、さらには太陽光発電と蓄電池の組み合わせなど、16以上の異なる発電機器メーカーが存在する。これらの機器はコンバインドサイクルより効率は劣るが、GPUのTCO(総所有コスト)に占める電力コストの割合は小さいため、多少の発電コスト増は問題にならない。例えば、電力コストが倍増しても、H100の1時間あたりのコストは1.40ドルから1.50ドルに増加するに過ぎず、モデルの価値向上に比べれば微々たるものだ。
さらに、米国の電力網自体にも余裕がある。データセンターの電力消費は現在米国全体の3.4%に過ぎないが、ピーク時の需要に対応するために確保されている予備容量(約20%)を、蓄電池やピーカー発電所で代替することで、実質的に200ギガワットもの電力をデータセンター向けに解放できる可能性がある。Patelは、労働力不足や規制問題などの課題はあるものの、これらは資本主義と技術革新によって解決可能であり、電力はチップ製造ほどの根本的な制約にはならないと結論付ける。
宇宙データセンターは非現実的
Elon Muskが提唱する宇宙データセンター構想について、Patelは「この10年では実現しない」と明確に否定する。宇宙では太陽光が無尽蔵に得られるという利点は、GPUのTCOに占める電力コストの割合が小さい現状では、ほとんど意味を持たない。むしろ、宇宙には多くの致命的な欠点が存在する。
最大の問題は、GPUの信頼性と運用の複雑さである。現在でもBlackwellの約15%は出荷後に交換(RMA)が必要となる。これらのGPUを地球上でテストし、分解し、宇宙に輸送し、再び組み立てて稼働させるまでには、少なくとも6ヶ月の追加時間がかかる。コンピュートが最も価値を持つのは「今」であるため、この6ヶ月の遅延はGPUの実質的な価値を大きく毀損する。また、宇宙空間でのGPUの故障対応は極めて困難であり、衛星間を結ぶレーザー通信リンクは、地上の光トランシーバーに比べてはるかに高価で信頼性も低い。
さらに、大規模なモデルを推論する際には、多数のGPUを高速ネットワークで接続する必要があるが、宇宙空間でこれを実現するためのインターコネクト技術は未成熟である。Patelは、チップそのものが最も希少なリソースである現在、貴重なチップを宇宙に送り込むよりも、地球上で即座にトークンを生成することに集中すべきだと主張する。宇宙データセンターが経済的に意味を持つのは、半導体製造能力が需要に追いつき、エネルギーや土地の制約が相対的に重要になる2035年以降の話だと結論付ける。
投資家の視点:情報の非対称性と市場の非効率性
Patelは、SemiAnalysisのデータがヘッジファンドなど投資家にどのように活用されているかについても言及する。同社の顧客の約60%は業界関係者(AIラボ、ハイパースケーラー、半導体メーカー)だが、残りの40%はヘッジファンドである。彼らのデータは、市場参加者が持つ「AGIピルドネス」の度合いの差を可視化し、市場の非効率性を浮き彫りにする。
特に有名な投資家Leopold(Akshay K.)は、SemiAnalysisのデータを最も活用しているクライアントの一人であり、彼の特徴は「常に我々の数字は低すぎると言う」点だとPatelは笑う。他の多くの投資家や企業は、SemiAnalysisの予測を「高すぎる」と懐疑的に見るが、Leopoldはその逆で、AIの爆発的な成長を確信し、メモリ関連銘柄などに巨額のポジションを取って成功を収めた。これは、単にデータを入手するだけでなく、それを正しく解釈し、強い確信を持って行動できるかどうかが、投資の成否を分けることを示している。
Patelは、市場の非効率性はサプライチェーンの各階層に存在すると指摘する。例えば、メモリ価格の高騰は、KVキャッシュの増大による需要増を考えれば「明白」だったが、市場がそれを価格に反映させるまでには1年以上のタイムラグがあった。同様に、クリーンルーム不足やEUVツール不足も、現在はまだ十分に認識されていない可能性がある。SemiAnalysisの役割は、こうしたサプライチェーンの実態を詳細に追跡し、市場参加者が持つ「認識のギャップ」を埋めることにある。
TSMCとAppleの関係、そして中国の台頭
TSMCの2ナノメートルプロセス(N2)を巡るAppleとAI企業の関係にも変化の兆しが見える。従来、Appleは常に最先端プロセスの最初の顧客であり、最大の顧客でもあった。しかし、N2ではAMDがCPUとGPUチップレットを同時期に投入しようとしており、さらに次世代のA16ノードでは、最初の顧客はAppleではなくAI企業になる見込みである。TSMCの設備投資が拡大し続ける一方で、Appleのビジネスは同じペースで成長しておらず、AppleのTSMCにおける重要性は徐々に低下している。将来的には、AppleもNVIDIAやGoogleと同様に、事前に容量を予約し、設備投資の前金を支払うことを求められるようになるかもしれない。
最後に、中国の半導体産業の将来について議論が及ぶ。Patelは、もしHuaweiがTSMCの3ナノメートルプロセスを利用できていたら、NVIDIAのRubinよりも優れたAIアクセラレータを開発できていた可能性があると指摘する。Huaweiはソフトウェア、ネットワーク技術、AI人材、そして自社のファブまでを持つ、NVIDIA以外で唯一「全ての脚」を持つ企業だからだ。しかし、現実には中国はEUV露光装置を入手できず、自国での開発も生産地獄に直面している。
長期的には、AIのテイクオフが遅ければ遅いほど、中国が独自のサプライチェーンを構築し、西側に追いつく可能性が高まる。一方、現在進行しているような急速な需要成長が続けば、西側のAIラボは巨額の設備投資を回収し、さらなる成長のための資金を得ることができる。Patelは「タイムラインが短ければ西側が勝ち、長ければ中国が勝つ」というシンプルな構図を示し、台湾有事のリスクについても、仮に発生すれば世界の半導体供給は壊滅的な打撃を受け、AIコンピュートの拡大は数年間停止するだろうと警告する。
結びに
本エピソードの核心は、AIコンピュートの未来が、NVIDIAやOpenAIといった表層的なプレイヤーだけでなく、ASMLやCarl Zeissといった「道具を作るための道具」を製造する、ほとんど知られていない企業群の生産能力に依存しているという、極めて現実的かつ構造的な制約を描き出した点にある。Dylan Patelの緻密なデータとサプライチェーン全体を俯瞰する視点は、しばしば楽観論に傾きがちなAI業界の議論に、冷徹な現実を突きつける。特に、EUV露光装置の生産能力が2030年に向けて究極のボトルネックとなるという分析は、Sam Altmanの50ギガワット計画やElon Muskの宇宙データセンター構想に、具体的な物理的限界を示すものとして、極めて重要な示唆に富んでいる。
このエピソードが重要なのは、単に未来予測を行うだけでなく、現在進行形で起きている「AGIピルドネス」の差が、サプライチェーンの各階層でどのような非対称性を生み、それが競争優位や投資リターンに直結しているかを明らかにした点にある。早期に確信を持って行動したNVIDIAやOpenAIは大きなアドバンテージを得て、逆に保守的だったAnthropicや出遅れたGoogleは苦境に立たされている。この構図は、今後も半導体製造装置メーカーや素材メーカーなど、さらに上流のプレイヤーに波及していく可能性がある。リスナーは、AIの未来を語る際に、ソフトウェアの進化だけでなく、このような物理的サプライチェーンの制約と、それを巡る企業間の駆け引きを常に考慮する必要があることを、強く認識させられるだろう。
要点
- NVIDIAはTSMCの3nmプロセス容量の70%以上を2027年までに確保しており、これは同社が競合他社よりはるかに早く「解約不可」の長期契約を結んだ結果である。
- Googleは自社の需要急増を予見できず、AnthropicにTPUを販売するなど情報非対称性の犠牲となり、結果的にTSMCの容量確保で出遅れた。
- 2030年に向けたAIコンピュートの究極のボトルネックは、ASMLのEUV露光装置の生産能力(年間100台強)であり、これが全世界のAIチップ生産量の上限を物理的に決定づける。
- 1ギガワットのAIデータセンターを稼働させるには約3.5台のEUV装置(約12億ドル)が必要であり、この装置不足が500億ドル規模のデータセンター建設を制約するという非対称な構造が存在する。
- 旧世代の7nmプロセスへの回帰は、チップ間通信速度やメモリ帯域幅の制約により、最新プロセスとの性能差がFLOPSの差(2~3倍)をはるかに超える最大20倍にもなるため、現実的な解決策ではない。
- メモリ(HBM)の需要急増により、2026年にはビッグテックの設備投資の30%がメモリに費やされ、DRAM価格高騰がスマートフォン市場の縮小(年間出荷台数が14億台から5~6億台へ)を引き起こす。
- 電力供給は、多様な発電方式(航空機エンジン転用、船舶用エンジン、燃料電池など)の活用と、電力網の予備容量の活用により、チップ製造ほどの根本的な制約にはならない。
- 宇宙データセンターは、GPUの信頼性問題、輸送と運用の遅延、高コストな衛星間通信などの理由から、少なくともこの10年以内に経済的に成立する見込みはない。