
Dylan Patel - トークンの無限需要、Claude神話、供給制約 - [Invest Like the Best, EP.469]
- SemiAnalysisの創業者兼CEOであるDylan Patelは、前回の出演からわずか数ヶ月で、AI業界の需給構造が劇的に変化したと語る。特に注目すべきは、トークン...
- 一方、供給側の状況は極めて逼迫している。GPUの価格は高騰し、その耐用年数は延びている。メモリ(DRAM)の価格は今後さらに倍増か3倍になるとPatelは予測する。TSM...
- [03:09] SemiAnalysisのAI支出:ゼロから700万ドルへの軌跡 Dylan Patelは、自社のAI関連支出が昨年の数万ドルから、現在は年換算700万ド...
英語Podcastの要点を、聴く前に日本語で把握したい人。
Invest Like the Best with Patrick O'Shaughnessy / Colossus | Investing & Business Podcasts
SemiAnalysisの創業者兼CEOであるDylan Patelは、前回の出演からわずか数ヶ月で、AI業界の需給構造が劇的に変化したと語る。特に注目すべきは、トークン(AIモデルが処理する情報の単位)に対する需要が「完全に爆発的」であるという点だ。Patel自身の会社であるSemiAnalysisは、昨年は数万ドルだったAI関連支出が、今年は年換算で700万ドルにまで急増した。これは単なるコスト増ではなく、ビジネスの根幹を変えるほどのインパクトを持っている。同社のエンジニアだけでなく、非技術系のスタッフまでもがAnthropicのClaude Codeを活用し、かつては専門チームが数ヶ月かけて行っていた作業を、個人が数千ドルのトークン消費で数週間で完了してしまう事例が続出しているのだ。この現象をPatelは「Claude Psychosis(クロード・サイコシス)」と名付け、AIの実装コストが劇的に低下したことで、アイデアの価値と実行力のバランスが根本から覆されたと分析する。
一方、供給側の状況は極めて逼迫している。GPUの価格は高騰し、その耐用年数は延びている。メモリ(DRAM)の価格は今後さらに倍増か3倍になるとPatelは予測する。TSMC(台湾積体電路製造)の設備投資は2028年には1000億ドルに達する可能性があり、サプライチェーン全体がかつてない規模の需要に追いつこうと必死だ。本エピソードでは、この需給ギャップがもたらす経済的帰結、AnthropicとOpenAIの競争構図、そして社会がAIに対して抱く反発の高まりについて、深く掘り下げられた議論が交わされている。
SemiAnalysisのAI支出:ゼロから700万ドルへの軌跡
Dylan Patelは、自社のAI関連支出が昨年の数万ドルから、現在は年換算700万ドルにまで急増した具体的事例を詳細に語る。この変化の引き金となったのは、昨年12月にリリースされたAnthropicのClaude Opusと、それに続くClaude Codeの登場だった。同社の社長であるDoug O'Laughlinが非技術者でありながらAIコーディングツールを率先して使い始め、それが全社に波及した。エンジニアはもちろん、これまでコードを書いたことのないメンバーまでもがClaude Codeを使い、一日に数千ドルを消費することもあるという。その結果、同社の給与総額(約2500万ドル)に対するClaude Code支出の比率は25%を超え、このペースが続けば年内に100%を超える可能性すらあるとPatelは指摘する。ただし、同社が急成長中であるため、人員削減ではなく、採用ペースを抑えつつAIへの投資を拡大するという選択を取っている。
具体的なユースケースとして、Patelは二つの事例を挙げる。第一に、同社がオレゴン州に構えるリバースエンジニアリングラボの例だ。ここでは、半導体チップの断面画像を解析し、各層の材料(銅、タンタル、ゲルマニウム、コバルトなど)を特定する作業が行われていた。従来は専任チームが担当していたこの作業を、一人のエンジニアが数千ドルのClaudeトークンを消費して、GPUで高速処理するアプリケーションを構築した。わずか数週間で、かつてはIntelでチーム全体の仕事だったものが個人で完結するようになったという。第二に、大手銀行のエコノミストであるMalcolmの事例だ。彼はFRED(連邦準備銀行の経済データ)など、様々なAPIから経済データを収集し、AIを用いて回帰分析やタスクの自動化可能性を評価するシステムを一人で構築した。米国労働統計局が定義する2000のタスクのうち、約3%が現在のAIで実行可能であると評価し、「Phantom GDP(幻のGDP)」という概念を提唱。これは、AIによるコスト削減がGDP統計に現れない価値を生み出していることを示す指標だ。この分析は、かつては200人の経済学者チームが一年かけて行う規模のものだったとPatelは驚嘆する。
ビジネスオーナーとして、この急激な支出増加をどう捉えているのかというPatrick O'Shaughnessyの問いに対し、Patelは「情報ビジネスにおいて、AIの導入は生き残りのための必須条件」と断言する。もし自社がAIを活用して分析の質を継続的に向上させなければ、競合に commoditized(コモディティ化)されるリスクがある。実際、同社が2023年に提供していたデータセットは、現在では多くの競合が同様のものを提供しており、差別化が難しくなっている。だからこそ、AIへの支出は「コスト」ではなく、差別化を維持し、市場での優位性を拡大するための「投資」であるとPatelは強調する。エネルギー分野への進出もその好例で、同社のアナリストがClaude Codeを使って米国全土の送電線と発電所のデータをスクレイピングし、電力の過不足を可視化するダッシュボードを数週間で構築した。この成果は、100人規模のチームが10年かけて作った競合製品と比較しても遜色ないものであり、Patelは「もし自分が動かなければ、誰かが自分をコモディティ化する」という危機感を強く抱いている。
トークン需要の爆発:フロンティアモデルへの執着と経済的価値
Patelの経験は、マクロレベルでのトークン需要の爆発を如実に示している。Anthropicの年換算売上高は、年初の90億ドルから現在は350〜400億ドルに急成長し、さらに増加傾向にある。この驚異的な成長率の背景には、同社が研究開発用のコンピューティングリソースを削減していないという前提のもと、推論(inference)に割り当てられた追加コンピューティングリソースの限界利益率が少なくとも72%に達しているという計算がある。年初にリークされた資金調達資料では30%台だった粗利率が、なぜここまで急上昇したのか。それは、需要が供給を大幅に上回っているため、Anthropicが利用制限(レートリミット)を厳しく設定し、実質的にトークンを配給しているからだ。つまり、Anthropicの担当者とエンタープライズ契約を結び、十分なレートリミットを確保できるかどうかが、ビジネス上の死活問題になりつつある。
この需給逼迫の背景には、ユーザーが「フロンティアモデル」、つまり最も高性能なモデルに固執するという行動がある。Patrick O'Shaughnessy自身、Opus 4.7がリリースされた瞬間、それまで満足して使っていたOpus 4.6に戻る気がしなくなったと語る。Patelは、この現象を「Mythos(Anthropicの最上位モデル)は、ここ2年で最大のモデル能力の飛躍」と評する。Mythosは、その性能の高さゆえにAnthropicが一般公開を躊躇したモデルだ。同社は「世界への影響を懸念」し、あえて性能を抑えたOpus 4.7をリリースしたと明言している。Patelは、Anthropicの共同創業者にMythosへのアクセスを懇願したエピソードを笑い話として語るが、その裏には「最高のトークンへのアクセス権」を巡る熾烈な競争が存在する。この競争は、資本力のある企業や個人が、より高性能なトークンを優先的に獲得できるという、新たな経済格差を生み出す可能性を秘めている。
トークンの価格は劇的に低下している。例えば、GPT-4クラスのモデルを実行するコストは、DeepSeekの登場により600分の1になった。しかし、誰も旧世代のモデルには興味を示さない。人々は、より高価だが、より少ないトークンで複雑なタスクを完了できるフロンティアモデルを求める。結果として、トークンあたりの価格は下がっても、総支出額は増加の一途をたどる。Patelは、この状況を「トークンのアービトラージ(裁定取引)」と表現する。ビジネスの本質は、高価なトークンを購入し、それを最も価値の高いタスクに振り向け、その差額で利益を得ることになる。そして、モデルの能力向上ペースが加速しているため、このアービトラージの機会は今後も拡大し続けると予測する。
Mythosが示す恐怖:実装コストの消滅とアイデアの価値逆転
AnthropicのMythosは、単なる性能向上以上の衝撃をPatelに与えた。それは「恐怖」だったと彼は率直に認める。Anthropicは2025年末までに「L4レベルのソフトウェアエンジニア」をモデルに実現することを目標としていたが、Opus 4.6で既にそれを達成し、Mythosに至っては「L6エンジニア」に相当する能力を示した。しかも、このL4からL6への飛躍は、わずか2ヶ月で達成された。モデルのリリースサイクルは、かつての6ヶ月から2ヶ月へと短縮されている。この加速の原動力は、モデル研究における「実装」の容易さにあるとPatelは分析する。優れたアイデアを持つ研究者は多いが、それを実際にモデルに実装するのは非常に困難だった。しかし、AI自身がコード生成を支援することで、この実装コストが劇的に低下した。その結果、より多くのアイデアをより速く試すことが可能になり、モデルの進化が加速しているのだ。
この「実装コストの消滅」は、経済の根本的な構造を変える。かつては「アイデアは安く、実行は難しい」というのが常識だった。しかし今や「アイデアは安く、実行も安い」という世界が到来しつつある。そうなると、真に価値を持つのは「どのアイデアを選ぶか」という判断力と、そのアイデアを実現するための「資本を調達する能力」、そしてAIが生み出した成果物を「販売する能力」だけになる。Patelは、この変化が社会に不安定さをもたらすと警告する。なぜなら、最高のモデルへのアクセスは、一部の資本力のある企業や個人に限定される可能性が高いからだ。AnthropicがMythosを一部のサイバーセキュリティ企業にのみ限定提供したように、モデルの公開範囲は今後さらに狭まるとPatelは予測する。
Ken Griffin(CitadelのCEO)のような超富裕層が、OpenAIやAnthropicと「年間100億トークンを最初に購入する権利」を契約する未来は、もはやSFではない。そうなれば、彼らは市場で他を圧倒する情報優位を得ることになる。Patelは、自身の会社SemiAnalysisでさえ、Anthropicとのエンタープライズ契約と良好な関係によって、競合他社よりも早く新モデルにアクセスできることを期待していると率直に語る。この「トークンへのアクセス権」を巡る競争は、情報サービス業界のみならず、あらゆる産業で勝者と敗者を二分するだろう。そして、この集中が進むにつれて、社会の分断はさらに深まる可能性がある。
ロボティクス:次の需要の波とソフトウェアだけの特異点の限界
現在、トークンの需要は主にソフトウェア領域で発生しているが、Patelは次の大きな需要の波は「ロボティクス」から来ると予測する。彼は「ソフトウェアだけの特異点(Software-only Singularity)」という概念を批判する。世界の大部分は物理的なもので構成されており、ソフトウェアだけが進化しても、工場、物流、医療、建設といった物理世界の生産性は向上しないからだ。ロボットが難しい理由は、マイクロコントローラやアクチュエータのプログラミングが複雑だからだが、AIモデルがこの分野に進出しつつある。現在主流のVLA(Vision-Language-Action)モデルはデータ効率が悪く、大規模な事前学習には向いていない。しかし、人間のように少数の例から学習できる「Few-shot Learning」のブレークスルーが、今後6〜18ヶ月以内に起こるとPatelは見ている。
そのブレークスルーが実現すれば、汎用ロボットに特定のタスク(例えば「黒板を消す」「衣類をたたむ」)を数例見せるだけで、その作業を習得できるようになる。そうなれば、ロボットは特定の用途に特化したレンタルサービスとして、あるいは標準ロボットにダウンロード可能な「スキルパッケージ」として爆発的に普及するだろう。これにより、物理的な財の生産コストが劇的に低下し、強力なデフレ圧力が働く。そして、このロボットの推論に必要なトークン需要は、現在のソフトウェア需要をはるかに上回る規模になるとPatelは予測する。つまり、トークン需要の拡大に終わりはないというのが彼の見解だ。
スケーリング則の継続とOpenAI vs. Anthropicの構図
Mythosの成功は、より多くの計算資源を投入すればモデルが賢くなるという「スケーリング則」が依然として有効であることを証明したとPatelは言う。Mythosは明らかに以前のモデルよりも大規模であり、10万台のBlackwell GPU(NVIDIAの次世代チップ)に相当する計算資源で訓練された。同時に、モデルの効率化も進んでおり、同じ性能を達成するためのコストは数ヶ月ごとに劇的に低下している。この「規模の拡大」と「効率の向上」の二つのトレンドが、モデルの能力を前例のない速度で押し上げている。
興味深いのは、この文脈におけるOpenAIとAnthropicの戦略の違いだ。ここ数ヶ月、AnthropicがMythosやOpus 4.7で話題を独占する一方、OpenAIは目立ったリリースがない。このため、「Anthropicが勝ち、OpenAIは終わった」という見方が一部にある。しかしPatelは、この見方は短絡的だと指摘する。Anthropicはコンピューティングリソースに深刻な制約を抱えており、需要に応えきれていない。一方、OpenAIは「無謀なまでに」積極的にコンピューティングリソースを確保してきた。Oracle、CoreWeave、SoftBank、Microsoft、Amazon(Trainium)など、あらゆる手段を使って計算能力を拡大している。その結果、AnthropicがMythosで70%以上の粗利率を享受している間にも、OpenAIはすぐに同等のモデルをリリースし、50%の粗利率でも膨大な需要を獲得できる立場にある。
重要なのは、トップレベルのモデルだけでなく、第2、第3のラボでさえも、トークンの供給が需要に追いつかない「売り手市場」になるという点だ。経済価値を生み出す最高のモデルの能力は、そのトークンを供給するインフラの構築速度を上回って成長している。このギャップは拡大し続け、モデルラボの利益率はさらに上昇するだろう。そして、ハードウェアサプライチェーン全体がこの需給ギャップに気づき、価格を引き上げ始める。これが、現在進行中の「トークン経済」の全体像だとPatelは説明する。
供給側のボトルネック:メモリ、ロジック、そして装置
需要が爆発的に拡大する一方で、供給側は至る所でボトルネックに直面している。Patelは、歴史的に「供給不足の後には必ず過剰供給(glut)が来る」という格言を引用しつつも、今回は状況が異なると指摘する。サプライチェーンがかつてないほど複雑化し、リードタイムが長期化しているからだ。特に深刻なのがメモリ(DRAM)だ。メモリの製造能力は年率20〜30%程度しか増やせず、需要シグナルを受けてから実際に増産が実現するまでには2027年後半から2028年までかかる。その結果、DRAM価格は既に高騰しているが、Patelは「ここからさらに倍か3倍になる」と予測する。需要を破壊し、他の用途から容量を奪うためには、それだけの価格上昇が必要だからだ。
ロジック半導体(TSMC)も大きな能力不足に直面している。TSMCは2025年の設備投資を560億ドルと発表しているが、Patelは2028年には1000億ドルに達する可能性があると見る。この急拡大は、下流の装置メーカー(Lam Research、Applied Materials、ASML)や、さらにその先の部品メーカー(MKSIなど)に鞭打ち効果(bullwhip effect)をもたらす。つまり、需要の変動がサプライチェーンを遡るほどに増幅されるのだ。GPUだけでなく、CPUも深刻な供給不足に陥っている。その理由は二つある。第一に、強化学習(Reinforcement Learning)では、モデルが試行錯誤する環境(environment)をCPUで実行する必要がある。第二に、AIが生成したコードやアウトプットを実際に動かすサーバーもCPUを必要とする。つまり、AIの普及はGPUだけでなく、CPUへの需要も爆発的に増加させているのだ。
これらのボトルネックは、サプライチェーン全体に利益をもたらしている。NVIDIAは依然として75%の粗利率を維持し、クラウド事業者の利益率も拡大している。メモリメーカーの利益率は急上昇し、装置メーカーは大型の前払い金を受け取ることで投下資本利益率(ROIC)を向上させている。Patelは、この状況を「脈のあるものは何でも売り切れで、人々は将来の供給を巡って前金を支払っている」と表現する。この需給逼迫は、少なくともあと数年は続く見通しであり、AIインフラへの投資は今後も拡大の一途をたどるだろう。
トークノミクスの難しさとAIへの社会的反発
Patelは、自身が最も理解に苦しんでいる分野として「トークノミクス(Tokenomics)」、つまりトークンの経済学を挙げる。インフラのコストやモデルの限界利益率を計算することは得意だが、実際の「使用量と普及度」をモデル化することが極めて困難だと認める。Anthropicの売上高が月に100億ドルも増加する現象を、誰も正確に予測できていない。誰が、何のために、これほど大量のトークンを使っているのか。そして、それらのトークンが生み出した価値は、GDP統計にどのように現れるのか。Patel自身の会社が生み出すGDPは微々たるものだが、彼の分析が顧客の投資判断に与える影響は計り知れない。この「Phantom GDP」を測定することが、今後の経済分析における最大の課題だと彼は指摘する。
最後に、Patelは予想外のトピックとして「大規模な抗議運動」の発生を予測する。AIに対する世論の冷たさは、アイスクリームや政治家よりも低いと彼は言う。Sam Altmanの自宅に火炎瓶が投げ込まれた事件がネット上で歓迎されている現状は、その象徴だ。AI業界のリーダーたち(Sam AltmanやDario Amodei)は、インタビューで未来の脅威を語りすぎており、一般人の恐怖を煽っているとPatelは批判する。彼らがすべきことは、AIが現在どのように人々の生活を向上させているかという「 uplifting(心を高揚させる)なストーリー」を発信することだ。しかし現状では、AI企業は「世界を変える秘密結社」として認識され、データセンター建設による環境破壊の象徴と見なされている。この認識を変えなければ、社会的な反発はさらに強まり、業界の成長そのものが脅かされる可能性があるとPatelは警告する。
結びに
本エピソードの核心は、AIトークンを巡る「需給の不均衡」が、単なる一時的な現象ではなく、経済の構造そのものを変革する力を持っているという点にある。Dylan Patelの具体的な事例は、この変革がすでに現場レベルで始まっていることを生々しく伝えている。特に印象的なのは、彼が「恐怖」と表現したMythosの登場だ。それは、技術の進歩に対する畏怖であると同時に、その恩恵が一部の資本に集中する未来への懸念でもある。トークンへのアクセス権が新たな権力の源泉となりつつある世界で、ビジネスリーダーは「どのモデルを使うか」という戦略的選択を迫られている。そして、この選択を誤れば、永久に「下層階級(permanent underclass)」に留まることになるとPatelは警告する。このエピソードは、AI時代の勝者と敗者を分ける分水嶺が、まさに今、引かれようとしていることを示している。
要点
- SemiAnalysisのAI支出は、昨年の数万ドルから現在は年換算700万ドルに急増。給与総額の25%を超え、年内に100%を超える可能性がある。
- 非技術者を含む全社員がClaude Codeを活用し、かつては専門チームの仕事だった作業を個人が数週間で完了する「Claude Psychosis」が発生している。
- AnthropicのMythosは、ここ2年で最大のモデル能力の飛躍であり、L4からL6エンジニアへの進化をわずか2ヶ月で達成した。
- 実装コストの劇的な低下により、アイデアの価値と実行力のバランスが逆転。「どのアイデアを選ぶか」という判断力と資本力が、新たな競争優位の源泉となる。
- トップモデルへのアクセスは資本力のある企業に限定されつつあり、Ken Griffinのような超富裕層が「最初の100億トークンを購入する権利」を契約する未来が現実味を帯びている。
- ロボティクスは次のトークン需要の波であり、6〜18ヶ月以内にFew-shot Learningのブレークスルーが起こり、物理世界の生産性を劇的に向上させる可能性がある。
- 供給側では、DRAM価格が今後さらに倍増か3倍になると予測され、TSMCの設備投資は2028年に1000億ドルに達する可能性がある。CPUも深刻な供給不足に陥っている。
- AI業界のリーダーは、未来の脅威を語るのではなく、現在の具体的な恩恵を発信する必要がある。さもなければ、大規模な社会的反発が業界の成長を阻害するリスクがある。