motpod
Latent Space: AIエンジニアポッドキャスト · 2026年5月22日

AIE Europe Debrief + Agent Labs Thesis: Unsupervised Learning × Latent Space クロスオーバースペシャル (2026)

AI generated article / ja / study
この記事でわかること
  • AIエンジニア向けポッドキャスト「Latent Space」と、AIスタートアップ投資家Jacob Effronがホストを務める「Unsupervised Learnin...
  • swyxは、AIエンジニアリングの現状を象徴するキーワードとして「OpenClaw」「Harness Engineering」「Context Engineering」を...
  • [0:00] AIエンジニアリングの最前線:ハーネス、コンテキスト、そして安定化の兆し swyxは、ロンドンで開催されたAIE Europeから戻ったばかりであり、同カン...
こんな人向け

自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。

出典Podcast

Latent Space: AIエンジニアポッドキャスト / Latent.Space

Read
Open episodeFind more episodes

AIエンジニア向けポッドキャスト「Latent Space」と、AIスタートアップ投資家Jacob Effronがホストを務める「Unsupervised Learning」のクロスオーバー特別編。本エピソードは、2025年のAIE Europe開催直後、CursorとxAIの提携発表前に収録された。ホストのswyx(Shawn Wang)は、AIエンジニアリングの最前線に身を置く観測者として、エージェント、インフラ、コーディング戦争、そしてAI業界全体の構造変化について、自身の最新の見解を余すところなく語っている。前回のクロスオーバーから1年が経過し、AI業界は「能力探求」のフェーズから、効率化と専門化のフェーズへと移行しつつある。本稿では、この密度の高い議論を、テーマごとに整理し、深掘りする。

swyxは、AIエンジニアリングの現状を象徴するキーワードとして「OpenClaw」「Harness Engineering」「Context Engineering」を挙げる。特にHarness(ハーネス)は、エージェントのための最小限のパッケージング形式として「スキル」という概念に収束しつつあり、AIインフラがようやく安定化の兆しを見せているという見方を示す。一方で、インフラ企業は毎年のように自らを再発明する必要に迫られてきたのに対し、アプリケーション企業はエンドユーザーとの関係性を盾に、モデルの変動に耐えてきたという対比も浮き彫りになる。議論は、垂直特化型スタートアップと水平型プラットフォームの優位性、エージェント向けに製品を設計する際の新たな原則、そしてAIコーディング市場の現状と未来へと展開する。特に、AnthropicのClaude Code、OpenAIのCodex、Cursor、Cognitionといったプレイヤーがひしめくコーディング戦争は、他のAI市場の未来を予見する縮図として詳細に分析される。さらに、基盤モデルがスタートアップの領域を侵食するリスク、AIネイティブな社員と従来型のSaaSを信奉する社員の間の社内文化戦争、メモリとパーソナライゼーションの重要性、そして世界モデルがもたらす知能の新たな次元まで、多岐にわたるテーマが議論された。

0:00AIエンジニアリングの最前線:ハーネス、コンテキスト、そして安定化の兆し

swyxは、ロンドンで開催されたAIE Europeから戻ったばかりであり、同カンファレンスのトラック構成こそが、現在のAIエンジニアリングコミュニティの関心を如実に反映していると語る。最優先のトピックは「OpenClaw」であり、そのすぐ下に「Harness Engineering」と「Context Engineering」が位置する。これらはエージェントとRAGに関連するテーマであり、さらにその下に評価(evals)、オブザーバビリティ、GPU、LLMインフラといった evergreen なトピックが続く。この序列は、コミュニティが今、何に最も熱心に取り組んでいるかを示している。

特に「Harness」という概念の進化は注目に値する。LangChainのCEOであるHarrison Chaseが「AIインフラがついに安定した」と述べたことに対し、swyxは慎重な同意を示す。過去数年間、LangChainはLangChain、LangGraph、そしてエージェントへと、毎年のように自社の製品定義を変えてきた。しかし、現在エージェントのための統合パッケージング形式として「スキル」、すなわち「スクリプトが添付されたマークダウンファイル」という最小限のフォーマットがコンセンサスを得つつある。これ以上シンプルな形式は考えにくく、この点においては安定化の主張には一定の根拠があるとswyxは評価する。ただし、リアルタイム要素やサブエージェント、メモリといった分野ではさらなる適応が必要になる可能性も指摘する。

swyxは、このようなインフラの安定化が、アプリケーション企業とインフラ企業でその意味合いが大きく異なることを強調する。アプリケーション企業、例えばSierraのBret TaylorやLigoraのMaxineは、モデルの進化に合わせて3ヶ月ごとに全てを捨てる覚悟で構築している。彼らにはエンドユーザーという粘着性の高い顧客基盤があるため、再構築の機会が与えられる。一方、インフラ企業は開発者というより気まぐれな顧客を相手に、常に自らを再発明し続けなければならない。データベースであっても、ワークロードの移行は可能であり、参入障壁は低い。この対比は、AIスタートアップにおける垂直統合型と水平プラットフォーム型の優位性の議論に直結する。

1:32エージェントラボのプレイブック:ドメイン特化モデル訓練の現実

AI企業が自社でモデルを訓練すべきかという問いに対して、swyxは「エージェントラボのプレイブック」という明確なフレームワークを提示する。これは、まず最先端の汎用基盤モデルからスタートし、特定のドメインに特化させる。そして、十分なワークロードと高品質なユーザーデータが蓄積された段階で、初めて自社モデルの訓練に踏み切るという戦略である。このアプローチにより、コストとレイテンシの大幅な削減が可能になる。swyx自身が関与するCognitionや、Cursorが自社モデル訓練に乗り出しているのは、このプレイブックの実践例である。

swyxは、自社モデル訓練には「マーケティング上のボーナス」と「実際の価値」の両方が存在すると指摘する。例えば、CursorのComposer 2やCognitionのSui 1.6は、補助金なしの公正な市場において、ユーザーが自発的に選択するトップ5モデルにランクインしている。これは、単なるマーケティングではなく、実際にユーザーに価値を提供している証拠である。特に検索のようなドメイン特化型モデルは、両社にとって極めて理にかなった戦略であり、そのためのインフラ(Thinking Machines、Prime Intellectなど)も整備されつつある。これは「苦い教訓」の逆転現象であり、まず大きな汎用モデルで規模を拡大し、その後、量は多いがバリエーションの少ない明確なワークロードに対して、より小型で効率的なモデルに蒸留するという流れである。

一方で、swyxは「DIY強化学習(RL)」のユースケースについては、より慎重な見方を示す。品質向上を目的としたRLは、コスト削減を目的とした蒸留とは異なり、その効果が持続するかどうかは不透明である。2〜3年前に自社で事前学習を行い、ドメイン特化で優れた成果を主張した企業が、その後のモデル進化によって次々と敗れ去った事例がある。同様のストーリーがRLの分野でも繰り返される可能性があるとswyxは指摘する。重要なのは、品質を一定に保つか、あるいは多少の品質低下を許容してもコストを劇的に削減することであり、このトレードオフは全ての企業に共通する普遍的な課題である。

9:43オープンモデルと代替チップへの転換:swyxの認識変化

swyxは、過去1年間で自身の見解を最も大きく変えた点として、オープンモデルに対する姿勢を挙げる。以前は、BraintrustのAnkur Goyalのデータを引用し、オープンソースモデルの市場シェアは5%で減少傾向にあると述べていた。しかし現在は、そのシェアは上昇傾向にあると見ている。確かに、公開ベンチマーク上ではクローズドモデルとの能力格差が拡大しているように見えるが、ベンチマークのゲームが容易である以上、その実態は不明瞭である。OpenRouterの統計を見ると、オープンモデルは確かに相当なボリュームで利用されているが、その多くが大幅に割引された価格で提供されているため、価格調整を考慮する必要がある。それでもなお、swyxの関心領域であるトップ20%の企業群は、間違いなくオープンモデルへと移行している。FireworksやTogether AIといった企業は好調であり、ファインチューニングサービスも復活しつつある。

このオープンモデルへの流れを加速させる要因の一つが、NVIDIA以外のカスタムチップの台頭である。Cerebras、Thales、さらにはGroq(swyxはGroqと発言)など、非NVIDIAハードウェアへの注目が急激に高まっている。swyxは、かつては「推論速度が100トークン/秒から200トークン/秒になっても、たかが2倍だ」と懐疑的だった。しかし、10倍の速度向上は全く新しい利用パターンを生み出すという確かな証拠がThalesなどの事例で示されている。数千トークン/秒という速度は、品質と速度のトレードオフを根本から変える可能性を秘めており、どのようなアプリケーションが出現するかは予測不能である。swyxは、この投資サイクルは複数年にわたるものであり、早期に軽視すべきではないと警告する。

11:32エージェントへの販売:API、ドキュメント、そしてメモリの時代

AIインフラの顧客が、人間からエージェントへとシフトしているという現象は、製品設計の根本的な問いを投げかける。VercelのCTOであるMalte Ublがswyxのカンファレンスで明らかにした統計によれば、Vercelの管理アプリケーションへのトラフィックの60%は、もはや人間ではなくボット(主にコーディングエージェント)である。swyxは、この状況に対して「APIとして存在しないものは、存在しないも同然である」と断言する。これは良い衛生状態であり、製品チームはUIだけでなく、CLIやAPIの整備に注力すべきである。

swyxは、NetlifyのMatt Billmanが提唱する「Agent Experience(AX)」という概念について、本質的には従来から言われてきた「Developer Experience(DX)」と変わらないと指摘する。優れたドキュメント、一貫性のあるステートレスなAPI、発見可能性の高い設計は、人間の開発者にとってもエージェントにとっても同様に重要である。エージェント向けの最適化にエネルギーが注がれるようになったことは歓迎すべきだが、チャットボットを「ゲーム」するための特別な戦略(AEOのようなもの)を追求する必要はおそらくない。

しかし、この状況は、事前学習データに含まれる既存企業に大きなアドバンテージをもたらす。エージェントがデフォルトで推奨するサービスは、訓練データ内での言及頻度に大きく依存するからである。例えば、ある調査では、Claudeに「メールプロバイダーを教えて」と尋ねると、70%のケースでResendが推奨されたという。このように、短期間で言及頻度を獲得した新興企業が優位に立つケースも存在する。swyxは、この「言及頻度」による選択は、将来的にはより高度な「メモリ」と「パーソナライゼーション」のシステムに取って代わられると予測する。製品選択は、単なるキーワードの出現頻度ではなく、ユーザー個人の行動履歴や好みを記憶したパーソナライズドシステムによって決定されるようになるだろう。これこそが、次の大きな競争の軸になるとswyxは見ている。

16:50AIコーディング戦争の現状:巨大市場、製品の粘着性、そして未来

AIコーディング市場は、他のあらゆるAIアプリケーション市場の未来を予見する「母なる市場」として、特別な注目を集めている。swyxは、この市場の規模感を具体的な数字で示す。AnthropicのClaude Codeは年間経常収益(ARR)で25億ドル、OpenAIのCodexは推定20億ドル、Cursorも20億ドルと噂されている。これらの数字は、過去1年足らずで創出されたものであり、その成長速度は驚異的である。Claude Codeは、その1周年を祝ったばかりであり、このカテゴリーの歴史の浅さを物語っている。

swyxは、現在の市場は「能力探求」のフェーズにあり、効率性よりも創造性と支出の多さが報われると分析する。企業は、従業員に「これだけのトークンを使った」という実績を示すことを求められており、品質よりも量が重視される傾向にある。これは、クラフトマンシップを重んじる者にとっては不愉快かもしれないが、AIの過小利用が是正される過渡期としては許容範囲である。OpenAIのRyanという人物が1日10億トークンを消費している事例は象徴的であり、市場価格で1万ドル相当のAPIトークンを消費している。彼の出力の多くは「スロップ(粗製濫造)」かもしれないが、その膨大な実験量によって、他の誰よりも早く新たな能力を発見する可能性が高い。

この市場の終着点について、swyxは「2大プレイヤーと、彼らがカバーしないニッチなユースケースを狙うロングテール企業」という現状維持が最も可能性の高いシナリオだと予測する。市場構造を大きく変えるには、Microsoft(GitHub)、Mistral、xAI、中国のラボといった強力なプレイヤーが本格的に参入する必要がある。しかし、現時点ではその兆候は見られない。興味深いのは、Claude Codeが先発製品としての優位性を維持している点である。Codexも遜色ない品質であるにもかかわらず、最初に魔法のような体験を提供した製品の粘着性は、想定以上に高い。swyxは、この「最初の魔法」の効果は、ChatGPTが消費者向けAIで示した先発優位性と類似していると指摘する。ただし、消費者向けAI市場全体が頭打ちになりつつあるのに対し、コーディング市場は依然として急成長を続けているという違いがある。

33:18コーディングエージェントの封じ込め突破:2026年のテーゼ

swyxは、2025年が「コーディングエージェントの年」であったならば、2026年は「コーディングエージェントが封じ込めを突破し、他のあらゆることを行う年」になるという大胆なテーゼを提示する。コーディングエージェントはソフトウェアを生成し、ソフトウェアは世界を飲み込む。したがって、「コーディングエージェントがソフトウェアを飲み込み、ソフトウェアが世界を飲み込む」という連鎖により、コーディングエージェントは間接的に世界を飲み込むことになる。これは、消費者向けエージェントやComputer Useといった新たな製品体験の創出につながる可能性を秘めている。

このテーゼの延長線上にあるのが、「ダークファクトリー」という概念である。これは、Simon Willisonが提唱した用語で、AIによるコード生成の高度な段階を指す。最初の段階は「人間が書いたコードがゼロ」であり、これはCognitionが5ヶ月前に実現し、今では一般的になりつつある。次のフロンティアは「人間によるレビューがゼロ」、すなわちコードレビューなしでそのままチェックインすることである。OpenAIがこの領域を探求しており、swyxはこれこそが唯一のスケーラブルな方法だと主張する。そのためには、従来のソフトウェア開発ライフサイクル(SDLC)を根本から見直し、より多くのテストと自動検証を組み込む必要がある。この「ゼロレビュー」を達成した企業は、これまでにない量のソフトウェアを生産し、その圧倒的な量が品質の向上につながるという好循環を生み出すことができる。多くの人は「量はスロップを生む」と考えるが、swyxは「量が質を生む」という逆説的な未来を予見している。

35:32AI vs SaaS:社内文化戦争とミッドサイズスタートアップの危機

基盤モデルがスタートアップのカテゴリーを次々と「食べてしまう」リスクについて、swyxは驚くほど楽観的である。彼の見解は、スタートアップの規模によって大きく異なる。ごく初期のスタートアップにとって、最悪のシナリオは、その分野の大手ラボに買収されるか、主要メンバーが引き抜かれることである。つまり、「何かをやってみる」こと自体が、ラボへの最高の就職活動になる。したがって、小さなスタートアップにとってのリスクは限定的である。しかし、「ミッドサイズのスタートアップ」は深刻な脅威に直面している。すでにLangfuseのようなLLMインフラ企業の統合が進んでおり、ドメイン特化型のプレイブックが確立されつつある。この層の企業は、最も脆弱な立場にあると言える。

swyxが最も危機感を抱いているのは、従来型のSaaS企業である。彼自身、自社のイベント管理・スポンサー管理SaaSに年間20万ドルを支払っている経験から、この問題を「非常に内臓的なレベルで」考えている。彼は、おそらく2,000ドルでカスタム版を構築できると確信しているが、問題は技術面ではなく、組織面にある。AIネイティブな社員は、高価なSaaSを「Vibe Coding」で置き換えることを主張する。彼らは「CRMの構築には膨大な労力がかかる」という反論を「過去の30人の起業家も同じことを言って失敗した」という古典的な過小評価だと切り捨てる。一方、従来型のエンジニアは、週末で作られた「80%の解決策」が、残りの20%の負担をチームに押し付ける「スロップ」に過ぎないと批判する。この「LLM精神病(LLM psychosis)」の度合いの差が、企業内に深刻な亀裂を生み出している。swyxは、この社内文化戦争こそが、AI導入の最大の障壁の一つであると指摘する。彼自身も、チームを説得できずに決断を先延ばしにしている状況を認めつつ、「1年は遅らせても、5年は遅らせられない」と、SaaSが確実に圧迫されている現実を語る。

40:13バイオセーフティ、セキュリティ、そして巨大モデルの時代

AnthropicのCPOであるMike Kriegerとの夕食会でのエピソードは、AIのリスクに関する興味深い議論を提供する。swyxは、Geoffrey Hintonが警鐘を鳴らす「自宅で誰でも人類の半分を絶滅させるウイルスを製造できる」というバイオセーフティのリスクを提起した。しかし、Kriegerは「実際にはセキュリティの方が重要だ」と反論した。swyxは、Anthropicのモデルリリース戦略(特定企業への限定公開)は、優れたマーケティングであると同時に、真のセキュリティ問題を浮き彫りにしていると指摘する。40社の企業にモデルを提供し、各社に1万人の従業員がいれば、それはもはや「プライベートモデル」とは言えない。悪意のある内部関係者が存在する可能性は否定できない。この議論は、OpenAIの「広くアクセスを開放する」という哲学と、Anthropicの「製品とモデルをバンドルし、アクセスを制限する」という戦略の違いを浮き彫りにする。

10兆パラメータを超える巨大モデルの登場について、swyxは「一時的な現象」と見る。今後3〜5年で、さらに大規模なコンピュートクラスターがオンライン化することは既に決定事項であり、モデルサイズの制限は一時的なものに過ぎない。彼は、GoogleがGemini Ultraをリリースせず、ProとFlashのみを提供している事例を挙げ、ラボは最も強力なモデルを「地下室にしまい」、そこから蒸留(distillation)を行っているのではないかと推測する。これは、コストパフォーマンスの観点から合理的な戦略である。しかし、パラメータ数のスケーリングがいつまで続くのかは不明であり、次の1000倍、100万倍の性能向上をこのパラダイムで達成できるとは考えにくい。swyxは、世界の大部分をデータセンターに変えてしまうようなスケーリングの終着点に疑問を呈し、新たなスケーリング則の必要性を示唆する。

44:28メモリと世界モデル:次のフロンティア

swyxは、AIの未解決問題として、メモリと世界モデルの二つを挙げる。まず、メモリについて、彼は「コンテキスト長はLLMにおいて最もスケーリングが遅い要素である」と断言する。4,000トークンから100万トークンへの進化に3年を要したが、Geminiが100万トークンのコンテキストを提供してから2年が経過しても、誰もそれを活用していない。これは、単にコンテキストウィンドウを拡大するだけでは不十分であり、真の「メモリ」と「パーソナライゼーション」のシステムが必要であることを示している。

次に、世界モデルについて、swyxはFei-Fei Li(李飛飛)の「空間知能(Spatial Intelligence)」に関するエッセイを強く推奨する。LLMは「グッド・ウィル・ハンティング」のマット・デイモンのように、本で読んだ知識は全て知っているが、実際に経験したことは何もない。世界モデルは、単なる質問応答を超えた、物質や物理を理解する「知能」の概念そのものを問い直すものである。swyxは、世界モデルをロボティクスやゲームと同一視することに警鐘を鳴らす。それらは現在の顕在化の一つに過ぎず、本当に重要なのは、AIが「テーブルとは何か」「物質とは何か」「物理とは何か」を理解するかどうかという、より深遠な問いである。彼は、この分野の最新動向として「敵対的世界モデル(Adversarial World Models)」に関する記事が、Latent Spaceで今年最も読まれた記事の一つであることを紹介している。

結びに

本エピソードは、AIエンジニアリングの最前線に立つ観測者であるswyxの、生の声を届ける貴重な機会となった。彼の語り口は、単なるトレンド解説に留まらず、自らが関与するスタートアップの内情や、投資家としての視点、そしてAI業界の構造を読み解く独自のフレームワークに満ちている。特に、「エージェントラボのプレイブック」「コーディングエージェントの封じ込め突破」「ダークファクトリー」といった彼のテーゼは、今後のAI業界を理解する上で強力なレンズとなるだろう。また、AI vs SaaSの社内文化戦争や、バイオセーフティとセキュリティのトレードオフといった、技術以外の人間的・社会的な課題にまで踏み込んだ議論は、AIが実社会に浸透するにつれて顕在化するであろう本質的な問題を浮き彫りにしている。このエピソードは、単なる現状報告ではなく、2026年以降のAIの進化を予測し、その波に乗るための戦略を考える上で、示唆に富む内容である。

要点

  • swyxは、AIインフラの安定化の兆しとして、エージェントのパッケージング形式が「スキル」(マークダウン+スクリプト)に収束しつつあると指摘。しかし、インフラ企業は依然としてアプリケーション企業よりも脆弱な立場にある。
  • 「エージェントラボのプレイブック」は、まず汎用モデルでスタートし、十分なデータとワークロードが蓄積された段階で自社モデル訓練に移行する戦略。CursorやCognitionの事例は、これがマーケティングではなく実際の価値を生んでいる証拠である。
  • swyxはオープンモデルに対する見方を「弱気」から「強気」に転換。その背景には、NVIDIA以外のカスタムチップ(Cerebras、Thalesなど)による10倍以上の推論速度向上があり、新たなアプリケーションを創出する可能性を秘めている。
  • エージェントが主要顧客となる時代、製品はAPIとして存在しなければ意味がない。エージェントエクスペリエンス(AX)の本質は、従来のデベロッパーエクスペリエンス(DX)の徹底に他ならない。
  • AIコーディング市場は、Claude Code(ARR 25億ドル)、Codex(同20億ドル)、Cursor(同20億ドル)という巨大市場に成長。現在は「能力探求」フェーズにあり、効率より量が報われる。
  • swyxは2026年を「コーディングエージェントが封じ込めを突破する年」と予測。その先には「人間によるレビューがゼロ」の「ダークファクトリー」が到来し、ソフトウェア開発のパラダイムが根本から変わる。
  • 基盤モデルによるスタートアップの「食尽」リスクは、ミッドサイズのスタートアップと従来型SaaSに集中。AIネイティブな社員と従来型社員の間の「LLM精神病」の差は、企業内に深刻な文化戦争を引き起こしている。
  • 真の「メモリ」と「パーソナライゼーション」、そしてFei-Fei Liが提唱する「空間知能」を備えた「世界モデル」が、次のAIフロンティアである。コンテキスト長のスケーリングだけでは、この課題は解決できない。