
世界を動かすPhysical AI — Qasar Younis & Peter Ludwig, Applied Intuition
- Applied Intuition(アプライド・インテュイション)は、評価額150億ドルを超えるフィジカルAI企業である。同社の共同創業者であるQasar Younis(...
- 同社の技術は、シミュレーションと強化学習インフラ、車両用オペレーティングシステム、そして基礎的なAIモデルという3つの大きな柱から構成される。創業当初はロボタクシー企業向...
- [0:00] フィジカルAIとスクリーンAIの本質的な違い Qasar Younisは、現在のAIブームの多くが「スクリーンの中」で完結するLLMに集中していると指摘する...
自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。
Latent Space: AIエンジニアのポッドキャスト / Latent.Space
Applied Intuition(アプライド・インテュイション)は、評価額150億ドルを超えるフィジカルAI企業である。同社の共同創業者であるQasar Younis(CEO)とPeter Ludwig(CTO)が、Latent Spaceに出演し、創業から10年にわたる歩みと、自動運転、建設・鉱山機械、農業、防衛といった多岐にわたる産業へのAI展開の現状を語った。彼らのミッションは「より安全で豊かな世界のためのフィジカルAIを構築すること」であり、単なるLLMを車輪に載せるのではなく、現実の物理的な制約(安全性、レイテンシ、電力、コスト)の中でAIを実運用するためのプラットフォームを提供している。現在、世界の非中国系自動車メーカーのトップ20社中18社が同社の技術を採用しており、日本では実際にL4レベルのドライバーレストラックが走行中である。
同社の技術は、シミュレーションと強化学習インフラ、車両用オペレーティングシステム、そして基礎的なAIモデルという3つの大きな柱から構成される。創業当初はロボタクシー企業向けのツール企業としてスタートしたが、現在では30以上の製品を擁するプラットフォーム企業へと進化した。特筆すべきは、同社が「物理機械のためのAndroid」を目指している点である。現在の車両や機械のソフトウェアスタックは、スマートフォンがAndroidやiOSによって統一される前の状態と同様に極めて断片化されており、Applied Intuitionはそのプラットフォームレイヤーを統合しようとしている。エンジニアリング組織の83%がエンジニアであり、社内ではCursorやClaude CodeといったAIコーディングツールの導入が積極的に進められている。
フィジカルAIとスクリーンAIの本質的な違い
Qasar Younisは、現在のAIブームの多くが「スクリーンの中」で完結するLLMに集中していると指摘する。コード補完やチャットボットは、たとえ間違いを犯しても大きな実害は生じにくい。しかし、フィジカルAIが扱うのはスクリーンを持たない物理的な機械であり、その動作環境は「安全クリティカル(safety-critical)」である。この2つの言葉が、すべての設計思想を変える。学習されたシステムは本質的に誤りを犯す可能性があるが、時速80kmで走行するトラックや、人命に関わる建設機械では、その誤りが許容されない。
この違いは、検証と妥当性確認(Verification & Validation)の方法論に根本的な変化をもたらした。従来の自動車業界では、Euro NCAPのような規制テストに代表される「パス/フェイル」の二値的な評価が主流だった。しかし、エンドツーエンドのニューラルネットワークモデルが導入されるようになると、評価は統計的なものへと移行した。重要なのは「何ナイン(nines)の信頼性があるか」、すなわち「平均故障間隔(MTBF)」がどの程度かという指標になる。これは、従来のソフトウェア工学とは異なる、まったく新しいパラダイムである。
この統計的な安全性の考え方は、規制当局や一般社会の受容という難しい問題をはらんでいる。Cruiseの事故は、技術的な失敗というよりも、規制当局との関係構築と企業行動の失敗が致命的だったと両氏は分析する。一方でWaymoは、業界に対して高いベンチマークを設定し、責任ある形で技術を展開していると評価する。人間のドライバーよりも統計的に安全であることは明らかでも、社会が「単一の事故」をどう受け止めるかという感情的な問題が、フィジカルAIの普及における最大の障壁の一つである。
創業の原点:ツール企業からプラットフォーム企業への進化
Applied Intuitionは、しばしばScale AIと比較されるが、両社のビジネスモデルは根本的に異なる。Scaleがデータラベリングのサービス企業であるのに対し、Applied Intuitionは創業時から「テクノロジー企業」であり、特にデベロッパーツールに重点を置いてきた。Qasarは、2016〜2017年当時、VC業界では「ツールは単なるワークフローであり、本質的に面白くない」という見方が支配的で、ツール系スタートアップは流行ではなかったと振り返る。しかし、AIブームによってツールとワークフローの価値が再評価され、現在では状況が一変した。
創業から10年の間に、同社の技術スタックは約2年ごとに完全な進化を遂げてきた。Peter Ludwigは、エンジニアリング組織として「2年先の技術的変化を見据えつつ、適切な投資と迅速な適応を両立する」というサイクルを意識していると語る。この進化の過程で一貫しているのは、採用する人材の質である。同社のエンジニアの83%はエンジニアリング職であり、その多くはハードウェアとソフトウェアの境界領域、低レベルのシステム、そしてMLシステムのプロダクション実装に深い知見を持つ。また、40名以上の元創業者(ex-founders)が在籍している点も特徴的である。
同社のビジネスモデルは「テクノロジープロバイダー」としての立場を貫く。NVIDIAやAMDのような半導体企業と類似しているが、シリコン(チップ)自体は製造しない。顧客は自動車メーカーから政府機関まで多岐にわたり、同社の技術をライセンスして自社の機械に組み込む。この「Better Together」戦略により、顧客はOSだけをライセンスして別の自動運転技術を使うことも、すべてのスタックを一括で導入することも可能である。このオープンなアプローチが、18のトップ自動車メーカーに採用される原動力となっている。
オペレーティングシステム:物理機械のためのAndroid
Peter Ludwigは、現在の物理機械のソフトウェア状況を「スマートフォン市場がAndroidとiOSによって統一される前の状態」に例える。彼自身、GoogleでAndroidの開発に携わった経験を持つ。GoogleがAndroidを立ち上げた理由の一つは、市場に50種類もの異なるOSが存在し、そのすべてでGoogleのアプリを均等に動作させることが不可能だったからだ。現在の自動車や建設機械の世界も同様であり、AIアプリケーションを動作させるためには、まずこの断片化されたOSレイヤーを統合する必要がある。
車両用OSの要件は、一般的なコンシューマー向けOSとは根本的に異なる。単なるヒューマンマシンインターフェース(HMI)ではなく、リアルタイム制御、センサーデータのストリーミング、レイテンシ管理、メモリ管理、そしてフェイルセーフ機構が求められる。例えば、Microsoft Windowsでセンサーデータをストリーミングしながら車両を制御しようとすれば、レイテンシが非現実的なレベルになる。Applied IntuitionのOSは、システム全体のパフォーマンス特性を細部までチューニングし、宇宙線によるビット反転のような極めて稀な障害にも備えた冗長性を備えている。
さらに重要なのが、ソフトウェアアップデートの信頼性である。Teslaは月に一度の頻度でOTAアップデートを提供するが、従来の自動車メーカーの多くは、安全クリティカルな部分のアップデートをディーラー経由でしか行えない。Applied IntuitionのOSは、車両のあらゆるシステムに対して高信頼なアップデートを可能にする。「車を文鎮化(brick)する」ことは、iPadを文鎮化するのとは比べ物にならないほど重大な問題であり、この課題を解決すること自体が業界全体への大きなインパクトとなっている。OSはC言語を中心に、リアルタイム制約の厳しい部分ではアセンブリ言語も使用される。
AIコーディングツールの社内導入とエンジニアリング文化の変容
Applied Intuition社内では、AIコーディングツールの導入が極めて積極的に進められている。Cursorが長らく最もホットなツールであったが、現在ではClaude Codeがその座を奪いつつある。社内では導入を促進するためのリーダーボードが運用されており、エンジニア間の健全な競争を生み出している。Peterは、これらのツールの有用性に「phenomenally useful(驚異的に有用)」と表現し、その影響は単なるコーディング効率化にとどまらないと語る。
このAIツールの普及は、エンジニアの採用基準にも大きな変化をもたらした。従来は「実装能力」が重視されていたが、現在では「AIエンジニア」としてのスキルセット、すなわち「どのような質問をすべきか」「複数のAIツールをどう組み合わせるか」という能力がより重要になっている。面接ではAIツールの使用を許可した上で課題を課しており、その結果、エンジニアの間には明確な二極化(bimodal distribution)が生じている。AIツールを深く使いこなすエンジニアとそうでないエンジニアの間の生産性の差は「enormous(計り知れない)」とQasarは指摘する。
特筆すべきは、このAIツールの波が、かつて「AIの影響を受けにくい」と考えられていた組み込みシステムやOSの領域にも及んでいる点である。わずか6ヶ月前には、GPUシェーダーの記述や組み込みシステム向けのコード生成において、最新のClaudeモデルでも満足な結果は得られなかった。しかし現在では、その品質に「blown away(驚嘆する)」レベルに達している。ただし、安全クリティカルなシステムにおいては、人間による検証が100%不可欠であり、AIが生成したコードを無検証で信頼することは決してない。この「適切な人間による検証のレベル」を見極めることが、現在の最大の課題の一つである。
シミュレーション、検証、そして現実世界とのギャップ
シミュレーションはApplied Intuitionの創業以来の中核技術である。同社は、従来の物理ベースのシミュレーションから、ニューラルシミュレーション(Neural Simulation)へと進化を遂げている。これは、Gaussian Splattingと拡散モデル(diffusion methods)をハイブリッドした手法であり、強化学習(RL)を実用的にするためには、シミュレーションの「速度」と「コスト」が極めて重要になる。十分に高速で安価なシミュレーションができなければ、RLによる学習は現実的ではない。
しかし、Peterは「いかなるシミュレーションも現実世界を完全に再現することはできない」と断言する。シミュレーションと現実の間には常にギャップが存在し、そのギャップを埋める「Sim-to-Real」のプロセスが不可欠である。シミュレーションのパラメータを現実世界のフィードバックで補正し、信頼できる精度が得られるまで検証を繰り返す。例えば、ヒューマノイドロボットのアクチュエーターが過熱する問題をシミュレーションで再現するには、モーターの温度をパラメータとして含める必要がある。これがないと、シミュレーション上で最適化されたポリシーは、現実のロボットを過熱で故障させてしまう。
同社は、現実世界でのテストを決して放棄しないという明確なスタンスを取っている。伝統的なソフトウェア開発では、車両ソフトウェアのテストの95%は通常のCI/CDフローでカバーできる。残りの4%は、車両の電気電子部品を搭載したリグ(試験台)で、そして最後の1%だけが実際の車両を使ったテストである。このアナロジーは、知能システムのシミュレーションにも当てはまる。シミュレーションとワールドモデルで多くのことをカバーできるが、最終的には物理的な機械にデプロイする以上、現実世界でのテストは不可避である。「現実世界のテストを完全に不要にする魔法の世界」は存在しない。
ワールドモデル、オンボードAI、そして物理的制約
ワールドモデルは、フィジカルAIにおける最もホットなトピックの一つだが、Peterは「ワールドモデルだけで実運用に耐えるシステムを構築しようとすれば、破産する前に頓挫する」と現実的な見解を示す。ワールドモデルは、世界の因果関係(cause-effect relationship)を理解することに長けている。例えば、建設機械が土を掘って移動させるという動作は、その因果関係をモデルが学習する必要がある。ハイドロプレーニング現象も同様で、路面の水たまりや曲率といった視覚的な手がかりから、モデルが「減速すべき」という非自明なルールを学習する可能性がある。これがワールドモデルの真の価値である。
しかし、モデルを実際の機械に搭載する「オンボード(onboard)」の世界は、データセンターで動作する「オフボード(offboard)」とはまったく異なる制約に直面する。オフボードでは、モデルの推論に1秒かかろうが10秒かかろうが問題にならない。巨大なGPUを搭載したデータセンターで、大規模なモデルを実行できる。一方、オンボードでは、ミリ秒単位のレイテンシが要求され、消費電力とコストの制約も厳しい。Qasarは「フィジカルAIの世界では、モデルの知能そのものが制約要因ではない。実際の制約は、それをいかにハードウェアにデプロイするかという点にある」と強調する。
この制約は、エンジニアリングに創造性を強いる。GoogleがリリースしたGemma 2Bモデルは、組み込みシステムでも動作可能なサイズであり、音声アシスタントのような汎用的なユースケースには有用である。しかし、自動運転の中核となる認識・制御モデルは100%自社開発であり、データシミュレーションからモデル設計まですべて内製している。また、すべての処理をオンボードで行うか、クラウドに「電話する(call home)」かの判断は、レイテンシと通信環境に依存する。米国内でもセルラーカバレッジが不十分な地域は多く、特に鉱山や農業の現場では、すべてがローカルで完結する必要がある。
プロダクション化の難しさと創業者へのアドバイス
Applied Intuitionは、10年の経験を通じて「デモはできてもプロダクションには程遠い」という現実を痛感してきた。ヒューマノイドロボット業界の現状について、Peterは「これらのシステムはかなり脆い(brittle)」と評する。中国がヒューマノイドのマラソン大会を計画しているのは、この信頼性の問題を解決するための「prize policy(賞金政策)」の一環であると分析する。DARPA Grand Challengeが自動運転技術を大きく前進させたように、競争を通じて技術的課題を克服しようという試みだ。
同社の強みは、10年にわたる試行錯誤の蓄積にある。Peterは「今、この業界のどの企業のデモを見ても、彼らが次に直面するであろう20の問題を正確に予測できる」と語る。これは、数え切れないほどの失敗と成功を経験してきたからこその洞察である。研究(research)とプロダクション(production)の間には「アドバンストエンジニアリング(advanced engineering)」という段階が存在し、多くの企業がこの段階で苦戦する。Applied Intuition自身も、このアドバンストエンジニアリングの領域に多くのリソースを投入している。
Qasarは創業者に向けて、商業的な制約(commercial constraint)を早期に設定することの重要性を説く。「技術的な課題が大きすぎて、商業的な制約を考える余裕がない」という創業者は多いが、それでは持続可能なビジネスにはならない。また、成熟した大企業(AppleやNVIDIAなど)の戦略をそのまま模倣することの危険性も指摘する。Appleが2007年に垂直統合戦略をとれたのは、1978年の創業時とはまったく異なるフェーズにあったからだ。Y Combinatorの2014年のアドバイスが2026年には通用しないように、創業者は自分のスキル、チーム、そして顧客からのフィードバックに基づいた「ファーストプリンシプル思考」で戦略を立てるべきである。
結びに
このエピソードがリスナーに残すものは、フィジカルAIが単なる「LLMの延長線上」ではないという冷徹な現実認識である。Applied Intuitionの10年の歩みは、AIの「知能」そのものよりも、それを現実世界の物理的・商業的制約の中で動作させることの方がはるかに困難であることを示している。同社が「物理機械のためのAndroid」を目指す理由は、この断片化されたエコシステムを統合しなければ、AIの真の価値が発揮できないからだ。また、シミュレーションと現実のギャップ、統計的な安全性の評価、規制当局との関係構築など、スクリーン上のAIでは決して現れない課題の数々が、フィジカルAIの本質を形作っている。このエピソードは、AIエンジニアリングの最前線が、単なるモデル開発から、システム全体の信頼性とデプロイメントへとシフトしていることを明確に示している。
要点
- Applied Intuitionは評価額150億ドルのフィジカルAI企業であり、世界の非中国系自動車メーカーのトップ20社中18社が同社の技術を採用している。日本では実際にL4ドライバーレストラックが運行中である。
- フィジカルAIとスクリーン上のAIの最大の違いは「安全クリティカル性」であり、学習システムの誤りが人命に関わるため、検証方法が二値的なパス/フェイルから統計的な「何ナインの信頼性」へと変化した。
- 同社の技術は3つの柱から構成される:シミュレーションと強化学習インフラ、車両用オペレーティングシステム、そして基礎的なAIモデル。OSはC言語とアセンブリ言語で記述され、リアルタイム制御とフェイルセーフを実現する。
- 現在の物理機械のソフトウェアスタックは、スマートフォンがAndroid/iOSで統一される前の状態と同様に断片化されており、Applied Intuitionはこのプラットフォームレイヤーの統合を目指している。
- 社内ではCursorやClaude CodeなどのAIコーディングツールが積極的に導入され、エンジニアの間にはAIツールを使いこなす層とそうでない層の間に「生産性の大きな二極化」が生じている。
- シミュレーションは現実世界を完全に再現することはできず、Sim-to-Realの検証プロセスが不可欠である。ワールドモデルは有用だが、それだけで実運用システムを構築することは不可能であり、現実世界でのテストは決して廃れない。
- フィジカルAIの真の制約はモデルの知能ではなく、ハードウェアへのデプロイにある。オンボードではミリ秒単位のレイテンシと低消費電力が要求され、大規模モデルの蒸留(distillation)が重要な技術となる。
- Qasar Younisは創業者に対し、商業的な制約を早期に設定し、成熟企業の戦略をそのまま模倣せず、ファーストプリンシプル思考で戦略を立てるようアドバイスしている。