motpod
Latent Space: AIエンジニアポッドキャスト · 2026年5月22日

エージェントにコンピュータを与える — Ivan Burazin、Daytona

AI generated article / ja / study
この記事でわかること
  • Ivan Burazin(Daytona CEO)は、AIエージェント向けに「コンポーザブル・コンピュータ」を提供するDaytonaのビジョンと、その背後にある10年以上...
  • 本エピソードでは、Daytonaがどのようにしてベアメタル上で独自のスケジューラを動かし、60ミリ秒でのサンドボックス起動や75秒での5万個の同時起動を実現しているか、そ...
  • [00:03:15] CodeAnywhereからDaytonaへ:10年にわたる「localhostの終焉」テーゼ Ivan Burazinと彼の共同創業者は、2000...
こんな人向け

自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。

出典Podcast

Latent Space: AIエンジニアポッドキャスト / Latent.Space

Read
Open episodeFind more episodes

Ivan Burazin(Daytona CEO)は、AIエージェント向けに「コンポーザブル・コンピュータ」を提供するDaytonaのビジョンと、その背後にある10年以上にわたる「localhostの終焉」というテーゼについて語った。彼はCodeAnywhereの共同創業者として、ブラウザベースのIDEをいち早く開発したが、市場はまだ成熟していなかった。しかし、AIエージェントの台頭により、人間の開発環境ではなく、API経由でアクセス可能なコンピュータが必要とされる時代が到来した。Daytonaは、この市場の変化を捉え、人間向けの開発環境自動化からAIエージェント向けのサンドボックスへとハードピボットを実行し、急成長を遂げている。

本エピソードでは、Daytonaがどのようにしてベアメタル上で独自のスケジューラを動かし、60ミリ秒でのサンドボックス起動や75秒での5万個の同時起動を実現しているか、その技術的優位性が詳しく解説された。また、強化学習(RL)や評価(eval)ワークロードがゼロから全使用量の約50%に急増した背景、Kubernetesでは対応が難しいスパイク特性、そしてエージェントがWindowsやmacOSといった多様なOSを必要とする未来についても議論が交わされた。Ivanは、AIクラウドの未来はAWSよりもStripeに近い形になると予測し、トークンの再販に依存するSaaSビジネスモデルに対する警鐘も鳴らした。

00:03:15CodeAnywhereからDaytonaへ:10年にわたる「localhostの終焉」テーゼ

Ivan Burazinと彼の共同創業者は、2000年代初頭からサーバーの仮想化やルーターのセットアップを行うサービス会社を運営していた。その後、共同創業者が発明した世界初のブラウザベースIDE「CodeAnywhere」に注力するため、この会社を売却した。CodeAnywhereはHerokuに次ぐ初期のプレイヤーであり、約300万人のユーザーを獲得したが、エンジェル投資のみで運営され、VCからの大規模な資金調達には至らなかった。当時はVS CodeもKubernetesも存在せず、Dockerも登場したばかりで、スタック全体を自前で構築する必要があった。この経験が、後のDaytonaの技術的基盤となっている。

CodeAnywhereの後、Ivanはクロアチアで大規模なテックカンファレンス「Shift」を立ち上げ、その後、Infobipという通信API企業でDeveloper Experienceの責任者を務めた。この間も「localhostの終焉」という信念は持ち続けており、swyxが書いた同名のブログ記事がきっかけで二人は知り合った。約3年前、Ivanは再びこのテーマに取り組むため、Daytonaを創業した。当初は人間のエンジニア向けに開発環境を自動化するプロダクトだったが、2024年1月にAIエージェント向けのサンドボックスへとハードピボットを決断する。

ピボットの直接的なきっかけは、2024年末にDevin( Cognition AIのAIエンジニア)やOpenDevin(現OpenHands)といったAIコーディングエージェントの登場だった。Daytonaのプラットフォーム上でOpenDevinをSaaSとして提供したところ、ユーザーはほとんど集まらなかったが、代わりに「自分のエージェントにコンピュート環境を提供してほしい」という問い合わせが殺到した。このシグナルを受け、Ivanは市場の変化を確信した。

00:08:07ハードピボットとNew Year's Eve MVP:顧客がAPIキーを求めた瞬間

DaytonaがAIエージェント向けサンドボックスへのピボットを決断した後、最初に構築したプロダクトは顧客の期待に応えられなかった。Ivanは「これはゴミだ」と顧客から直言され、自らAIエージェント市場に関するあらゆるポッドキャストやブログを徹底的に調査した。その結果、エージェントが必要とするのは単なるコード実行ボックスではなく、人間が使うラップトップのように、状態を保持し、一時停止・再開が可能で、かつ瞬時に起動する「コンピュータ」であるという結論に至った。

転機は大晦日の夜に訪れた。Ivanは生後間もない娘と妻を寝かしつけた後、午前3時までかけてDaytonaの最初のMVPを「バイブコーディング」した。CTOはそのコードを「絶対に誰にも見せるな」と酷評したが、アイデア自体は評価し、2週間かけてまともなプロダクトに仕上げた。この新バージョンを以前「ゴミだ」と言った顧客にデモしたところ、15分の予定が30分に延び、全員が「アクセスしたい」と熱望した。翌日、APIキーを送らなければ、顧客から「キーはどこだ」と催促の連絡が殺到したという。

Ivanは「複数の会社を経てきたが、顧客がこれほどまでにアクセスを求める経験は初めてだった」と振り返る。この瞬間、彼らは人間のエンジニア市場よりも、将来存在するであろうすべてのエージェントのためのコンピュート市場の方がはるかに大きいと確信し、全面移行を決断した。このエピソードは、プロダクトマーケットフィットが起きた瞬間の生々しい事例として印象的である。

00:12:56ベアメタル、独自スケジューラ、60ms起動:Daytonaの技術的優位性

Daytonaの最大の技術的特徴は、ベアメタル上で独自のスケジューラを動作させている点にある。多くの競合がVMやFirecracker上でサンドボックスを提供するのに対し、Daytonaは物理マシンのCPU、RAM、NVMeディスクを直接利用する。これにより、ネットワークレイテンシーが排除され、I/Oパフォーマンスが劇的に向上する。また、スナップショットやテンプレートはあらかじめベアメタルマシン上にプリロードされており、サンドボックス起動時にはそのマシン上でローカルに展開されるため、60ミリ秒という驚異的な起動速度を実現している。

さらに、Daytonaは状態を保持するステートフルなサンドボックスを提供する。これは、エージェントが人間のように作業を中断・再開できることを意味する。LambdaとEC2を組み合わせたような性質を持ち、瞬時に起動しながらも長時間実行が可能だ。Kubernetes(EKS/GKS)と比較すると、その速度とスケールは圧倒的で、ある顧客は「二度とKubernetesには戻れない」と語っている。Daytonaは50,000個のサンドボックスを約75秒で同時起動でき、最大の顧客は1日あたり約85万個のサンドボックスを実行している。

もう一つの重要な機能は、動的なリソースサイジングである。実行中のサンドボックスに対して、CPUやメモリをオンザフライで増減できる。これはKubernetesでは非常に困難な機能であり、特にメモリ不足(OOM)によるクラッシュを防ぐ上で有効だ。Daytonaは複数の分離レイヤー(Docker + SysboxによるVMレベルのセキュリティを持つコンテナなど)を提供し、顧客のワークロードに応じて最適なものを選択できる。これらの技術的優位性が、TerminalBenchやHarborといった評価ベンチマークでの推奨につながっている。

00:21:53RL/評価ワークロードの急増とスパイク問題:新たなインフラ課題

Daytonaの使用量は、わずか数ヶ月でRL(強化学習)と評価(eval)ワークロードがゼロから全体の約50%を占めるまでに急増した。このワークロードは、従来の人間向けのバックグラウンドエージェントとは根本的に異なるパターンを持つ。人間向けのワークロードは「太陽に従う」ように、昼間にピークを迎え、夜間や週末は低下する。一方、RL/評価ワークロードは、研究者が就寝前にジョブを投入し、朝までに結果を得るというパターンが多く、使用パターンは「四角形」のように急峻で予測不可能である。

このスパイク特性は、インフラプロバイダーにとって深刻な課題を生む。Daytonaの平均CPU使用率はわずか15%だが、ピーク時には90%に達する。これは、ピーク需要に合わせてキャパシティを確保する必要がある一方、それ以外の時間は遊休リソースが発生することを意味する。Ivanは、NeonやParallelといった他のAIインフラ企業も同じ問題に直面していると指摘する。この問題の解決策として、オーバープロビジョニングか、需要超過時に他クラウドからリソースを調達する「ジャストインタイムコンピュート」の2つが考えられる。

特にGPUを活用するRLトレーニングでは、GPUを100%稼働させ続けることが経済性の鍵となる。CPUサイクルがダウンするとGPUが待機状態になり、コストが発生する。そのため、CPUサンドボックスの起動が瞬時であることが極めて重要になる。Daytonaの高速起動は、この点で大きなアドバンテージを持つ。Ivanは、このスパイク問題を解決するために、Cloudflareのように地理的に負荷を分散する戦略や、より高度なキャパシティ管理の必要性について言及した。

00:33:31エージェントに必要なコンピュータ:Windows、macOS、そしてRPAの再来

Ivanは、AIエージェントが真の価値を発揮するためには、LinuxだけでなくWindowsやmacOSを含む多様なコンピュータ環境が必要だと主張する。その根拠として、米国における知識労働者の市場規模(約10兆ドル)と、その約56%が医療、政府、金融サービスといったレガシーアプリケーションに依存している点を挙げる。これらのアプリケーションは書き換えられることなく、エージェントがGUIを介して操作する必要がある。これは、RPA(ロボティックプロセスオートメーション)市場の再来とも言える。

Ivan自身の体験として、自社のデータを集めてボードデッキを作成する際、APIでは取得できないデータが多数存在したため、macOSのサンドボックス上でOpenClaw(オープンソースのデスクトップエージェント)を起動し、各サービスのWebサイトにログインしてデータをエクスポートさせたという。この経験から、たとえ最新のツールを使うスタートアップでも、エージェントには「コンピュータ」が必要であり、ましてや大企業ではなおさらだと語る。

しかし、macOSサンドボックスの提供にはAppleのライセンス制約が大きな壁となる。Appleは1台のマシン上で2つまでの並列VMしか許可しておらず、さらに同一ユーザーへのライセンス再割り当てには24時間のインターバルが必要である。これにより、従量課金モデルが事実上不可能になり、24時間分の課金が必要となる。また、メモリスナップショットの移行も同一物理マシンに制限されるため、負荷分散が困難だ。Ivanは「Appleは自らの足を撃っている」と批判し、Windowsと同様の並行処理モデルを可能にするようAppleに強く求めた。

00:44:28CLI vs MCP、オープンソース戦略、そしてエージェント時代のCI/CD

Ivanは、エージェントの能力を最大限に引き出す上で、MCP(Model Context Protocol)よりもCLI(コマンドラインインターフェース)の方が重要だと指摘する。MCPはAPIに対するインターフェースであるのに対し、CLIは実際にスクリプトを実行し、データを分析し、結果を生成するためのより強力な手段を提供する。エージェントがCLIを使いこなせるようになることで、単なるAPI呼び出しを超えた、より複雑なタスクを実行できるようになる。

Daytonaのオープンソース戦略も興味深い。コア部分はAGPL3ライセンスで公開されており、WindowsやGPU関連の機能のみがプロプライエタリとなっている。このオープンソース化は、直接的な成長ドライバーというよりは、エージェントがDaytonaを統合する際に、リポジトリ全体をコンテキストとして与えることで、よりスムーズな統合を可能にする点で価値を発揮している。また、大企業においては、セキュリティ審査を通過する前の段階でオープンソース版が採用され、後日クラウド版に移行するというパターンも見られる。

エージェントの普及は、ソフトウェア開発のワークフローにも変革をもたらす。現在、エージェントが生成するPR(プルリクエスト)の数は爆発的に増加しており、ある顧客は1日あたり1,000件のPRを生成している。これにより、従来のCI/CDパイプラインがボトルネックになりつつある。Ivanは、Gitが「アウターループ(デプロイ成果物)」として残る一方で、エージェント同士のコラボレーションのための「インナーループ」向けに、全く新しいバージョン管理の仕組みが必要になると予測する。ある顧客は、コードベース全体をJSONにダンプしてS3に保存するという独自の方法を取っており、これは既存のGitがエージェントの高速なイテレーションに適していないことを示している。

00:58:15ファウンダー論:痛みを楽しむ覚悟と25人組織のカルチャー

Ivanは、スタートアップファウンダーとしての生き方について、率直で時に過激な意見を述べる。彼は「すべては痛みを伴う」という哲学を持ち、ジムでのトレーニングやダイエットと同様に、スタートアップ経営も痛みを伴うものであり、その痛みを楽しめなければ向いていないと語る。彼はクロアチアとサンフランシスコを行き来しながら、幼い2人の子供を持つ家族と離れて過ごす時間の長さを認めつつ、それが「自分が選んだ道」であり、パートナーの理解とサポートがあって初めて成り立つと述べる。

Daytonaの25人のチームのうち、約13人はIvanと7年以上の付き合いがあるメンバーだ。この高い信頼関係と、過去の厳しい時代を共に経験したというバックグラウンドが、顧客対応の「異常なまでのレスポンシブネス」を支えている。Ivan自身が24時間対応の模範を示し、Slackのハドルミーティングに5分以内に参加する文化を徹底している。このカルチャーは、競合他社との差別化要因の一つとして、顧客から高く評価されている。

Ivanはまた、AI SaaS企業がトークンの再販によって収益を加速させている現状に警鐘を鳴らす。彼は、従来のSaaSの高いマージンと比較して、トークン再販のマージンははるかに低く、持続可能なビジネスモデルではないと指摘する。真の価値は、APIを通じてデータを公開し、エージェントが直接アクセスできるようにすることにあると主張し、Marc Benioff(Salesforce CEO)が全プロダクトをAPI公開したことを称賛した。AIクラウドの未来は、AWSのような巨大なプラットフォームではなく、Stripeのようにシンプルで強力なAPIを提供する企業が主導するだろうと予測する。

結びに

本エピソードは、AIエージェントが「コード実行ボックス」ではなく「コンピュータ」を必要とするという、シンプルだが深遠な洞察を中心に展開された。Ivan Burazinの10年にわたる「localhostの終焉」テーゼが、AIエージェントの台頭によってようやく現実のものとなりつつある。Daytonaの技術的優位性(ベアメタル、独自スケジューラ、ステートフルサンドボックス)は、この新しい市場において極めて競争力が高い。特に、RL/評価ワークロードの急増とそれに伴うスパイク問題は、AIインフラ全体に共通する未解決の課題であり、今後のイノベーションの焦点となるだろう。Ivanの率直なファウンダー論や業界への辛口批評も含め、AIエンジニアリングの最前線を理解する上で、非常に密度の高い60分間であった。

要点

  • Daytonaは、AIエージェント向けに「コンポーザブル・コンピュータ」をAPIで提供する。単なるコード実行ボックスではなく、状態を保持し、瞬時に起動・再開可能なコンピュータ環境である。
  • ベアメタル上で独自スケジューラを動作させることで、サンドボックス1個の起動を60ミリ秒、5万個の同時起動を75秒で実現。これはKubernetesベースの競合を圧倒する速度である。
  • RL/評価ワークロードがゼロから全使用量の約50%に急増。このワークロードは予測不能なスパイク特性を持ち、インフラプロバイダーに新たなキャパシティ管理の課題を突きつけている。
  • エージェントが真の価値を発揮するには、LinuxだけでなくWindowsやmacOS環境が必要。特にレガシーアプリケーションが支配する知識労働市場(米国で約10兆ドル)が大きなターゲットとなる。
  • AppleのmacOSライセンス制約(並列VM数、ライセンス再割り当て間隔、スナップショット移行制限)は、エージェント向けスケーラブルなコンピュート提供の大きな障壁となっている。
  • エージェントの能力を引き出すには、MCPよりもCLIの方が重要。CLIはAPI呼び出しを超えた、より強力なスクリプト実行とデータ分析を可能にする。
  • エージェントが生成するPRの爆発的増加により、従来のCI/CDパイプラインがボトルネック化。Gitに代わる、エージェント向けの新しいバージョン管理とコラボレーションの仕組みが必要となる。
  • AIクラウドの未来は、AWSのような巨大プラットフォームではなく、Stripeのようにシンプルで強力なAPIを提供する企業が主導する。トークンの再販に依存するSaaSモデルは、持続可能性に疑問がある。
エージェントにコンピュータを与える — Ivan Burazin、Daytona | Latent Space: AIエンジニアポッドキャスト | motpod | motpod