
AIエージェントと顧客データをめぐる戦い
- AIエージェントとカスタマーデータをめぐる攻防 本エピソードでは、a16zのマーティン・カサドがFivetranの共同創業者兼CEOジョージ・フレイザーを迎え、AI時代に...
- [0:00] AIエージェントが変えるデータ基盤の役割 フレイザーはまず、Fivetranの事業を簡潔に説明した。2013年創業、2015年から顧客を持ち、Salesfo...
- しかし今、全く新しい理由が加わった。「AIエージェントがコンテキストを必要とする」からだ。フレイザーはこれを、インターネットに接続される前のChatGPTに例える。「もし...
自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。
The a16z Show / Andreessen Horowitz
AIエージェントとカスタマーデータをめぐる攻防
本エピソードでは、a16zのマーティン・カサドがFivetranの共同創業者兼CEOジョージ・フレイザーを迎え、AI時代におけるデータインフラの未来について深く掘り下げた。中心となるテーゼは、AIエージェントがビジネスコンテキストを必要とする以上、全データを一元管理する「データ基盤」の重要性がかつてないほど高まっているというものだ。しかし同時に、SaaSベンダー各社が自社のデータへのアクセスを制限し始めており、顧客とベンダーの間で「データの所有権」をめぐる緊張が高まっている実態が浮き彫りになった。会話は、Fivetranとdbtの合併、データグラビティの神話、エンタープライズにおけるAIエージェントの正体、そしてPostgresの技術的負債に至るまで、幅広いトピックをカバーしている。
AIエージェントが変えるデータ基盤の役割
フレイザーはまず、Fivetranの事業を簡潔に説明した。2013年創業、2015年から顧客を持ち、Salesforce、Netsuite、各種SaaSツール、自社データベースなど、あらゆるシステムからデータを一箇所に集めるサービスを提供している。歴史的に、企業が全データを一元管理する主な理由はビジネスインテリジェンス(BI)だった——売上はいくらか、営業チームの状況はどうか、今四半期の予測は——といったレポート作成のためだ。
しかし今、全く新しい理由が加わった。「AIエージェントがコンテキストを必要とする」からだ。フレイザーはこれを、インターネットに接続される前のChatGPTに例える。「もしAIエージェントがビジネスデータにアクセスできなければ、それはまるで訓練期間で知識が止まっている旧型のChatGPTを使うようなものだ」。つまり、BIやレポーティングに使われてきたデータ基盤は、若干の修正と追加は必要だが、AIエージェントのためにも極めて有効に機能するというのが彼の主張だ。
データは常に「どこか別の場所」で生まれる——Salesforce、Workday、SAPといった「システム・オブ・レコード」の中で。そして企業は太古の昔から、それらを別の場所にコピーして中央集約する必要があった。なぜなら、個々のシステムに個別に問い合わせても、システム全体を横断する質問には答えられないからだ。この根本的なニーズは変わっていない。
SaaSベンダーによるデータ封鎖——繰り返される歴史的過ち
フレイザーは、AIエージェントの台頭を受けてSaaSベンダー各社が示している反応について、強い懸念を表明した。特に象徴的なのが、SAPが最近発表した新しいAPIポリシーだ。このポリシーは「AIエージェントによるアクセスをすべて禁止し、SAPが特別に承認した方法のみを許可する」という内容だった。フレイザーは「SAPユーザーはパニックにならないでほしい。これはあくまでポリシーであり、契約が優先される」としつつも、この動きが業界の極端な反応を示していると指摘する。
カサドはここで重要な問いを投げかける。「SaaSアプリの価値はインターフェースにある。AIエージェントがデータに直接アクセスして同じ機能を果たせるようになれば、SaaSの価値は低下する——それが懸念なのか?」フレイザーはこれに複数の懸念があると答えつつ、根本的には「これは新しい脅威ではない」と主張する。1990年代にも全く同じ議論があった——APIを開放すれば自社がディスインターミディエーション(仲介排除)されると恐れた時代が。しかし実際には、ビジネスプロセスそのものを提供するSaaSの価値は、人間が使おうがエージェントが使おうが変わらない。
さらにフレイザーは、ソフトウェアコストが企業の総コストに占める割合はわずか5〜10%に過ぎないと指摘。「企業がAIを使ってやろうとするのは、Slackのシート数を減らすような値エンジニアリングではない。本業をより良くすることだ」。そして、OpenAIやAnthropicといったAIラボ自身が今もFivetranの顧客であり、これらのSaaSツールからデータをレプリケートしている事実を挙げ、「もし彼らがまだ使っているなら、未来の企業が使わないと本当に言えるのか?」と問いかける。
オープンデータインフラストラクチャ・ベンチマーク——悪質ベンダーを可視化する
フレイザーは、Fivetranが立ち上げた「Open Data Infrastructure」というウェブサイトについて説明した。これは、各SaaSベンダーをデータアクセスポリシーに基づいてスコアリングするベンチマークだ。評価基準は3つ:①データのエグレス(持ち出し)に課金するか、②完全なデータコピーを取得することを不可能または極度に困難にしていないか、③自社データへのアクセスに利用規約上の制限を設けているか。
「最も悪質なのは歴史的にSAPだ」とフレイザーは明言する。SAP内部には「顧客のデータは顧客のもの」と考える派閥と、「SAPのデータであり、SAPの言う通りに使うべき」と考える派閥が存在するという。Salesforceは歴史的には良好だったが、Slackに関しては「ひどい」状態だ。ただしSalesforce全体としても最近「怪しい動き」を見せ始めている。
フレイザーは、このAPI封鎖の動きは一時的なものだと予測する。「ベンダーは自社のプラットフォーム内で顧客のあらゆるデータ問題を解決できないことに気づくだろう。顧客のデータニーズはあまりに多様だからだ」。彼は、顧客がMSA(マスターサービス契約)にデータアクセスを保証する条項を書き込むことを推奨し、Open Data Infrastructureのサイトにモデル条項も用意していると述べた。「大きな契約なら、交渉すれば驚くほど簡単に認められることが多い。問題は、人々が戦わないことだ」。
データグラビティは幻想である——フレイザーの異論
フレイザーは「データグラビティは完全に偽物だ」と断言する。データグラビティとは、ビジネスデータが巨大すぎて移動コストが莫大になるため、データが存在する場所にすべてのサービスを寄せるべきだという考え方だ。しかしフレイザーは、FivetranのAWSおよびGCPアカウントのネットワークダッシュボードを見れば、その誤りが一目瞭然だと語る。
「7000社の顧客のために巨大なデータセットをレプリケートしているにもかかわらず、任意の時点で移動しているデータ量はごくわずかだ」。その理由は「変更データキャプチャ(CDC)」にある。全データを毎日深夜に一度コピーするような「愚かなデータパイプライン」を自前で構築すると、読み取り増幅が発生してデータが巨大に見える。しかし、変更分だけを継続的にレプリケートすれば、データ量は常に小さい。
「データグラビティの考え方は、人々が自前でデータパイプラインを構築した結果、間違ったパターンに陥ったことに由来する」とフレイザーは指摘する。正しいレプリカを得る最も簡単な方法は全データを繰り返しコピーすることだが、長期的には非常に高コストだ。Fivetranのような専門ツールを使えば、この問題は解決する。
エンタープライズAIエージェントの進化——人間のように扱うべきか
カサドとフレイザーは、AIエージェントの進化のフェーズについて議論した。最初は「エンタープライズ検索」的な使い方——全データをデータレイクに入れ、LLMにアクセスさせる。次に「個人エージェント」——OpenClawやNano Clawのようなツールで、自分のメールやAPIキーにアクセスさせる。そして現在、フレイザー自身が実践している第三のフェーズがある。
フレイザーは、自身のUSTA(全米テニス協会)のチーム運営のために、独自のエージェントを運用している。このエージェントは独自のメールアドレス、電話番号、WhatsApp番号を持ち、まるで一人の人間のようにチームメンバーとコミュニケーションを取り、USTAのウェブサイトでスケジュールを確認し、ラインアップを作成する。Fivetran内部でも、サポートチケット対応のためのAIエージェントが、同様に「人間のように」システムに統合されている。
カサドは「エンタープライズでは、AIエージェントを人間と同じように扱うべきか」と問う。つまり、HRチームがAIをオンボーディングし、トレーニングし、アクセス権限を与え、Slackに参加させる——というアプローチだ。フレイザーはこれを「中間形態」と位置づける。「既存のワークフローにスロットインできるからうまくいく。すべてをリファクタリングする必要がない」。
しかし両者は、将来の方向性について賭けをする。カサドは「5年後、エージェントの大半は人間と同じインターフェース(ブラウザやUI)を使う」と予測する。その理由は、ロングテールの統合問題がすでに解決されており、アンチスクレイピング対策も回避できるからだ。一方フレイザーは「API経由が主流になる」と予測する。ブラウザ操作は遅く、トークン消費も大きい。FivetranのSalesforce管理エージェントはCLIで全てを実行しており、ブラウザ自動化は不要だったという。
MCPプロトコルとツールの未来
MCP(Model Context Protocol)のような仲介技術について、フレイザーは興味深い見解を示した。「理論的には不要なレイヤーだ。エージェントはAPIやCLIを直接呼び出すのが得意だから」。しかし実際にシステムを構築すると、認証、認可、そして利用可能なツールの「発見可能性」という問題に直面する。「実際にコードを書き始めると、ほとんどの場合MCPサーバーを挟むことになる」。
さらにフレイザーは、エージェントの設計思想として「最小限であるべき」という考え方を提示する。エージェントは耐久状態と計算リソースの管理だけを行い、ツールはその場でAIに生成させる——これがNano Clawの動作原理であり、彼が現在使っているNano Botも同様だ。「モデルに数十億ドルが投資されている。地球上で最も知的な存在がモデルなら、古いツールを使うより、モデルに新しいツールを生成させたほうがいい」。
SaaS終焉論と本当の脅威
サティア・ナデラ(Microsoft CEO)が唱える「SaaSの崩壊」について、フレイザーは冷静な評価を下す。「株式市場の方向性は正しい。SaaS企業には1年前より不確実性が増している。しかし、すべてのSaaSカテゴリーが消滅して5つのコードに置き換えられるとは思わない」。
本当の脅威は、AIネイティブな新興企業が既存の大手に急速に追いつくことだ。「ソフトウェアを書くことが格段に容易になっている。AIネイティブ企業は既存企業に追いつき、場合によっては上回るだろう」。しかし、Fivetranのデータを見る限り、伝統的な企業のソフトウェア消費は減速していない。むしろ加速している。「4年経っても、データからその傾向は読み取れない」。
フレイザーは自社の例を挙げる。FivetranはGPT-3の時代からAIを使ってデータレプリケーションコネクタを構築してきたが、AIは「ロングテールの複雑性」をまだ発見できていない。「正確なコピーを作り、それを最新に保つことがどれほど難しいか、人々は驚く」。750ものコネクタ(OracleからSAP、Qualtricsまで)はそれぞれ異なる特性を持ち、実際の顧客が遭遇する問題を通じてしか発見できない。「秘訣は『秘訣はない』ということだ。ただ膨大な努力の積み重ねだ」。しかし最近、AIコーディングエージェントを「無限のジュニアエンジニア」として活用することで、品質と信頼性の向上に兆しが見え始めているという。
データ基盤の真実——既存のものが最適解
OpenAIやAnthropicのようなAIラボも、Fivetranの顧客として「非常に典型的な使い方」をしているとフレイザーは明かす。彼らも他の企業と同様に、様々なシステム・オブ・レコードからデータを中央のデータレイクにレプリケートし、分析やAIワークフローのコンテキストとして使っている。「Anthropicのデータプラットフォームをセットアップしたコンサルタントは、他の多くの企業でもFivetranとdbtをセットアップしてきた人だ。彼らのデータプラットフォームは非常に典型的なものだ」。
これは重要なメッセージだ。「AIのためのデータ基盤として、エキゾチックな新しいシステムを構築する必要はない。おそらく、あなたがすでに持っているものが正解だ」。Snowflake、Databricks、BigQuery、あるいはIcebergデータレイクとその上のコンピュートシステム——これらはAIのコンテキスト基盤としても優れている。
AIがインフラをコモディティ化するという説について、フレイザーは「現在のところ、AIはインフラへの需要を増やしているだけで、コモディティ化は起きていない」と述べる。インフラには階層があり、最下層のデータセンター、クラウドベンダー、サーバーレスプラットフォーム、そして最も抽象度の高い「消費層」がある。「AIが脅かすのは、最も上の消費層だけだ。AIエージェントは複雑なインフラをナビゲートするのが得意なので、ユーザーフレンドリーな最上層を飛ばして、一つ下の層を直接使えるようになる」。しかし、OS、チップ、データベースといったコアインフラは残り続ける。
dbtとの合併——戦略的統合の論理
Fivetranは2025年にCensusを買収し、Tobiko DataとSQL Meshを取得し、そしてdbt Labsとの合併を発表した。フレイザーは「Fivetranにはコーポレートデベロップメント機能はない。すべての買収は、『これが最後の買収になる』と思えるほど強い理由があって実行してきた」と語る。
dbtとの合併は「自然な組み合わせ」だ。Fivetranが全データを一箇所に集め、dbtがそれを整理してビジネス固有のモデルに変換する。この2つは歴史的にほぼ常に一緒に使われてきた。フレイザーはdbtが「コーディングエージェントの最大の受益者の一つになる」と予測する。「コーディングエージェントは大量のdbtモデルを書くだろう。実際、すでにその兆候が見えている」。
彼はコンピュータ科学者のダイクストラの言葉を引用する。「コードは、人間同士のコミュニケーション手段として見られるべきであり、コンピュータの実行形式として見られるのは二次的だ」。SQLクエリやdbtプロジェクトほど、この言葉が当てはまる場所はない。「dbtモデルは、自社のビジネスがどう動くかを表現した実行可能なドキュメントだ。たとえAIが書いたとしても、その成果物は価値がある」。
Postgresは悪いデータベース——フレイザーの過激な持論
フレイザーは、データベース業界に対する異論も展開した。「Postgresは一般的な信念に反して、非常に古いテクノロジーだ。良いデータベースではない。単に書かれたのが昔だからだ。膨大な技術的負債を抱えている」。さらに過激なのは、「学部生がデータベースの授業で書くストレージエンジンの方が、Postgresのヒープストレージエンジンより優れている点が多い」という主張だ。
彼は「Postgresに永遠に固執するのではなく、新しい運用データベースを世界は作るべきだ」と訴える。自身も「S3をバッキングストアとするSQLiteのようなデータベース」のプロトタイプを趣味で開発している。AIワークフローでは「無数の小さなデータベース」が必要になるため、このアイデアには実用的な価値があると考えている。
カサドが「これはCEOとしての時間の使い方として適切か」と問うと、フレイザーは「Claude Psychosis(クロード精神病)という言葉がある。夢中になりすぎる危険性は常に認識している」と認めつつ、「子供がいないので時間はある」と笑う。彼は定期的に「自分が新しくCEOとして招聘されたら何を変えるか」という思考実験を行っており、dbtとの合併も「SnowflakeのCEOだったらどうするか」と自問した結果決断したという。
まとめ
本エピソードは、AIエージェントの台頭がデータインフラ業界に引き起こしている地殻変動を、実務家の視点から鮮明に描き出した。フレイザーの最大の貢献は、SaaSベンダーによるデータ封鎖の動きを「1990年代のAPI論争の繰り返し」と位置づけ、歴史的視点から冷静に分析した点にある。また、データグラビティを「幻想」と断じ、CDC技術によってデータ移動のコスト問題が実質的に解決されているという事実は、多くの企業が誤った前提でインフラ戦略を立てている可能性を示唆する。そして何より、OpenAIやAnthropicといった最先端のAI企業でさえ「典型的なデータ基盤」を使っているという事実は、AI導入に際して過度に複雑なシステムを求める必要がないことを強く示唆している。フレイザーの「Postgresは悪い」発言や「CEOが趣味でデータベースを書く」エピソードは、彼の異端児としてのキャラクターを象徴しつつ、業界の常識に疑問を投げかける価値がある。
要点
- AIエージェントがビジネスコンテキストを必要とする以上、全データを一元管理するデータ基盤の重要性はBI時代よりさらに高まっている。既存のデータプラットフォーム(Snowflake、Databricks等)はAIのコンテキスト基盤としても十分機能する。
- SAPやSalesforceなど一部のSaaSベンダーがAIエージェントのデータアクセスを制限し始めているが、これは1990年代のAPI開放論争の繰り返しであり、歴史的に見て長続きしない。顧客はMSAにデータアクセス条項を書き込むことで対抗すべき。
- データグラビティ(データが巨大で移動が高コストという考え)は「完全な幻想」である。変更データキャプチャ(CDC)を使えば、巨大データセットでも移動量はごくわずか。この誤解は自前の非効率なデータパイプラインに起因する。
- エンタープライズAIエージェントの当面の最適解は、人間と同じインターフェース(メール、Slack、CLI)に「スロットイン」すること。ブラウザ操作よりAPI/CLI経由の方が効率的だが、ロングテールの統合問題にはUI経由が有効な場合もある。
- MCPのような仲介プロトコルは理論的には不要だが、実際には認証・認可・発見可能性の問題を解決するため実用的に必要となる。
- SaaS終焉論は誇張されている。本当の脅威は既存SaaSの置き換えではなく、AIネイティブな新興企業が急速に成長して既存企業に追いつくこと。ただし4年経過してもデータにその傾向は見られない。
- AIはインフラの最上層(消費層)を脅かすが、OS、チップ、データベースといったコアインフラは残る。AIはむしろインフラへの需要を増加させている。
- Postgresは技術的負債が大きく、新しい運用データベースの開発が必要。AIワークフローには「無数の小さなデータベース」を効率的に扱える新しい設計が求められる。