
SAP:CTOフィリップ・ヘルツィヒが語る、企業の「オペレーティングシステム」をAI時代へ導く
- SAPは、1972年の創業以来、メインフレームからクラウド、モバイル、そしてAIへと至る技術変遷を生き抜いてきたエンタープライズソフトウェアの巨人である。同社のCTOであ...
- Herzigは、AIの導入は単なる技術的移行ではなく、ビジネスモデルの変革であると主張する。彼は、UIの動的生成、ビジネスプロセスのエージェント化、そしてデータレイヤーの...
- [6:53] CTOの優先順位とAIへの全面移行 Herzigは、CTOとしての自身の役割を、単なる技術リーダーではなく、顧客のビジネス成果を最前線に据える立場として捉え...
自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。
No Priors:人工知能 | テクノロジー | スタートアップ / Conviction
SAPは、1972年の創業以来、メインフレームからクラウド、モバイル、そしてAIへと至る技術変遷を生き抜いてきたエンタープライズソフトウェアの巨人である。同社のCTOであるPhilipp Herzig(フィリップ・ヘルツィヒ)は、SAPを「企業のオペレーティングシステム」と定義し、40万を超える顧客企業に対し、財務、人事、サプライチェーン、製造、販売に至るまで、エンドツーエンドでビジネスを統合的に管理するプラットフォームを提供している。本エピソードでは、ホストのSarah Guoが、なぜSAPがこれほどまでに耐久性を持つのか、そして現在進行中のAIへの全面的なシフトにおいて、CTOとしてどのような技術的・戦略的優先順位を設定しているのかを深掘りする。
Herzigは、AIの導入は単なる技術的移行ではなく、ビジネスモデルの変革であると主張する。彼は、UIの動的生成、ビジネスプロセスのエージェント化、そしてデータレイヤーの統合という3つのレベルでソフトウェアが根本的に再構築されつつあると説明する。しかし同時に、エンタープライズにおけるAI導入には、データの断片化、スケーリングの課題、セキュリティ、そして何よりも「検証可能性(verifiability)」という深刻な壁が存在することを指摘する。特に、コード生成で成功した「評価(evals)」の考え方を、財務やサプライチェーンのような複雑なビジネスプロセスに適用することの難しさが、現在の最大のエンジニアリング上の挑戦であると語る。本稿では、SAPのAI戦略の核心、エンタープライズAI導入の現実、そして未来のビジネスモデルについての示唆に富んだ議論を詳述する。
CTOの優先順位とAIへの全面移行
Herzigは、CTOとしての自身の役割を、単なる技術リーダーではなく、顧客のビジネス成果を最前線に据える立場として捉えている。SAP社内では、全従業員がエージェンティックコーディング(AIによるコード生成支援)を日常的に活用しており、開発者の生産性は劇的に向上している。しかし、彼が最も注力しているのは、AIを「製品に組み込む」ことによる顧客への具体的な価値提供である。その好例として、SAPのコンサルタント向けAIアシスタント「Joule for Consulting」を挙げる。これは、複雑なシステム環境を持つ大企業のクラウド移行やAI導入を支援するコンサルタントの作業負荷を30%削減し、コストと時間を大幅に圧縮する製品であり、SAPのAI製品の中で最も急速に成長しているという。
Herzigは、AIによるソフトウェアの再構築は、かつてオンプレミスからクラウドへの移行時に経験した変革と類似していると指摘する。当時、多くの企業は単に既存のソフトウェアをインターネットに載せるだけで「クラウド」と呼んでいたが、やがてCI/CD(継続的インテグレーション/デリバリー)やマルチテナンシー、スケーラビリティといった概念を本質的に取り入れた真のSaaSへとソフトウェアを再設計する必要に迫られた。現在、AIによって同様の変革が3つのレベルで同時に進行していると彼は言う。
第一に、UIの変革である。従来のソフトウェアは、人間がUIをクリックしてタスクを完了するよう設計されていたが、AIの登場によりUIは動的に生成される「Generative UI」へと移行する。例えば、ユーザーが「新たな関税やホルムズ海峡の情勢が自社のサプライチェーンにどう影響するか」といった複雑な分析を自然言語で問いかけると、システムがSAPのデータと連携して深く分析し、結果を能動的に提示する。システムは夜間にデータを処理し、朝には「売上が減少傾向にある。これが推奨策だ」と提案する、プロアクティブでマルチモーダルな存在へと進化する。
第二に、ビジネスプロセスの変革である。従来の「見積から入金(Order-to-Cash)」のようなプロセスは標準化された手順に従っていたが、AIエージェントの導入により、構造化データと非構造化データ(メールや文書など)をシームレスに統合し、より柔軟で効率的なプロセスが実現する。これは「Software as a Service」から「Service as a Software(成果としてのサービス)」へのパラダイムシフトである。
第三に、データレイヤーの変革である。SAPは企業の総勘定元帳、請求書、在庫情報など極めて価値の高いデータを保有しているが、AIの真価を引き出すには、これらのデータを他の多様なデータソースと統合し、調和のとれた意味論的なビュー(semantical view)を構築する必要がある。「AIはデータの質に依存する」という原則に基づき、SAPはこのグローバルに調和されたデータモデルの構築に注力している。
エンタープライズAI導入のスケーリング課題
Herzigは、エンタープライズにおけるAI導入の最大の技術的課題は、AIそのものではなく、「AIに正しい行動を大規模に教えること」だと断言する。2年前、誰もがRAG(検索拡張生成)サービスを構築し、10個のドキュメントを使ったチャットボットのPoC(概念実証)でCEOを驚かせることができた。しかし、SAPのような大企業の顧客は常に「スケールの問題」に直面する。100のドキュメントでは少し難しくなり、1,000のドキュメントでは深いエンジニアリングの課題となる。さらに、SAPのAIアシスタント「Joule」では、米国従業員とドイツ従業員では旅費規定に関する質問への回答が全く異なるべきであり、ユーザーの所在地、所属国、給与体系、適用税制といったマスターデータと連携する必要がある。これは非常に複雑な問題である。
同様の課題は、MCP(Model Context Protocol)のような標準化されたAPI連携にも存在する。昨年、誰もがMCPサーバーを簡単に構築できたが、それは10個のAPIレベルの話である。100個のAPIになるとコンテキストの肥大化(context bloat)が発生する。SAPには2万ものAPIが存在するため、このスケールの問題は極めて深刻である。Herzigは、これらの課題を乗り越え、財務、人事、サプライチェーンにまたがる統合されたエクスペリエンスを顧客に提供することが、SAPの最大のエンジニアリング上の挑戦であると述べる。
さらに、Herzigは「評価(evals)」の重要性を強調する。コード生成の分野でAnthropicやOpenAIが優れたモデルを構築できた理由は、プログラムがコンパイルされるか、ユニットテストに合格するかという明確な検証基準が存在したからである。しかし、財務のような領域で信頼性の高い成果を求める場合、「この入力に対してはこの出力が正しい」というデータ(グラウンドトゥルース)が必要となる。開発者は、コーディングエージェントに対して、セキュリティ、データプライバシー、コード品質など、すべての境界条件を記述し、エージェントが意図した通りに動作しているかを検証する「evals」を作成する必要がある。これは、かつての「テスト駆動開発(TDD)」の考え方が、AIエージェントの時代に再び重要性を増していることを示している。Herzigは、学生時代にGoogleのエンジニアが「テストを書くから5時に帰れる」と語っていたことを懐かしみながら、今こそその教訓が生きると語る。
検証可能性とエージェントマイニング
エンタープライズシステムにおけるAIエージェントの検証可能性は、コード生成ほど自明ではない。Herzigは、この問題に対して2つのアプローチがあると説明する。第一に、SAPは「システム・オブ・レコード(記録のシステム)」であるため、特定の指示に対してデータベース上でどのような結果が生じるべきかを正確に知ることができる。例えば、「見積から入金」プロセスが正しく実行されれば、売掛金は特定の税制に従って計上されるはずであり、これを検証基準として利用できる。
しかし、これだけでは不十分である。真に自律的なエンタープライズを実現するには、システムに記録されていない「暗黙知(tribal knowledge)」を捕捉する必要がある。これは、SlackやTeamsのチャンネル、あるいは電話での会話の中にのみ存在する知識である。Herzigは、エージェントが判断に迷った際に人間に確認(Human-in-the-loop)を求め、その際に得られた意思決定のコンテキストを記録する「エージェントマイニング(Agent Mining)」という概念を提唱する。これは従来の「プロセスマイニング」を進化させたものである。
エージェントマイニングにより、ユーザーがシステムに入力したすべての意思決定の痕跡(decision traces)を記録する。これにより、ある地域のチームが標準業務手順から逸脱した行動を取っていることを異常として検出したり、逆に、その逸脱がより効率的な新しい方法であると判断されれば、それを新たな標準として昇格させることができる。こうして、すべてのトレースとフィードバックが新たなデータソースとなり、より良い評価(evals)を生み出し、システムを望ましい成果へと最適化する「データフライホイール」が回り始める。これこそが、エンタープライズAIにおける検証可能性を高めるためのSAPの戦略である。
ツールコーリング vs. コンピュータユース
エージェントがエンタープライズソフトウェア内でビジネスプロセスを実行する方法として、APIを介した「ツールコーリング(Tool Calling)」と、人間のように画面上のUIを操作する「コンピュータユース(Computer Use)」の2つのアプローチが存在する。Herzigは、現時点では明確な答えを持っていないとしつつも、大部分のユースケースではツールコーリングが主流になるとの見解を示す。その理由は、APIを通じた構造化されたアプローチの方が、ブラウザを常時開いておく必要がなく、より効率的で信頼性が高いからである。
しかし、APIが存在しないレガシーシステムや、UIが極めて複雑なケースでは、コンピュータユースアプローチが補完的に重要な役割を果たすと彼は予想する。現状のコンピュータユースは動作がやや遅いという課題があるものの、その進歩は目覚ましく、特にUIオートメーションが困難だった領域で価値を発揮するだろう。Herzigは、両方のアプローチが状況に応じて使い分けられる、ハイブリッドな未来を想定している。
エージェントが価値を生む領域と予測モデルの限界
エージェントが最も効果を発揮する領域は、まず非構造化データの世界である。大規模言語モデル(LLM)はテキストや画像の処理に優れており、サービス、サポート、営業、そしてドキュメントを多用するナレッジワークにおいて、迅速な投資対効果(ROI)が期待できる。先述の「Joule for Consulting」もこの好例である。しかし、より大きな価値は、非構造化世界と構造化世界(テーブルデータ)の融合にある。例えば、自然言語でデータベースに問い合わせ(Natural Language to SQL)、対話的に分析を深め、ダッシュボードを動的に生成するといった機能が、ビジネスユーザーのデータ活用を根本的に変えつつある。
ここでSarah Guoは、現在のAI業界の主流とはやや異なる、Herzigの「予測モデルとテーブルデータ」への関心を掘り下げる。Herzigは、LLMは言語モデルであり、シーケンス・トゥ・シーケンスでトークンを生成する仕組み上、需要予測やキャッシュフロー予測といった「予測」タスクには本質的に適していないと指摘する。これらのタスクでは、XGBoostやAutoGluonといった古典的な機械学習アプローチが依然として有効だが、その適用には高度なデータサイエンティストの人材が必要であり、スケーラビリティに欠けるという課題がある。
例えば、ある製薬会社が90カ国で支払遅延予測モデルを構築する場合、各国ごとに2つのモデル(分類と回帰)が必要となり、合計180ものモデルを個別に訓練、データキュレーション、特徴量エンジニアリングする必要がある。これは極めて非効率である。そこでSAPは、トランスフォーマーアーキテクチャをベースにしながらも、テーブルデータに特化した「RPT(Relational Pre-trained Transformers)」という新しいモデルを2年間の研究を経て開発し、NeurIPSなどの会議で発表した。このモデルは、少量のデータから高精度な予測を可能にし、ビジネスインパクトをより多くの人々が享受できるようにする可能性を秘めている。Herzigは、これが「予測の民主化」につながると期待している。
エンタープライズAI導入の障壁と未来の働き方
エンタープライズにおけるAI導入の最大の障壁は、依然として「データ」である。多くの企業では、過去の買収やソリューション選定の結果、データが高度に断片化(disaggregated)している。このデータの分断が、AIの可能性を著しく制限している。Herzigは、データ統合の「宿題」を済ませている企業ほど、AIの恩恵を享受しやすいと指摘する。第二の障壁は「スケール」であり、複雑なシステム環境を統一されたエクスペリエンスで提供することの難しさである。第三に「セキュリティ」が挙げられる。例えば、オープンソースのエージェントフレームワーク「OpenClaw」は革新的だが、そのまま企業にデプロイすることはセキュリティ上、不可能である。最近発見された「LLMの脆弱性」のように、キーや認証情報を盗まれるリスクは、CISO(最高情報セキュリティ責任者)にとって致命的である。
AIが成功裏に導入された未来において、財務、人事、サプライチェーンのチームの仕事はどう変わるのか。Herzigは、多くの単純作業(情報収集や意思決定のためのパワーポイント作成など)がエージェントに置き換わると予測する。その結果、従業員はより多くのシナリオを検討し、より深い洞察をより迅速に得ることで、戦略的思考に集中できるようになる。これは、ジュニア開発者がAIコード生成ツール(Codexなど)の登場により、コードを書くことからコードのレビューや監督、そして「次に何を構築すべきか」という本質的な問いへと役割をシフトさせたことと完全にパラレルである。すべての役割とレベルが「一段階引き上げられる(upleveled)」とHerzigは表現する。
AI時代の価格モデル変革
AIの導入は、SAPのビジネスモデルそのものにも変革を迫っている。従来、SAPのソフトウェアは主にシート(ユーザー数)ベースのライセンスで販売されてきた。しかし、AIの価値はユーザー数ではなく、実際の消費量や成果に基づくべきであるという認識から、SAPは段階的に「消費ベース(consumptive)」の価格モデルへと移行しつつある。さらに将来的には、検証可能性が高まるにつれて、Sierra社などが先駆ける「成果ベース(outcome-based)」のライセンスモデルも視野に入れている。
ただし、現時点ではハイブリッドモデルを採用している。顧客企業は、コストの予測可能性を重視するため、純粋な消費ベースモデルへの移行にまだ準備ができていないケースが多い。また、AIの成果に対する信頼性もまだ完全には確立されていない。そこでSAPは、消費ベースの要素を取り入れつつも、顧客が求める予測可能性を提供するハイブリッドモデルを設計し、顧客の準備状況に合わせた段階的な移行を支援している。この移行のスピードは、業界全体としても不確実であり、顧客ごとに異なる「旅路(journey)」であるとHerzigは述べる。
AI時代の勝者とSAPの耐久性
Sarah Guoは、SaaSやソフトウェア全体に対する市場の評価が厳しくなる中で、SAPのような既存大手がなぜ生き残れるのか、そして勝者の特徴は何かを問う。Herzigは、結局のところ「顧客への成果と導入(adoption)」が全てであると答える。テクノロジーそのものは、ほとんどの顧客にとって重要ではない。SAPの役割は、テクノロジーを「見えなくする(make the technology disappear)」こと、つまり顧客の目の前に価値を直接届けることである。そのためには、価格設定も顧客にとってwin-winとなるものでなければならない。
SAPは、特定のAIモデルプロバイダー(OpenAI、Anthropic、Googleなど)に過度に依存せず、すべてのパートナーシップを活用するアーキテクチャ上の柔軟性を重視している。差別化につながらない技術スタックの部分はコモディティ化が進むと見切り、SAPのコア価値であるエンタープライズ品質(セキュリティ、統合、スケーラビリティ)と、顧客がこれらのAI機能をほぼ瞬時にオンにして価値を享受できる「導入のしやすさ」に集中投資する。価値を享受するまでに時間がかかれば、投資対効果(ROI)のビジネスケースは成り立たなくなる。この「顧客のビジネス成果へのフォーカス」こそが、AI時代の勝者と敗者を分ける決定的な要素であるとHerzigは結論づける。
CTOの1日と顧客の生の声
Herzigは、CTOとしての日常を、チームとの進捗レビュー、データベースからモデル、UIに至るまでの全レイヤーにわたるガイダンス、外部技術動向の調査、そして自身によるプロトタイピングに費やしていると語る。彼は常にコマンドラインで何かを試しており、そのインスピレーションをチームにフィードバックしている。そして何より、顧客との対話を重視する。顧客は「自分たちを正直に保ってくれる」存在であり、現状の技術で何ができて、どこを改善すべきかを教えてくれるからだ。
具体的な顧客の課題として、彼は「需要予測の精度を3〜4%向上させてほしい」という要望を挙げる。これは顧客にとって数百万ドル単位の価値に直結する。また、ある宝飾品メーカーの顧客は、金や銀などの商品価格高騰というビジネス上の課題を抱えていた。Herzigは、このような場合、技術を売り込むのではなく、まず「現在のビジネス上の最大の課題は何か」を聞くことから始める。その上で、新しい製品の市場適合性(PMF)の調査、新しいサプライヤーの開拓、製造プロセスの変更など、技術を後ろから当てはめる(work backwards)アプローチが最も効果的だと彼は強調する。
量子コンピューティングへの関心
最後に、HerzigはSAPの業務外での技術的関心として、量子コンピューティングへの強い興味を明かす。特に、物流における「巡回セールスマン問題」や「ナップサック問題」といった最適化問題に注目している。現在の古典的なコンピュータでは、問題の規模が大きくなるにつれて近似解しか得られないが、量子コンピュータのハードウェアが成熟すれば、これらの問題をより効率的に解く可能性がある。SAPは、特定のハードウェアに依存しないアプローチで、量子アルゴリズムの研究を早期から進めており、将来的に顧客のルート最適化や排出量削減に貢献できると期待している。この話題は、エンタープライズの世界にも、CRUDアプリケーションを超えた深遠なコンピュータサイエンスの課題が無数に存在することを示唆しており、Sarah Guoは「多くの人が想像する以上に、エンタープライズには興味深い問題が溢れている」と締めくくった。
結びに
本エピソードは、SAPという巨大企業のAI戦略を、CTOの視点から詳細に描き出した点で極めて価値が高い。特に印象的なのは、Herzigが「AIの導入は技術的な問題ではなく、ビジネスモデルと組織の変革である」と一貫して主張したことだ。彼の語る「テクノロジーを見えなくする」という哲学は、AIが真に価値を発揮するためには、ユーザーが技術の存在を意識せずに成果を得られる状態を目指すべきだという、極めて実践的な指針である。また、コード生成で成功した「evals」の概念を、複雑なビジネスプロセスに適用するための「エージェントマイニング」というアイデアは、エンタープライズAIの信頼性を高めるための具体的なロードマップを示している。スタートアップや新興AI企業が「破壊」を語る一方で、SAPのような既存大手が「規模の複雑さ」と「顧客の現実」を正面から捉え、地道に課題を解決しようとする姿勢は、AI業界のもう一つの重要な側面を浮き彫りにした。このエピソードは、AIの未来を語る上で、テクノロジーの可能性と同時に、その導入を阻む現実的な壁を理解することの重要性を改めて認識させてくれる。
要点
- SAPのCTO Philipp Herzigは、AI導入を「UIの動的生成」「ビジネスプロセスのエージェント化」「データレイヤーの統合」という3層の変革として捉えている。
- エンタープライズAI導入の最大の課題は、AIそのものではなく、2万ものAPIと複雑なマスターデータを抱える環境で「正しい行動を大規模に(at scale)教える」ことにある。
- Herzigは、AIエージェントの信頼性を高めるために、人間の意思決定の痕跡を記録し、新たな評価基準(evals)を生成する「エージェントマイニング」という概念を提唱している。
- LLMは非構造化データに強いが、需要予測やキャッシュフロー予測のような「予測タスク」には本質的に不向きであり、SAPはテーブルデータに特化した独自のトランスフォーマーモデル「RPT」を開発している。
- SAPは、AI時代の価格モデルを従来のシートベースから消費ベースへと移行しつつあり、将来的には成果ベースのモデルも視野に入れているが、現時点では顧客の予測可能性を重視したハイブリッドモデルを採用している。
- Herzigは、AI時代の勝者の条件は「顧客のビジネス成果へのフォーカス」と「テクノロジーを見えなくする(make the technology disappear)」能力にあると断言する。
- 量子コンピューティングに関して、SAPはハードウェアに依存しない形で、物流最適化(巡回セールスマン問題など)のためのアルゴリズム研究を早期から進めている。