
Google パートIII:AI企業
- Google Part III: The AI Company — 完全ダイジェスト Googleは自社の研究ラボで生み出したTransformerという革新的技術によっ...
- [0:00] 序章:Googleが直面する究極のジレンマ BenとDavidは、Googleが直面する状況を「イノベーターのジレンマ」の教科書的な事例として提示する。Go...
- 「もし究極の検索エンジンがあったとしたら、それはウェブ上のすべてを理解し、あなたが何を望んでいるかを正確に理解し、正しいものを提供するものだ。それは明らかに人工知能だ」—...
英語Podcastの要点を、聴く前に日本語で把握したい人。
Acquired / Ben Gilbert and David Rosenthal
Google Part III: The AI Company — 完全ダイジェスト
Googleは自社の研究ラボで生み出したTransformerという革新的技術によって、現代のAI革命の基盤を築きながら、その技術を活用したChatGPTの登場によって完全に不意を突かれるという、史上最大の「イノベーターのジレンマ」に直面している。本エピソードでは、2001年の最初の言語モデルからGoogle Brainの創設、Transformerの誕生、DeepMind買収に端を発する人材流出とOpenAIの創設、そして現在のGeminiへの総力戦に至るまで、Googleの20年以上にわたるAIの旅路を完全に描き出す。ホストのBen GilbertとDavid Rosenthalは、世界最高のビジネスがなぜ非営利からスタートアップに転身した組織に追いかける立場になったのか、そして検索という年間1400億ドルの利益を生む機械を守りながら、いかにして自らを破壊的に革新できるのかという核心的な問いに迫る。
序章:Googleが直面する究極のジレンマ
BenとDavidは、Googleが直面する状況を「イノベーターのジレンマ」の教科書的な事例として提示する。Googleは90%の市場シェアを持つ検索市場の独占企業であり、そのビジネスは巨額のマージンを生み出している。しかし、自社の研究ラボで生まれたTransformerという発明が、既存の検索製品よりも多くの目的において優れた製品を生み出す可能性を秘めている。問題は、この新しい製品が従来のキャッシュマシンほどの収益性を実現する方法がまだ見つかっていないことだ。
「もし究極の検索エンジンがあったとしたら、それはウェブ上のすべてを理解し、あなたが何を望んでいるかを正確に理解し、正しいものを提供するものだ。それは明らかに人工知能だ」——これは2000年にLarry Pageが語った言葉であり、Googleが創業時からAI企業であったことを示している。
言語モデルの夜明け:2001年のマイクロキッチンでの会話
2001年、Googleの初期エンジニアであるGeorges Harikと新入社員のNoam Shazeer、Ben Gomesがマイクロキッチンでの昼食中に交わした会話が、GoogleのAIの歴史の始まりだった。Harikは博士課程での研究から「データを圧縮することは、それを理解することと技術的に等価である」という理論を持ち出した。情報を小さく圧縮し、後で元の形に復元できるのであれば、そのプロセスを実行する何かがデータの意味を実際に理解している必要があるという考え方だ。
この会話に触発されたShazeerとHarikは、他のすべての仕事を放棄して言語モデルの研究に没頭する。多くの同僚は彼らの取り組みを無駄だと考えたが、伝説的なエンジニアSanjay Ghemawatが「いいアイデアだ」と支持したことで、二人は自信を持って研究を続けた。この研究から生まれたのが、確率的階層的推論学習器「Phil」と名付けられた言語モデルであり、Google検索の「もしかして」スペル修正機能や、後にAdSenseのコンテンツ理解エンジンとして活用されることになる。
Google翻訳と大規模言語モデルの実用化
2007年、Google翻訳の主任アーキテクトFranz Ochは、DARPAの機械翻訳チャレンジで驚異的な成果を上げた。彼のチームは2兆語のコーパスで訓練したNグラム言語モデルを構築したが、問題は1文の翻訳に12時間もかかることだった。Jeff Deanがこの問題に介入し、アルゴリズムを並列処理用に再設計。翻訳時間を12時間から100ミリ秒に短縮し、Google翻訳に実装した。
この成功により、Googleは言語モデルの可能性を確信する。検索クエリの予測、AdWordsの広告品質スコアの計算など、中核ビジネスへの応用が急速に進んだ。同時期、Larry PageはStanford AI研究所のSebastian ThrunをGoogleに迎え入れ、AI研究者をアカデミアからGoogleに引き入れる流れが始まる。
Google Brainの誕生と「猫論文」
2007年12月、Sebastian Thrunはトロント大学の比較的無名な機械学習教授Geoff HintonをGoogleに招き、ニューラルネットワークに関する講演を依頼した。当時、ニューラルネットワークはAIのサブフィールドとして軽視されており、Hintonの研究は異端視されていた。しかし、GoogleのエンジニアたちはHintonの深層学習の可能性に強く惹かれた。
2011年、Andrew NgとJeff Dean、Greg Corradoの3人はGoogle X内の第2プロジェクトとして「Google Brain」を立ち上げる。彼らは「DistBelief」という分散システムを構築し、16,000のCPUコアを使用して9層のニューラルネットワークを訓練。YouTubeのラベルなしフレームから「猫」を認識することに成功した。この「猫論文」は、大規模ニューラルネットワークが教師なし学習で意味のあるパターンを学習できることを証明し、Google内で深層学習への認識を一変させた。
AlexNet:AIのビッグバン
Geoff Hintonのトロント大学の研究室では、Alex KrizhevskyとIlya Sutskeverという2人の大学院生が画期的な研究を進めていた。彼らは、CPUではなくNvidiaのGeForce GTX 580という市販のゲーミングGPU2枚を使用して深層ニューラルネットワークを訓練。ImageNetコンペティションでエラー率を25%から15%へと40%改善し、AIのビッグバンと呼ばれる瞬間を創り出した。
この成功を受け、Hinton、Krizhevsky、Sutskeverの3人はDNN Researchという会社を設立。Baiduが1200万ドルで買収を提案したことをきっかけに、Hintonは驚くべきオークションを仕掛ける。Harrah's Casinoのホテル部屋から、Baidu、Google、Microsoft、DeepMindの4社による競売を実施。最終的にGoogleが4400万ドルで落札し、3人はGoogle Brainに加わることになる。
DeepMind買収:すべてを変えた蝶の羽ばたき
2010年、Demis Hassabis、Shane Legg、Mustafa Suleymanの3人がDeepMindを設立。彼らの目標は「汎用人工知能(AGI)」の実現だった。当時、AGIという概念は「狂人のフリンジ」と見なされていた。資金調達のためにPeter ThielにアプローチしたDemisは、チェスの話から巧みに会話を展開し、Founders Fundから200万ドルのシード資金を獲得。さらにElon Muskも投資家として加わる。
2013年、Mark ZuckerbergがDeepMindの買収を試みる。これを知ったElon MuskはTeslaの株式での買収を提案するが、Demisは自動運転専任を拒否。最終的にLarry Pageが直接交渉し、Googleは5億5000万ドルでDeepMindを買収。この買収は、独立した監督委員会の設置やロンドンでの独立性維持など、異例の条件で成立した。この買収に激怒したElon Muskが、後にOpenAI創設の原動力となる。
OpenAIの創設:人材流出の始まり
GoogleによるDeepMind買収に激怒したElon Muskは、2015年夏、Sand Hill RoadのRosewood HotelでSam Altmanと共に運命的なディナーを開催する。目的は、GoogleやFacebookに吸収されたAI研究者たちを引き抜くことだった。しかし、ほとんどの研究者は「Googleを離れる理由はない」と回答。ただ一人、Ilya Sutskeverだけが興味を示した。
「リスクはあると思うが、非常に興味深い試みでもある」——これほどIlyaらしい言葉はない。GoogleがJeff Deanを通じて倍額のオファーを提示したにもかかわらず、IlyaはOpenAIへの参加を決断。彼の決断が他の研究者たちの流出を促した。OpenAIの設立時の誓約資金は10億ドル(実際に集められたのは約1億3000万ドル)で、Elon Musk、Sam Altman、Reid Hoffman、Jessica Livingston、Peter Thielが出資した。
TPU:Googleの秘密兵器
AlexNetの成功後、Googleは深層学習への本格的なシフトを決断。2014年、Jeff DeanとJohn GiannandreaはNvidiaから4万基のGPUを1億3000万ドルで調達する計画を立案。財務部門は反対したが、Larry Pageが「Googleの未来は深層学習にある」と直接承認した。
しかし、GPUへの依存は新たな問題を生んだ。音声認識機能を全Android端末に展開した場合、Googleのデータセンターを倍増させる必要があるとJeff Deanが試算。そこでGoogleは独自のカスタムチップ「TPU(Tensor Processing Unit)」の開発に着手する。15ヶ月という驚異的なスピードで設計・製造され、ハードドライブと同じフォームファクターに収めることで既存のサーバーラックにそのまま組み込めるようにした。現在、Googleは推定200〜300万基のTPUを運用しており、Nvidiaの年間出荷台数約400万基に迫る規模となっている。
Transformer:「Attention Is All You Need」
2017年、Google Brainの8人の研究者が「Attention Is All You Need」という論文を発表。このTransformerアーキテクチャは、それまでのLSTM(Long Short-Term Memory)の限界を打破し、テキスト全体に「注意」を向けることで並列処理を可能にした。Noam Shazeerがコードベースをゼロから書き直し、LSTMを凌駕する性能を実現。モデルを大きくすればするほど結果が良くなるというスケーリングの法則が確認された。
しかし、Googleはこの革新的技術の真の可能性に気づくのが遅れた。論文の最終段落で「画像、音声、動画への応用」を予告しながらも、実際の製品化は限定的だった。ShazeerはGoogle内でチャットボット「Mina」を構築し、検索をTransformerモデルに置き換えるよう提唱したが、安全性の問題やビジネスモデルの壁に阻まれた。皮肉なことに、論文の8人の著者は全員が後にGoogleを去り、OpenAIやCharacter.AIなどの競合を立ち上げることになる。
ChatGPTの衝撃とGoogleの「コードレッド」
2022年11月30日、OpenAIはChatGPTをリリース。Sam Altmanのツイートから始まったこの製品は、1週間で100万ユーザー、2ヶ月で1億ユーザーを獲得し、歴史上最速の成長を記録した。GoogleのSundar Pichaiは即座に「コードレッド」を発令。AIが「持続的イノベーション」から「破壊的イノベーション」へと一夜にして転換した瞬間だった。
2023年2月、MicrosoftはOpenAIの技術を搭載した新しいBingを発表。Satya Nadellaは「Googleを踊らせてやる」と宣言した。Googleは急遽、Lambdaモデルをベースにしたチャットボット「Bard」を公開するが、ローンチビデオで誤った情報を表示するなど、惨憺たる結果に。株価は8%下落した。
Geminiへの統合と再起
Sundar Pichaiは2つの大きな決断を下す。第一に、Google BrainとDeepMindを統合し「Google DeepMind」を設立。Demis HassabisがAI部門のCEOに就任した。第二に、全社で統一モデル「Gemini」への標準化を決定。Jeff DeanとNoam Shazeerが共同テクニカルリーダーを務める。
2023年12月にGeminiを公開後、Googleは驚異的なペースでモデルを進化させる。2024年2月には100万トークンのコンテキストウィンドウを持つGemini 1.5をリリース。2025年には2.0、2.5 Proと次々にアップデートを重ね、AIモードをgoogle.comに統合。現在、Geminiの月間ユーザー数は4億5000万人に達している。
Waymo:もう一つのGoogle級ビジネス
2004年のDARPAグランドチャレンジに端を発する自動運転技術は、Sebastian ThrunのStanfordチームが2005年に優勝。2009年、Larry Pageの「技術的に不可能な理由は何か?」という問いにThrunが「ただ怖いだけだ」と答え、Google Xの最初のプロジェクト「Project Chauffeur」が始動。
18ヶ月で「Larry 1000」(カリフォルニアの難関10区間、約1000マイル)を達成した後、製品化にはさらに10年以上を要した。2020年10月、フェニックスで世界初の完全無人タクシーサービスを開始。現在はサンフランシスコ、ロサンゼルス、オースティン、アトランタの5都市で運行し、週200万回以上の有償走行を実施。サンフランシスコではLyftを上回るグロスブッキングを記録している。
Waymoの安全性データは驚異的で、人間のドライバーと比較して重傷・死亡事故が91%減少。CDCの試算では、米国の自動車事故による年間総コストは4700億ドルに上り、Waymoが事故を10分の1に減らせれば4200億ドル以上の社会的価値を生み出す可能性がある。
現在のGoogle:AI時代の勝者となるか
現在のGoogleは年間3700億ドルの収益、1400億ドルの利益を生み出す世界最高のビジネスである。市場価値は3兆ドルを超え、Nvidia、Microsoft、Appleに次ぐ世界第4位。クラウド事業は年率30%成長で500億ドル規模に達し、TPUを活用した独自のAIインフラ戦略が奏功している。
しかし、AI製品の収益化は依然として課題だ。検索のユーザーあたり年間400ドルの収益に対し、AIチャットの収益モデルは未確立。Googleは唯一、自社でファウンデーショナルモデル、チップ、クラウド、アプリケーションの4つの柱すべてを持つ企業であり、この統合された強みが最終的な勝因となる可能性がある。
まとめ
本エピソードが描き出すのは、自ら生み出した破壊的技術によって自らのビジネスモデルが脅かされるという、イノベーターのジレンマの最も純粋な事例である。GoogleはTransformerを発明しながら、その真の可能性を活用する機会を逃し、OpenAIという競合を生み出すきっかけを作った。しかし、コードレッド以降の迅速な組織再編と製品投入は、同社が依然として驚異的な実行力を持つことを示している。
Larry PageとSergey Brinは「AIで負けるくらいなら倒産したほうがまし」と繰り返し語ってきた。しかし、AIが検索ほど優れたビジネスにならない可能性もある。使命の達成と既存事業の保護の間で、Googleは史上最も困難なバランスを取ることを求められている。この物語は、テクノロジー企業が自らの成功にどう向き合うかという、普遍的な問いを投げかけている。
要点
- Googleは2001年から言語モデルの研究を開始し、Phil、Google翻訳、Google Brainと段階的にAI能力を構築してきた
- 2017年のTransformer論文「Attention Is All You Need」は現代のAI革命の基盤だが、Googleはその真の可能性を活用するのに遅れをとった
- DeepMind買収(2014年、5億5000万ドル)に激怒したElon MuskがOpenAI創設の原動力となり、Googleからの人材流出が始まった
- ChatGPTの登場(2022年11月)はGoogleに「コードレッド」を発令させ、BrainとDeepMindの統合、Geminiへの一本化という抜本的な組織改革を促した
- TPUはGoogleの独自AIチップ戦略の中核であり、Nvidiaへの依存を減らし、トークン生成の低コスト化を実現している
- WaymoはサンフランシスコでLyftを上回る規模に成長し、事故削減による社会的価値は年間4200億ドル以上と試算される
- Googleはファウンデーショナルモデル、チップ、クラウド、アプリケーションの4つの柱すべてを持つ唯一の企業だが、AIの収益化モデルは依然として未確立
- 検索という年間1400億ドルの利益を生む機械を守りながら、自らを破壊的に革新するというジレンマが、Googleの未来を左右する