motpod
Rebuild · 2026年5月27日

426: Keynote as Org Chart (yuka)

AI generated article / ja / study
この記事でわかること
  • Google I/O 2026を中心に、AIエージェントが急速に浸透するテクノロジー業界の現在地を、ゲストのYuka Ohishiさんとホストの深井がリアル収録で語り尽く...
  • [0:00] Google I/O 2026の全体的な印象とテーマ 今年のGoogle I/Oのキーノートは火曜日に行われ、前日の月曜日はクリエイター向けイベント、水曜日...
  • しかし、深井は毎年のGoogle I/Oで感じる違和感として、「Googleのオーグチャートがそのままキーノートの順番に出てきすぎていて、同じようなプロダクトや機能が別々...
こんな人向け

英語Podcastの要点を、聴く前に日本語で把握したい人。

出典Podcast

Rebuild / Tatsuhiko Miyagawa

Read
Open episodeFind more episodes

Google I/O 2026を中心に、AIエージェントが急速に浸透するテクノロジー業界の現在地を、ゲストのYuka Ohishiさんとホストの深井がリアル収録で語り尽くした回。今年のI/Oのテーマは「エージェント」一色で、検索、ドキュメント作成、ショッピング、コーディング支援に至るまで、あらゆるプロダクトにAIエージェントが組み込まれつつある。しかし同時に、Googleの組織構造を反映したかのような重複したプロダクト名や混乱を招くブランディング、そしてAIが仕事や学びの現場にもたらす実存的問いにも踏み込んだ、密度の高い対話となっている。

0:00Google I/O 2026の全体的な印象とテーマ

今年のGoogle I/Oのキーノートは火曜日に行われ、前日の月曜日はクリエイター向けイベント、水曜日にも何らかのセッションがあった。全体を通じたキーワードは「エージェント」と「エージェンティック」で、昨年が「AIがいろんなところに入ってくる」年だったのに対し、今年は「それがエージェント化して、一問一答でなく勝手にやってくれる」方向へと進化した印象だとYukaは語る。具体的には、ショッピングの自動化や検索結果からの直接的なアクション、バイブコーディング的な体験が可能になりつつある。

しかし、深井は毎年のGoogle I/Oで感じる違和感として、「Googleのオーグチャートがそのままキーノートの順番に出てきすぎていて、同じようなプロダクトや機能が別々のプロダクトに乗ってくる」点を指摘する。これは大企業にありがちな問題だが、消費者としては「あれ?これ何だっけ?」と混乱しやすい。キーノートの長さも年々増加しており、恒例のバージュ(お決まりの演出)が35分にも及んだことで、全体の構成が散らかった印象になったという。

3:11Gemini 3.5 Flashとモデル戦略の変化

キーノートの冒頭では新しいモデル「Gemini 3.5 Flash」が発表された。まだPro版は来月以降のリリースだが、3.5 Flashは3.1 Proよりも性能が良く、スピードも速い。3.5 Flash Liteよりは遅いものの、性能面では3.1 Proを超えている。当日からGeminiアプリでデフォルトとして使えるようになり、実際に使ってみたYukaは「Extended Thinkingにしても結構早い」と評価する。ただし、日常使いの範囲では性能の差を実感しにくいとも述べている。

一方で、3.5 Flashは値段が高くなっている。一般ユーザーがGeminiアプリを使う場合にはレートリミットがかかるようになり、API経由の料金も3.1に比べて高くなった。深井は各社のAPI価格を比較し、「一番安いのはOpenAIのGPTで、Anthropicはめちゃくちゃ高い。10倍くらいする」と指摘する。OpenAIはモデルを出すごとにどんどん安くなっており、利益が出ているのか疑問に思うほどだという。これは「どれだけ垂れ流す体力があるか勝負」であり、電力とお金の勝負になっている。

コーディング能力の向上がアピールされているが、深井は「ほとんどのエンジニアはClaude CodeかGPTのCodexを使っている」と指摘する。Geminiでコーディングと言われてもピンとこないのは、ブランディングとプロダクト戦略の問題だ。Claudeは「Claude Code」というわかりやすい名前で提供されているのに対し、Geminiには「Gemini Code」のような直感的な名称がなく、別ツールの「Antigravity CLI」に統合されることになった。しかもAntigravity CLIのコマンド名は「agy」でタイプしづらく、AGIを連想させる名前になっている。さらに、これまでオープンソースだったGemini CLIがAntigravityに移行することで非公開になる点も、コミュニティにとっては微妙な変化だ。

8:53Google DocsとYouTubeへのAI統合

Google Docsでは、1分ほど喋り続けるとドキュメントが自動生成されるデモが紹介された。途中で言い間違えた場合も「さっきのやめてこっちで」と指示すれば修正される。これは他ツールでやっていたことをDocs内で完結できるようにしたもので、他のGoogleツールと連携して「あそこに書いてあったやつを参照してこれを作って」といった使い方も可能になる。Notionなど既存のドキュメントツールがすでにAI機能を搭載している流れの延長線上にある。

YouTubeでは、例えば「DaVinci Resolveの使い方」を調べると、該当箇所から再生されたり、サマリーやトランスクリプトが表示されるようになる。YukaはYouTuberとして、これがSEOにどう影響するか気にかけている。深井は「すでに自分も長い動画をGeminiに食わせてタイムスタンプ付きで見たいところだけ調べている」と述べ、チュートリアル系の動画では「情報を得たい」という目的が再生回数よりも優先される傾向があると分析する。ただし、該当箇所が短くてすぐ離脱されると、アルゴリズム上は良いシグナルにならない可能性もある。

14:54Google Search AI Modeと「disregard」問題

Google検索のAIモードがアップデートされ、デフォルトになる方向性が示された。さらに、検索結果の中で簡単なソフトウェアのようなものを作れる機能もデモされた。しかし深井は「これはGoogleの社員しか意味がわかってないのでは」と疑問を呈する。一般ユーザーにとって「Google」と「Search」は同一視されており、「Searchの機能です」と言われてもピンとこない。

話題を呼んだのは「disregard」問題だ。Google検索で「disregard」や「ignore」「never mind」と入力すると、AIモードが「承知しました。これまでのやり取りは無視します」と応答してしまう。これはプロンプトインジェクションのような現象で、検索結果のトップに表示されてしまう。日本語でも「無視して」と入力すると同様の現象が確認された。ただし、英語版は修正されたが、日本語版はまだ直っていない。深井は「Googleの昔のモットーは、検索結果の画面に長く滞在させないで情報にすぐアクセスさせることだったのに、今はAIで解決したりツールで遊べるようにしたりと、滞在時間がKPIになっている気がする」と指摘する。

19:34Gemini Sparkと音声入力の浸透

Gemini Sparkは、Claude CodeやCodex、Claude Coworkのようなエージェント型ツールだが、大きな違いはクラウド上のVMで動作するため、24時間いつでも動き続け、ラップトップを閉じても大丈夫な点だ。これは「エンジニアが移動するときにラップトップを閉じない」という最近のソーシャルメディアでの話題にも関連する。深井は「昔から閉じない人はいたが、最近はM1 Macの立ち上がりが早くなったので閉じることも増えた」と語る。

音声入力のトレンドについて、深井は「この1ヶ月ほど家でTypeWhisperという音声入力アプリを試している」と明かす。タイピングより圧倒的に早く、AIエージェントが相手なら多少の誤認識も意味を汲み取ってくれる。ただし、クラムシェルモードでPro Display XDRを使っている場合、マイクがない問題に直面する。YukaはInsta360のカメラをマイク代わりに使っているが、音声入力専用デバイスの登場も予想される。実際、7-8年前に同僚がアクセシビリティ目的で音声コーディングをしていた例も紹介された。

深井は音声を使ったブレインストーミングの効果も実感している。ポッドキャストのリサーチをエージェントに任せたところ、出てくる内容が期待とずれていたため、音声で壁打ちしながら方向性をすり合わせる方法に切り替えた。テキストより音声の方が脳が活性化され、考えがまとまりやすいという。

29:17Universal Cartとエージェントコマースの標準化

Googleが発表した「Universal Cart」は、Google SearchやGemini、YouTubeで見つけた商品をカートに入れてトラッキングできる機能だが、夏頃リリース予定で米国限定と見られる。これはStripeが推進するエージェントコマースの標準プロトコルに関連している。現在、Googleが提唱するプロトコルと、StripeやCloudflareが進める別のプロトコルの2種類が存在し、Stripeは両方に対応する方針だ。

深井は「サイトごとに使えるプロトコルが違ったら意味がないので、サイトとAI会社の間で取り決めをして支払えるようにする標準を作っている」と説明する。このプロトコル推進のために、Google I/OでUniversal Cartを無理やりアナウンスした可能性を指摘する。裏側には大人の事情があるというわけだ。

31:42Gemini Omni、Flow、Pix——混乱するプロダクト群

Gemini Omniは、テキスト、画像、音声、動画を入力として受け付け、動画を出力するマルチモーダルモデルだ。これまでのVeoやWhitt、Nano Bananaを置き換えるものなのか、それとも別物なのか、両者とも明確な答えを持ち合わせていない。FlowはそのOmniを使うためのプラットフォーム名で、より細かい設定ができる専門UIを提供する。Pixは画像編集に特化したツールで、Canva的な位置づけだが、Nano Bananaで画像生成できるのと何が違うのか、UIが専門化されているだけなのか、区別がつきにくい。

深井は「2つのチームが別々のものを作った結果、同じものができちゃって名前だけが分かれている感じがする」と分析する。Google Photosがある中で「Google Pix」という名前は破滅的だと笑いを交えて批判する。さらに「Google Vids」という名前もあり、これは単にVeoのことだという。このネーミングの混乱は、Googleの組織構造そのものを反映している。

36:01Intelligent Eyewearとメタグラス戦略

Googleは昨年アナウンスしたAIグラスについて、今年は外観が公開されたが実機はなく、実際に見ることはできなかった。今年秋に発売されるのは、Ray-Ban Meta方式(ディスプレイなし、オーディオのみ)のもので、ディスプレイ付きバージョンはまだデモ段階だ。深井とYukaは両者ともRay-Ban Metaを持っており、最近日本でも購入者が増えていることを話題にする。Meta AIアプリから「誰々がMeta AIを使い始めました」という通知が頻繁に来るようになったという。

GoogleのIntelligent EyewearはAndroidでもiOSでも使える点が利点だが、デモで紹介されたDoorDashの注文機能については「普通にボイスアプリでやりたい」と深井は冷めた反応を示す。一方、Android Intelligenceが先週リリースされたことで、OS統合によるエージェント機能がグラスでも使える可能性に期待を寄せる。Yukaは「Appleにも同じことをやってほしいが、まだできていない」と指摘する。メタはハードウェアとエコシステムの両方が不足しているため、Android XRが普及すればGoogleに有利に働くとの見方だ。

42:31AIが変える仕事と学びの未来

Googleの元CEOエリック・シュミットが大学の卒業式でAIについてスピーチした際、学生からブーイングが起きた事件に話が及ぶ。Yukaは「『あなたたちはもう必要ありません』みたいに聞こえてしまうのかもしれない」と分析する。エントリーレベルの職やエンジニアリングの仕事がAIに置き換えられる懸念は現実的で、一人ができる生産性が飛躍的に向上する一方で、雇用にどう影響するかが課題だ。

深井は「AIを使いこなせるようになれば、今まで何年もかかっていたことが短時間でできるようになる」とし、学生にはClaudeやGPTのプロプランが無料で使える環境を活用すべきだとアドバイスする。スタンフォード大学のキャンパスでは「Vibe Coding 1 on 1」という看板も見かけ、サンフランシスコの広告はAIエージェント関連のものばかりだという。ただし、AIにコードを書かせて「全然ダメだった」と諦める人が多いのも事実で、深井は「なぜダメなのかを調べたり、自分だったらこうするという方法を教えたり、ドキュメントに保存させたりするコツが必要」と強調する。AIを「インターンや部下のように考える」のが良いという。

48:12リビルドの制作現場におけるAI活用

深井はリビルドの配信・編集ワークフローにAIを積極的に導入している。従来は手動で行っていたGoogleカレンダーの作成、YouTubeライブのセットアップ、Dropboxのショーノート作成などを、Claude Codeのエージェントスキルとして自動化した。「明日やります」と言うだけで手順通りに全て実行してくれる。YouTube Data APIを使うには申請が必要で、スクリーンキャスト動画の提出を求められるなど面倒な手続きがあったが、仮のテンポラリーアクセスで運用している。

YukaはVibe Codingで、動画の字幕データと音声データを一括アップロードするツールを作成した。複数言語のSRTファイルをアップロードする作業が大幅に効率化されたという。深井はさらに「放送作家くん」というシステムを開発中で、リアルタイムの文字起こしと事前のショーノートをAIに与え、現在の話題やメモを画面に表示する仕組みを構築した。ただし、今回の収録ではオーディオチャンネルの問題でうまく動作しなかった。このシステムはGemini 3.1 Flash Liteという安価なAPIを使っており、2時間の配信でも約1ドルという低コストで運用できる。

55:53BTSアリランツアーとカルチャー談義

Yukaがカリフォルニアに来た理由の一つはBTSのアリランツアーで、深井も別の席ながら同じ日に参加した。会場はスタンフォード・スタジアムで、フットボール用の360度スタジアムのためどの席からも見やすく、約4万人収容と比較的小規模だった。前回コールドプレイが使用して以来2回目のライブ開催だという。次のラスベガス公演は6万人規模で、Yukaはその後ニューヨークを経てWWDCにも参加する予定だ。

メンバーの推しについて、深井は「NAMさんが好き」と明かし、英語も日本語も堪能なインテリジェントなキャラクターを評価する。Yukaは「日本のファンはジミンとジョングクから入る人が多いが、アメリカではラップラインファンがすごく多い」と指摘し、文化による好みの違いを興味深く語る。

1:00:22WWDC 2026への期待とApple Intelligenceの課題

WWDCは6月8-9日頃に迫っており、Apple Intelligenceの大幅なアップデートが期待される。GeminiベースのモデルがApple Intelligenceに統合される可能性もあるが、一方でOpenAIがAppleを提訴する可能性があるというニュースも話題になった。現在Apple Intelligence内でChatGPTが使えるが、その存在が深い階層に埋もれており、Apple Intelligence自体のユーザーも少ないため、OpenAI側が契約違反ではないかと主張しているという。次期バージョンではAppleが自社モデルに切り替える計画もある。

深井はApple Intelligenceの実用的な問題として、Siriの言語とiOSの設定言語が異なるとApple Intelligenceが使えないという制約を挙げる。バイリンガルユーザーにとってこれは深刻で、iOSの言語を日本語に変更すると、Apple Payの住所表記が日本語になったり、サードパーティアプリの言語設定が変更できなかったりする弊害がある。Googleの方がバイリンガルユーザーを理解しており、Geminiの言語設定だけを変えれば済むのに対し、Appleの場合はSiriの言語変更が重い作業になる。Yukaも「Apple Musicの歌詞翻訳がiOSの言語に紐付いていて、韓国語の歌詞を日本語訳で見たいのに英語になってしまう」と不満を漏らす。

まとめ

今回のエピソードは、Google I/O 2026で発表された数多くのプロダクトを単に紹介するだけでなく、その背後にあるGoogleの組織課題、プロダクト戦略の混乱、そしてAIエージェントが現実の仕事や生活にどう浸透しつつあるかを、実践者の視点から深く掘り下げた回だった。特に印象的なのは、AIツールを「使う側」としての具体的なワークフロー改善事例と、それでもなお残る人間の判断やブレインストーミングの重要性への言及だ。AIエージェントが急速に進化する中で、技術の進歩と人間の役割の変化を冷静に見つめる視点が、このエピソードの価値を高めている。

要点

  • Google I/O 2026のテーマは「エージェント」で、検索、ドキュメント、ショッピング、コーディング支援など全プロダクトにAIエージェントが統合されつつある
  • Gemini 3.5 Flashは3.1 Proを超える性能だがAPI価格は上昇、OpenAIは逆に値下げを続けており価格競争が激化
  • Googleのプロダクト名(Antigravity CLI、Gemini Omni、Flow、Pix、Vidsなど)は組織構造を反映して混乱しており、消費者にとってわかりにくい
  • Google検索のAIモードで「disregard」と入力するとプロンプトインジェクション的に応答する問題が発生、日本語版は未修正
  • 音声入力が急速に普及し、タイピングより圧倒的に効率的だが、クラムシェル環境でのマイク問題やオフィスでの使用制限が課題
  • Universal Cartやエージェントコマースの標準化はStripeやCloudflareとのプロトコル競争の最中にあり、実用化はまだ先
  • AIを効果的に使うには「インターンや部下のように扱う」姿勢が重要で、失敗したら理由を調べ、ドキュメントに保存させる習慣が必要
  • Apple Intelligenceはバイリンガル対応が不十分で、言語設定の制約がユーザー体験を損ねている
  • リビルドの制作現場ではClaude CodeやYouTube Data APIを活用した自動化が進み、低コストで効率的な運用が実現している
  • AIエージェントの進化により「アイデアがあれば作れる」時代になったが、何ができて何ができないかの判断力は依然として人間に求められる
426: Keynote as Org Chart (yuka) | Rebuild | motpod | motpod