西田宗千佳のイマトミライ
第294回
マイクロソフト「BUILD」とGoogle I/O エージェント軸で拡大する開発競争
2025年5月26日 08:20
2週間、アメリカを取材のために回ってきた。その中でも、テクノロジー系のイベントとして大きなものだったのが、5月19日から米シアトルで行なわれた、マイクロソフトの年次開発者会議「Microsoft Build 2025」と、5月20日から米マウンテンビューで開催された、Googleの年次開発者会議である「Google I/O 2025」だ。
後者はコンシューマ向けにもインパクトのある発表が多く、報道も多かったように思う。筆者も多数記事を書いた。
一方Buildは、他社のイベントに比べて「基調講演での発表が本当に開発者向け」なので、いまひとつ目立ちにくいところはある。去年は前日に「Copilot+ PC」戦略が発表されているが、今年はそうした大物はない。
ただ、どちらもある種通底するトレンドはあり、パラダイムシフトが見えるという意味で、今回はどちらも面白いイベントだったように思う。
その変化とは「エージェント基盤への移行」であり、「AIとともにコーディングする時代」の明確化だ。
その結果として、我々が使うサービスにも変化が生まれてくることになる。
「Agent Factory」を目指すマイクロソフト
テック業界のトレンドとして、「AI」「エージェント」というテーマはもはや珍しくない。生成AIをソフト開発のツールにするということも、最近は生成AIとの対話だけでコードを書く「Vibe Cording」というキーワードが注目を集めるようになった。
そういう意味で、マイクロソフトが今回打ち出したこと自体はそこまで新しい話ではない。
そのためか、発表の中でどの部分にフォーカスして記事を書くのかはメディアや筆者によってかなり変わってくる。新聞などでは「イーロン・マスク氏率いるxAIのGrokにマイクロソフトが対応した」ことに注目したところも多かったようだ。
一方で、テックメディアは、「エージェントへの注力」を見出しにとるところが多かった。
両者の方向性は異なるが、「AI関連開発基盤の整備」という意味では通底している。
過去、マイクロソフトはOpenAIとの連携を強調していた。現在もOpenAIは主要なパートナーである。Open AIのサム・アルトマンCEOは基調講演にビデオで登壇し、マイクロソフトとの関係を強調した。先日OpenAIが発表したコーディングエージェント「Codex」についても、マイクロソフト傘下のGitHubとの共同作業で得られた知見から生まれたことなどを話している。
一方で、マイクロソフト自身はクラウドプロバイダーであり、ソフト開発者に幅広い選択肢を提供することが重要になる。AIの基盤モデルについても「多数のものから選べる」という方向に向かっている。xAIのGrokをサポートするのもそのためだ。
AIの開発基盤を広げるにはOpenAI一辺倒であることはある意味マイナスでもあり、関係を維持するところとそうでないところが明確になってきている。
それを経済報道的な視点から見ると「OpenAIとの方向性のずれ」になるし、テック視点で言えば「エージェント時代の基盤強化」になる。
マイクロソフトは「OSで稼いだ」「オフィスソフトで稼いだ」と言われるが、その本質は「開発環境」の会社だ。クラウドインフラの時代になり、同じような観点でAWSやGoogle Cloudなどのライバルが増えているが、WindowsやクラウドインフラであるAzureの上で「ソフトやサービスを作ってもらい、全体の利用量を増やす」ことがビジネス基盤である。
マイロソフトのサティア・ナデラ 会長兼CEOは、講演の中で「Agent Factory(エージェント工場)」という言葉を何度も使った。これは、1975年にビル・ゲイツ氏が発した「Software Factory(ソフトウエア工場)」という言葉をもじったものである。ソフトウエアのニーズ拡大に備え、ソフトウエア工場のように効率的にソフトを開発していく基盤を用意する……という発想を、今後拡大するエージェントの市場に当てはめたわけだ。
今回、マイクロソフトは50以上のエージェント関連技術を発表しているが、まさに「AI Factory」に備えたものと考えるとわかりやすい。
例えば、昨年のBuildでは、Windows 11の中にオンデバイスAIの基盤モデルを複数用意し、ソフトの中で活用できる「Windows Copilot Runtime」が発表されていた。今年はそれが進化して「Windows AI Foundry」になった。その結果として、Windows 11内でローカル動作するAIエージェントの開発も可能になっている。
基盤モデルをローカルで動かすという話だと、WindowsだけでなくMacも視野に入っている。
GitHubとVS Code、そしてコード用エージェントである「GitHub Copilot Agent」も、開発促進のための機能の1つだ。エージェントとGitHubを介してソフトを作っていくことで、生産性の確保を狙う。
これはソフト開発者をAIで置き換えるというより、ソフト開発の面倒な部分をAIに置き換えて、細かい操作をせずともソフト開発を進めていける……という側面が大きい。
マイクロソフトは「エージェントの時代には開発が必要なソフトが増える」と予想している。ある種のポジショントーク的な面はあるが、おそらくその予測は正しい。
だとするなら、AIを使って開発を楽にする、AIを使ったソフトの開発を推進するのは必須であり、まさに「Agent Factory」の流れと言える。
一方で、エージェントを作る・使うのはソフト開発者だけではない。現場で必要なものを用意するのも必須で、その部分は、Microsoft 365のエージェント構築機能でカバーする。
Agentic Webの時代を目指して
今回、マイクロソフトのテーマは「Agentic Web」だった。前出の基盤整備も、Agentic Webをあたりまえのものにするための準備、と考えればいいだろう。
Agentic Webとはどんな存在なのか? その点は、以下の画像を見るのがわかりやすい。
AIを使った多数のサービスが生まれており、複数のAIが連携して働いてある目的を果たす、という形になりつつある。いわゆるエージェントの活用だが、そのためには、AIが活用するデータソースも必要だし、ウェブへのアクセスも必要になる。さらには、AIが特定のユーザーのためにウェブサイトを生成して活用することも必要になる。
そのためにマイクロソフトが提唱したのが「NLWeb」である。
マイクロソフトのケビン・スコットCTOは、「NLWebは、エージェントのためのHTMLのようなもの」を説明している。
これはウェブにチャットインターフェースを追加することを可能にし、あらゆるウェブサイトを、自然言語でコンテンツを検索できるAIアプリへと変化させる仕組み、と言える。
AIエージェントと情報を紐付け、処理可能にする仕組みとしては「MCP」があり、エージェント同士は「Agent2Agent」で連携するが、さらにその下のレイヤーで、多くのウェブとの橋渡しをする。
そうやって、ネット上のあらゆる情報とサービスにエージェントがアクセス可能になっていけば、利用者は毎回自分でウェブにアクセスして操作するのではなく、「エージェントにお願い」することで作業が完結するようになる。
エージェントによる自動化、といってしまえば話は簡単なのだが、単純作業の繰り返しではなく、人の指示によって生まれる毎回異なる作業を代わりにこなしてくれる……と考えた方がいい。
以下は、日本語のウェブをエージェントがアクセスし、チケットの予約をするまでのデモだ。マイクロソフトの提供によるものだが、実際すでに行なえる。このような流れを一般化し、当たり前のものとすることを目指しているわけだ。
現在はまだ、そのための基盤は完全なものではない。だから無駄も多いし制限も多い。安全かつ確実なエージェントの世界を目指すなら、基盤整備が必須であり、そのためには多数のコードが必要になってくる。それはAIと人間のコラボレーションで生み出され、ソフト開発者の働き方を変えていくことと同時に動いていく……というのが、マイクロソフトの考え方といっていい。
そのバックボーンとなるのはクラウドインフラであるし、各個人が使うクライアント(PCやスマホ)である。その中で使うAIの基盤技術や、クライアント用OSはシンプルに1社で独占できる時代ではなく、マイクロソフトとしては「Azure+Windowsを推進するが、全体としてはオープンかつ開発効率の高い世界になることが、結果としてAzureやWindowsの利用も促進する」という考え方であるのだろう。
GoogleのコアになるGeminiと「Project Mariner」
もう一つのイベントであるGoogle I/Oは、検索へのAI導入やXRプラットフォーム「Android XR」の発表など、マイクロソフトとは違った部分に注目が集まっていたように思う。
だが「エージェントによるインターネットの再構築」という根幹を見れば、マイクロソフトとGoogleの方向性はかなり近しい。
たとえば、今回の発表の中でも1つの軸にあったのが、昨年来Googleが開発していたエージェント技術「Project Mariner」だ。
Project Marinerはウェブブラウザー向けのエージェント。Geminiを活用し、ウェブへエージェントがアクセスし、様々な作業を行なうことを目指した技術だ。ショッピングやチケットの予約など、これまでなら人間が行わねばならなかったことをエージェントが代わりに行なう。
アメリカではテスト公開が始まったところだが、今後この技術をGoogleは広範に使っていく。
ウェブブラウザーであるChromeには「Gemini in Chrome」という機能が盛り込まれ、Geminiとのチャットからエージェントがウェブブラウザーにアクセスし、様々な作業を行なえるようになる。
Google I/Oでは、ネット検索にAIを本格的に持ち込んだ「AI Mode」が公開された。結果としてより複雑なネット検索が可能になるが、このAI Modeの中ではこの夏にもProject Marinerが活用される。すると、チケットの購入やレストランの予約のような作業は、ネット検索の一環として行なえるようになるのだ。
さらには、Android XRのようにGemini=AIが背後で動いているプラットフォームからは、エージェントに対して仕事を依頼し、さらにエージェントから「人間が判断すべきこと」「この後人間がすべきこと」などを指示され、行動するようになるだろう。スマホでもPCでも同様だろうが、常に身につけていて、文字や音が自分にしか伝わらないウェアラブルデバイスは、エージェントを使うのにより向いている。
マイクロソフトにしろGoogleにしろ、エージェントによる作業は「ウェブやアプリをできるだけ書き直すことなく」実現しようとしている。
とはいうものの、今後エージェントからのアクセスが増えるとするならば、「人間によるアクセス」「特定の人物の依頼を受けたエージェント」「高速アクセスを目的としたボットソフトウエア」「不正アクセスを目的としたボットソフトウエア」などをサービス側が見分けつつ、安全かつ効率的に処理する基盤が必須になってくる。
そういう意味で、両社のメッセージは同じ方向を向いており、それをどの部分で競い合うのか、という姿勢が異なる……といって良さそうだ。
マイクロソフトは主にクラウドインフラと開発基盤(GitHubやVS Code)でリードし、GoogleはGeminiという強力なAIプラットフォームと検索、さらにはそこに紐づく広告やショッピングで差別化する。
もちろん両社は、特にクラウドインフラ事業では競合ではある。だが、ある意味で強みが異なっており、それを認め合いながら「エージェント」という巨大なトレンドに向けて、開発者全体を誘おうとしているように、筆者は感じている。