
エンジニアたちが切磋琢磨し、競い合うAIコンテスト「AI Challenge Day」。過去最大の12社が集まった第4回では、長らく変わらなかった「ECサイトの顧客体験」をテーマに成果物を披露した。果たして1週間の開発成果や学びはいかに? 未曾有の2.5万字のテキストで、激闘のプレゼンを余すことなくお伝えする。
MCPも解禁 顧客エージェントに商品を買ってもらえるのか?
AI Challenge DayはASCIIと日本マイクロソフトがタッグを組んだ生成AI開発のコンテスト。神戸で開催された第1回を皮切りに、昨年は3回に渡って開催。のべ20社以上の日本マイクロソフトのパートナーが参加し、RAG、マルチモーダル、AIエージェントなどの各テーマで、成果物とスコアを競ってきた。
約半年ぶりとなった4回目は、6月18日に日本マイクロソフトの品川オフィスで開催。過去最大となる12社が参加し、1週間でAIの実装にチャレンジした。イベントの冒頭は、毎度愛のあるテーマで参加者を悩ませて、もとい楽しませてきた花ケ﨑伸祐氏からテーマが説明された。
今回のテーマはECサイトにおける「次世代の顧客体験を提案するアシスタント」で、5つの設問が用意されている。5問のうち4問は、「ECサイトにおける商品の検索体験が長らく変わっていない」という課題感から、次世代検索を実現するためのRAGの精度を競うもの。こちらはAI Challenge Dayが一貫して追及してきたテーマとなる。
そして残りの1問が今回の目玉。「店頭で得られる情報をオンラインでも可能にするハイパーパーソナライゼーション」というテーマで、接客エージェントの実装を競うものだ。具体的には日本マイクロソフトと、審査員としても参加したスキルアップNeXtが共同開発した顧客エージェントに対して、どれだけ購買を促せるかが鍵となる。RAGのみでは高得点をたたき出せないため、自ずとエージェント開発のスキルアップやチャレンジが要求されるわけだ。
ついにお客さまのエージェントまで作ってしまったAI Challenge Day。単に買わせるだけではなく、購入金額、満足度、購入までのターン数など16項目で評価されるため、開発にはさまざまな工夫が必要。しかも用意された顧客エージェントは最初5体だったが、開発期間中に2体追加されたため、難易度はさらに高まった。「けっこうチャレンジングな課題で、みなさま楽しめたのかなと思います」と説明する花ケ﨑氏も半笑いだ。
毎回恒例の“花ケ﨑氏の愛あふれる”データセットの量も過去最大となり、今回はAPIに加えて、いよいよMCPも提供されることに。各チームはこうしたデータやサービスを利用しつつ、出力結果をスコア付けし、得点をプレゼンで披露する。一方で、RAGやエージェントのアーキテクチャは自由に選べるので、チームはさまざまな試行錯誤が可能になっている。審査員紹介や今回のルールが説明された後、昼下がりの日本マイクロソフトのセミナールームで、各社8分ずつのプレゼンがスタートする。
「孤独なEC体験を楽しく創造的に」を掲げたアビームコンサルティング
トップバッターは第2回のAI Challenge Dayでグランプリを獲得しているアビームコンサルティング。今回は普段AIを中心に開発を行なっているメンバー4人と小売業界の知見を持ったプレゼンテーターの小野聖治氏でチームを構成している。
今回の問いを「生成AIとエージェント技術で、検索体験をどう再定義できるか?」と捉えたチーム。従来の検索体験における課題を「キーワード中心の検索のため、探索的な買い物が不向き。偶然の出会いや新しい気づきが得にくい」「スペックやレビューがユーザーの利用用途(用途、目的、制約)に即していないため、製品選定に自信が持てない」「ECでの買い物中に他社の存在を感じられず、信頼性や共感性が低く、購入の確信を得にくい」の3つに分類。「従来の検索体験は、選択の不安や偶発性の欠如などの多くの課題を抱えている」(小野氏)と指摘した。
この課題に対して今回開発したアプリは「探す楽しさを共有するAIアシスタント」をテーマに、買い物を単なる「消費行動」から、相手を想い・選ぶ「創造活動」に行動変容させる。具体的にはAIがユーザーの意図を深掘りし、新たな気づきを提供するインスピレーションフィードを作成。さらにギフトシナリオでプレゼントを贈る相手の活用シーンや提供シナリオを提案したり、SNS上の商品情報を取得し、ライブ感のある口コミを提示することで購買判断を支援。課題である「EC体験の孤独さ」を解消していくという。
チャットベースのUI/UXは「お母さんが息子にマイクラの文房具を探す」というリアルでありそうな実例を披露した。たとえば、マイクラについて知らないお母さんでも、「ドンキーコングが好き」とチャットに投げると、生成AIが特徴を調べてキャラクターを提案。また、プレゼントとしての特別感を演出する方法や商品の口コミも合わせて提示してくれるという。
エージェントのスコアは150.1点。やはり問5のペルソナの部分で苦労した。「購買者の意図を汲み取るべく、ストーリーを考えてみたものの、なかなかスコアが伸びなかった」(小野氏)とのことで、次回はデータのクレンジングを行ない、より精度を高めていきたいという。アーキテクチャは工数短縮のため、Azure AI Foundry Agent Serviceを採用し、検索や接客など役割の異なったエージェントを開発。ただ、セキュリティ面に関しては、手が付けられなかったと振り返る。
AIアシスタントの今後の展望としては「情報収集」から「感情に響く発見」へと進化させる。「人と人のとの間をつなぐ共感アシスタント」「あなたらしい選び方の理解」「探索が生み出すワクワクを、日常に」を掲げ、購買における体験価値そのものを再定義していく抱負を述べ、セッションを終えた。
審査員のマイクロソフトコーポレーション 岡田義史氏は、「誰かになにかを送りたいけど、相手の前提を知らない中で、贈り物を探すのは大変。実際、日本酒を飲まない私が、義理の兄に日本酒を送るとき、決め手になったのは美容師さんとの会話でした。まさにそういう"セレンティピティ”がデジタルの中に埋め込まれたら、もっと日本の良いモノを売っていけると感じながら、聞かせてもらった」とコメントした。
店舗とECとの連携、エージェントのメディア化など小売目線が光るアドインテ
2社目はアドインテの髙松築氏。同社はオンラインとオフラインをつなぐDX支援を提供する「Adinte DMP」を提供し、現在はメディア事業に注力するリテールのプロ集団だ。「最新の気合い(KiAI)を搭載したマルチエージェント」を謳う平均年齢27.6歳の若手メンバーを揃え、今回のイベントに臨んだという。
エージェントのスコアは155.611点と最高得点の74.1%という高得点。「けっこういい得点だと思いますが、伸び悩んだ部分もあります。特にタスク5は対話内容、トークン数、セキュリティなどは高評価だったんですが、購買につながるトークフローになかなかなりにくかったのが次の課題」と高松氏は語る。
アーキテクチャはAzure Well-Architected Frameworkに準拠。注目はECサイトのみならず店舗との連携を意識したところだ。「小売店さんは店舗を重視します。その意味で、今回のアーキテクチャは横展開が効く。Webチャットボットやサイネージ、ポイントアプリとの展開も想定している」と髙松氏。リテールを知り尽くした企業ならではの顧客のニーズに寄り添ったシステムと言える。
技術的には「今時MCPだろう」とのことで、MCPを全面採用。リテールで重要なデータ基盤も用意したほか、エージェントを制御できるCMSを用意した。「今後、このエージェントはメディアになっていくと思っている。ただのクロスセル、アップセルだけではなく、広告商材の提案までこのエージェントが担ってくれる。まさにエージェントがインフルエンサーのような立ち回りをしてくれる。そんな世界観まで想定した」と髙松氏はアピールする。
エージェントの開発に向けては、AutoGenの「Magentic-One」という最新のフレームワークを採用。また、Build 2025で発表されたAzure AI Searchの新機能をふんだんに利用し、Agentic RAGを実装した。クエリ計画を策定し、必要に応じて並列にクエリを実行し、マージすることで、高精度なRAGの実装を目指したという。また、プレビューの「マルチモーダル検索」や「ドキュメントレイアウトスキル」も活用。オーケストレーター、画像検索、DB検索、ナレッジ検索、ECサイトのアクションなど、それぞれのエージェントで適切なGPTを使い分けているという。
データのクレンジングにも配慮されている。今回はECサイトのバックエンドDBが用意されているが、花ケ﨑氏が用意したデータは精度のばらつきがある。「みなさん、気がつきました? 今回のデータはキログラムとグラムが混在しているんです。でも、不正なデータってパターンは多岐に渡るので、クレンジングは大変でした」と髙松氏は語る。
これに対してアドインテはAzure DatabricksのAI Functionsを用いて、動的にクレンジングできる仕組みを構築した。実は「インベントリテーブルにある在庫はマイナス1個」(髙松氏)という“花ケ﨑氏の罠”にも気づき、在庫の値はゼロに修正。「データの品質を担保することが、エージェントの品質を担保すること」とアピールした。
UIに関してはマルチチャネル戦略を採用。Webチャットはもちろん、LINEやポイントアプリ、店頭サイネージなど複数のチャネルで一貫したユーザー体験を重視している。Webチャットではクロスセル、アップセル、買い物かごへの追加などをカバー。ポイントアプリではあれば、家でポイントを見ていたら、在庫のある近所の店舗をオススメするエージェント、店頭サイネージであれば、お客さまとの対話からオススメ商品を提案してくれるコンシェルジュなどが作れるとのこと。「お客さまが欲しがっているモノの動画を動的に生成することも可能になる」と髙松氏は語る。
最後「Human-Agent Collaboration」を掲げたスライド。KiAI、Azure AI Stack、Development Copilot AIなどにより、マルチエージェントが人と共存する世界がまさに現実になってきていると髙松氏はアピール。「まさにAI Challenge Dayはマイクロソフトのプラットフォームで成り立つイベントだと思うので、今後も挑戦を続けていきたい」と語り、セッションを終えた。
審査員のASCII編集部 大谷イビサは、「8分間の情報量がすごかった。印象的だったのは、店舗とオンラインの連携をとても意識しているところ。リテールすごくやっている感を感じた。われわれも今お店に行くと、LINEの登録を勧められるが、こういう連携を意識して本気で作ってきやがったなと思いました。『MCPで全部やってやろう』とか、『エージェントがメディアになる』とか、『欲しいものが動画で出てくる』とか、買い物の仕方自体を変える取り組みがいっぱいで、すごくよかった」と熱くコメントした。
人手不足の店舗を救うマルチエージェントを意識したBIPROGY
3社目のBIPROGYは2回目の参加となる。プレゼンテーターの高場雄太氏は、「若手を集めたのですが、先ほどのチームの方が若かった(笑)」と、生成AIで作成した集合画像を披露。エージェントのスコアは157.024点と前の2社よりさらに上げてきた。「(タスク5の)エージェントがすごく難しくて、RAGのパートで得点を稼ぐようにした」というのが戦略だった。
続いてユーザー側のカスタマーストーリーを披露。現在のECサイトでは、「商品名がわからない」「商品の使用感がわかりにくい」「複数の商品にまたがる問い合わせがしたい」などのニーズがあるという。ここにAIエージェントを用いることで、対話から買いたい商品を推測して提案してくるだけではなく、SNSやレビューの情報を総括して提案してくれるという。また、複数の商品情報を整理して、商品をオススメすることが可能になる。
店舗側のカスタマーストーリーも披露された。店舗側は人手不足で、コンシェルジュがいなかったり、需要の多様化商品数の増加などが課題となる。「店舗の人手すら、どこにどんな商品があるかわからないこともある」と高場氏は指摘。また、多言語やクレームへの対応も必要。こうした課題に対しても、AIエージェントがあれば接客、多言語対応、クレーム対応などを行なうことで、店舗の負担を軽減できる。さらに専門のエージェントは、商品の評価や知識を持っているので、店舗スタッフの顧客対応や商品のプロモーションにも活用できるとアピールした。
続いて、これを実現するためのアーキテクチャの説明。一般的なアーキテクチャではあるが、BLOBストレージにエージェントに指示出しするためのコンフィグファイルが格納されているのが特徴だ。高場氏は、「AIエージェントは思ったのと違う動きをするので、設定を微妙に変更する必要が出てくるが、そのたびにコンテナを再起動してデプロイするのは手間がかかる。コンフィグファイルを外出しすることで、簡単にエージェントを更新できるようにした」と説明。運用時のメンテナンス性を高めている点が特徴だ。
マルチエージェントは、Semantic Kernelで構成。前述の通り、コンフィグファイルを一元管理し、プロンプトの調整を設定ファイルから簡単に行なえるようにしている。UIはECサイトにチャットメニューを設定しておき、開くとテキストだけではなく、ドラッグ&ドロップで画像を登録することも可能だ。また、チャットの会話から商品ページを開けるので、チャットをしながら商品内容や値段を確認することも可能になっている。高場氏はデモを披露し、登壇を終えた。
日本マイクロソフトの花ケ﨑氏は、「カスタマーストーリーでは、顧客側と店舗側でロジカルに課題を挙げていると思いました。特に店頭の顧客対応にエージェントを利用できるという点が優れており、店員さんが顧客対応に時間を費やしてもらって、バックエンドのデータ分析やリコメンデーションはAIエージェントに任せようという点に役割分担が感銘を受けました。戦略面では、エージェントで点数を取るのが難しいということで、RAGにシフトしたのがよかったのかなと。あとは信頼のSemantic Kernelを使っていただき、ありがとうございます。プロンプトを一元管理し、継続的に精度を上げるアーキテクチャになっていたのもよかった」と語る。
ユーザーが本当に欲しいものを会話から汲み取るブレインパッド
4番手はブレインパッドの久津見 祥太氏。2004年に設立されたブレインパッドは、リテールや金融など幅広い領域でユーザー企業のデータ活用を支援してきた。これまで1400社以上でデータによる意思決定をサポート。現在は200名以上のデータサイエンティストのほかエンジニア、コンサルタントなどデータに知見を持つ多数のメンバーで構成されている。
今回は新卒3年目という若い5名でチーム構成。エージェントスコアは142.0点だった。「最初は18点くらいだったのですが、マルチエージェントやRAGの構想を考えて、この点数に行き着いた。でも、うまく商品を買ってくれなかったり、もう少し(点数を)上げたかったなと言うのが本音です」(久津見氏)。
今回はマルチエージェントシステムを採用し、顧客対応のマネージャー、リサーチ、決済のトランザクションの3種類のエージェントを用意し、自身のタスクに専念できる環境を構築した。それぞれのエージェントがひも付けられたツールを利用し、データにアクセス。セマンティックハイブリッド検索を活用したり、データごとのインデックスを生成することで、自動で探索空間を切り替えることで、検索の精度を向上させた。
今回は「『検索』から『対話』へ、『推定』から『理解へ』」というコンセプトで開発を進めた。これまでは検索からレコメンドを行なったり、ランキングが表示されるというものだったが、AIエージェントの登場でユーザーとの対話が可能になっている。「これまでのID-POS、顧客マスター、行動ログなどのデータからの推定だけではなく、その場の気持ちや状況を知り、顧客の今に寄り添えると思っています」と久津見氏。単に商品を売るだけではなく、お客さまの目的を叶えるための提案ができる。これが今回のシステムの価値だという。
次世代の顧客体験も披露される。これまで店頭でしか受けられなかった対話や相談をエージェントと行なうことで購入につながり、さらにアフターサービスからパーソナライズまでの一気通貫の体験が行なえるというのがユーザー側の体験。また、店舗側も、これまで過去のデータだけでは難しかった顧客理解や共感に基づく購買喚起や提案までが可能になる。こうした新しい購入体験はエンゲージメントを高め、LTVの最大化につながるという。
カスタマーストーリーでは、「ユーザーが言葉に出している欲しいもの」と「ユーザーが本当に欲しいもの」には実は乖離があるのではないかという仮説があったという。たとえば、「軽量なPCがほしい」という大学生に対して、「いつ使うのか」「どうして欲しいのか」などのハイコンテキストな対話をエージェントと繰り返すことで、言葉にできない真のニーズや意図を汲み取り、本当に価値のある商品を提案する。これがユーザー側のカスタマーストーリーになる。
一方、店舗側は「表面的な購買意図から、隠れていた購買ポテンシャルを発見する」ことが可能になる。たとえば、「就活用のスーツってどれがいい?」という質問に対して、「清潔感が大事」「どんな業界?」といったハイコンテキストな対話をエージェントで重ねる。これにより、スーツ単体の購入にとどまらず、就活の成功という真の目的を見据えて、オンライン面接で便利な高画質なWebカメラまでクロスセルで提案できるという。
目指すカスタマーストーリーや顧客体験は明確だったが、エージェントの実装までは手が付かなかった。「将来的には一気通貫で相談から購入まででき、使い慣れたチャットUI、リアルタイムAPIを用いた音声認識の検索などを想定している」と久津見氏は語る。また、エンタープライズ実装についても未実施部分は多く、パフォーマンス、セキュリティ、コストといった非機能要件も考慮しなければならないと語った。
まとめとして、久津見氏は「『こういうのを作りたい』という目標に向けて、実際作ってみると動かないとか、さまざまな質問に対して網羅的に返答できるようにするのは難しいといったことを痛感した」とコメント。一方で、みんなで取り組むことで、「文化祭のような楽しみが生まれ、いい経験ができた」という感想もあった。
スキルアップNeXtの小縣信也氏は、「カスタマーストーリーは本当にその通りだなと思いました。ユーザーが指定したものを出すのではなく、本当に欲しいものを深掘りするというのは大事なこと。これがまさに次世代の検索システムになるんだと思いました。運営側でモニタリングさせてもらったが、投稿の件数自体は多くないけど、着実に点数を上げていた。想像なんですけど、仮説を立て、それを実践することで点数を上げていったのではないか。戦略がうまいと思っていました」と語った。
マイクロソフトのサービスにチャレンジしてみたクラスメソッド
5社目はまさかのクラスメソッド。大村貴俊氏は「ブログの会社です。この場では大人の事情で言いづらいブログが多いです。Azureをメインに使っていないメンバーが集まりました」とのこと。普段はAIのデータクレンジングにあまり関わらないメンバーをあえてアサインし、「イチからやるとどれくらいまでできるのか?をやらせてもらいました」ということで、5人のチームを構成した。
エージェントのスコアは149.400点。「もう少し点数上げられたかなというのが、われわれの総意だったりします」(大村氏)とのこと。カスタマーストーリーチームでは、ペルソナを一般客、子供、外国人、サブスク希望、クレーマーなどの7パターンに分け、慣れている人には少ない手順で、慣れていない人には手順を説明するという方針で設計。また、利用者の年齢も幅が合ったため、購買層を特定した魅せ方、予算を考慮した魅せ方などを考慮したという。
店舗目線のカスタマーストーリーでは、「1つのエージェントですべてのストーリーに答えるのは難しい」という前提から、エージェントの役割分担を考えた。具体的には、買い物のカート担当、クレーマー担当、外国人のお客さま担当、別の商品を勧める担当、会員ユーザーを新規獲得する担当などを用意し、それぞれを連携させればエージェントを柔軟に増やせるという。「季節商品を扱うエージェントを期間限定で開放するみたいなことが可能になる」と大村氏は語る。
アプリケーションスタックとしては、NodeとAgent Mastraを使い、MCPは使わずに、データベース、Web API、RAGなどを素直に呼びだすツールとして作った。エージェントがまとめて行なうワークフローに関しては、複数のツールやユースケースをまとめて呼んでいる。また、インターネット経由で不特定多数に利用されることを前提に、WAFの実装や監視の導入、Private Endpointの設置などを行なった。
実装時の工夫としては、「非構造化データのOCR化」「AI Searchによるセマンティックハイブリッド検索を構築」などを行なった。また、本来はRAGの非構造化データから構造化データという順番での検索が理想だが、実装時間が不足したため、RAGの検索結果と商品IDをひも付けるメタデータが作れなかった。そのため、ECエージェントが商品詳細を把握するため、構造化データから非構造化データへという順番で検索するようにした。「妥協した」とのことだが、これでも購入にはたどり着けたという。
大村氏は、「データソースの種類が多かったため、データの接続確認や前処理、ペルソナユーザーの状況確認に手が及ばなかったのは、今回もったいなかった。エージェントの工夫や改善にもっと時間を使いたかった」とコメント。とはいえ、何人かはAzure初めてというメンバーだったが、この短期間にシステムを組み上げ、点数も出たということで、手応えも感じたようだ。
日本マイクロソフトの内藤稔氏は、「まずは出てきていただいて、本当に感謝しています。いろんな意味で(笑)。僕が大谷さんといっしょにマイクロソフトのイベントでクラスメソッドさんの発表を聞くなんて、数年前は思ってもいなかったので。いろんな意味で。短い時間の中で、いろいろ学んでいただき感謝していますし、スコアがここまで伸びたのもすごいと思っています。あと、カスタマーストーリーで役割ごとにエージェントを分けるという話は秀逸で、いろいろな役割あるなと思って聞いていました。これを機会にぜひ仲良くしていただきたい」とコメントした。
バイブコーディングで理想のECサイトを目指したCommerble
6社目のCommerble(コマーブル)については、審査員の岡田氏が「ちょっと変わった発表かもしれません」と紹介。「普段からお客さまの体験ってどうあるべきなのか、哲学的な話もさせてもらっていて、登壇する竹原さんからもそんな話がある。コンペティションという形ではないかもしれませんが、聞き耳を立ててもらいたい」と紹介する。
そんなイントロの「チームCommerble」は、Commerble、シグマコンサルティング、pnop、オフィスワイカンなどのメンバーから成る急造チーム。「リアル店舗のように対話から生まれる購入体験をどこまでECサイトで実現できるか」をテーマに掲げ、コンセプチュアルなシステムを提案することにした。登壇した竹原貴司氏は、「今までのみなさんと全然違うモノになってしまいますが、笑って許してください」とセッションをスタートする。
「AIと言えば、われわれ開発者にとってもっともホットなのはバイブコーディングですよね」と第一声。今回のデモアプリもプロトタイプをバイブコーディングで作り、問題を小さく切り分けて、それぞれをまたバイブコーディングで作り、成果物をエンジニアチームに渡して、システムに組み込んだという。
あとは開発中のビデオを流しながらの説明。Pythonプロジェクトを作成し、VSCode+GitHub Copilotでプロンプトのプロトタイプを作り、その後共有しやすいようにC#に変換。商品検索プロンプトを生成し、これをLLM+RAGに読み込ませて、検索結果を得る。そしてUIはメッセージから属性を判断して動的に生成する。「入力内容にあわせてターゲット層が変化したり、見た目も変化する。カラーパレットも毎回違うものが生成される」と竹原氏は解説する。
成果物のデモも動画で紹介。ユーザーの入力内容から、プロフェッショナルユーザーであることを判断。Bing Searchを組み込んだLLMにプロンプトを投げると、ユーザーに応じた商品リストや見た目が現れる。また、「老人会で使っている」とヒントを渡すと、カラーリングもシニア向けになり、画像やフォントも大きく表示される。「バイブ感、出ますよね」と竹原氏が満足そうに語ると、会場からも笑いが漏れる。
続くデモで「X-Boxのゲーム機欲しいんだけど」と投げると、最初はAIも若年層だと判断するが、「パパにおねだりしたら、あたしに買ってくれるとママが言ってたから、一番いいやつ教えて」と言った途端に、AIはファミリー層に設定を変更する。Bing Searchを用いて、いろいろなECサイトを横断し、なおかつ口コミまで調べてリストを掲出してくれる点も未来感があった。
LLMは背後でなにをやっていたのか。まずはチャット内容からターゲット層をLLMに推論させ、UI(HTML/CSS)と検索プロンプトから「自然な検索文」を生成。その検索プロンプトを使って、LLM+RAG(今回はGrounding with Bing Search)が適切な商品を検索している。
最後、竹原氏は「われわれエンジニアだけがバイブコーディングのメリットを得られるわけじゃないのでは?」と会場に問いかける。また、EC事業者向けにはAIにいかにうまく情報を提供できるか、SEOではなく、AIOが重要になると指摘。「理想のECに向けてがんばっていきましょ」とセッションを締めた。
Commerbleとやりとりしてきた日本マイクロソフトの岡田氏は、「今はこんな笑顔でセッションしてもらいましたが、裏ではいろいろなドラマがございました。ご覧の通り、スコアもない。でも、今回チャレンジしているみなさんに、何か新しい気づきを与えたいという熱い想いがありました。AI駆動、そしてバイブコーディングの時代になることで、ソフトウェアエンジニアやEC事業者、生活者にどんな影響が出てくるのか見られるなら、ぜひチャレンジしてほしいとお願いしました。今の話を聞いてディスカッションされたい方はいっぱいいると思う。Commerbleさんとネットワークキングでからんでもらって、いろんな知見を引き出してもらいたい」とコメントした。
EC使わない人向けのUIが印象的だったソフトクリエイトホールディングス
休憩を挟んで7社目の登壇は、ソフトクリエイトホールディングス ecbeingの太田優一氏。AI Challenge Dayへの登壇2回目となるソフトクリエイト、ecbeingに、今回ATLEDまで加わった5人のチームで、渋谷のMicrosoft Baseで構築したという。
普段からECパッケージを展開しているecbeingだが、「親近感の湧くテーマながら、プレッシャーを感じて開発しました」と太田氏。エージェントのスコアは149.226点で、「購買のところをもっとがんばれば、スコア上げられたな」とちょっと残念そうだ。
カスタマーストーリーは「AIサービスを導入しても使われない!」という店舗側の課題感からスタートした。AIチャットも使われず、検索も従来型の方がメイン。サイトの滞在時間も短く、AIがオススメした商品があまり購入されないといった精度面も課題に挙げられた。
この背景として、そもそもECサイトを訪れる顧客は、買いたいモノが決まっていて、買う方法もわかっていることが挙げられる。そのため、チャットボットをサイトに置いても使われない。そのため、今回は「ECサイトを利用していない顧客」にこそAIエージェントを使ってもらい、次世代の購入導線を作ることにした。
ペルソナとしては店舗重視のお客さまを掲げた。こうしたお客さまには、「ECはよくわからない。面倒くさい」「実物を見たい」「会話しながら商品を決めたい」「自分にぴったりの商品をオススメしてほしい」「商品をしっかり説明してほしい」というニーズやバックグランドがあると仮説を立てた。こうした課題を解決すべく、特に注力したのは、音声とタップ操作だけで買い物可能なUI/UX。太田氏はさっそく動画でUI/UXを披露する。
たとえば、音声で「クリーパーのグッズがほしい」というと、最適な商品を検索し、リストアップ。会話は機械的ではなく、つなぎの言葉が入っており、人間の対応らしさを演出。ボタンも「興味あり」「興味なし」を選ぶだけで、きわめて直感的だ。もちろん店頭や窓口にも設置可能。「時間があればAzureのアバターサービスで本当に人間みたいな店員が作りたかったが、そこまでは無理だった」と太田氏は語る。
会話できるAIエージェントの導入により、従来のECサイトでは難しい、家族構成、恋人、誕生日などの情報を会話の中から学習し、自分以外にパーソナライズされたギフトの提案も可能になる。一方、子供が間違って買ってしまうという事例にも対応しており、「Human in the loop」を実装した承認機能で、不測の事故や間違い、いたずらを防止する。
アーキテクチャとしては、リアル店舗のスタッフを意識し、7対のエージェントを配置。「口も、耳も、手もあって、スマホで調べ物ができるみたいなことを意識しました」と太田氏。また、当初はSemantic Kernelで設計していたが、「せっかくのChallenge Day」とのことで、誰もさわった事のなかったAutoGenを採用。「全然ネットに情報がなく、バージョンアップも激しかったですが、花ケ﨑ブログを参考に、がんばらせていただきました」と太田氏は振り返る。
AutoGenでは、プランナーのエージェントが他のエージェントにタスクを割り振る「SelectorGroupChat」というフレームワークを採用。このフレームワークを使うことで、たとえば「写真に写っているキャラクターの商品、全部欲しい」というリクエストが来た場合、プランナーのエージェントは、キャラクターの特定は画像専門エージェント、グッズ検索はリサーチ班のエージェント、返信は回答作成役のエージェントにタスクを割り振る。なるべく1つのタスクに専念させることで、精度を向上させるように配慮したという。
開発で工夫したのは「質と量の向上」で、検証と改善のサイクルを簡単に回せるようにした。まずは初日のうちにデータセットの特徴を把握し、逆説的にタスクを洗い出した。また、エージェントの履歴や採点結果、前回との差分をビジュアライズできるツールを開発。スコアを向上させる体制を自ら作り上げた。会話を繰り返すことで、使えば使うほど進化するペルソナDBも構想したが、今回は実現にまでは至らなかったという。
苦戦したのは、AutoGenの実装。旧バージョンの情報が多く、最新バージョンの情報やマルチエージェントの実装例を探すのに苦労し、MCPなど外部呼び出し時のエラーハンドリングに苦労した。また、AIエージェントエージェントは対話のみならず、内部の振る舞いまでデバッグする必要があり、単純に文章量が多かったこともあり、検証に時間をとった。あとはMCPとの接続を最終日にやったため、早期に仕様確認やAPIとの接続テストをやればよかったという反省もあった。
最後に太田氏は、「仮説と検証のサイクルを何度も回せたのは純粋に楽しかった。夜中まで盛り上がっていました(笑)」とイベントの感想を披露。今後はエンタープライズでも同じようなサイクルを回しつつ、既存プロダクトや社内業務にもエージェントを適用していきたいと抱負を語った。
審査員の大谷氏は、「ソフトクリエイト/ecbeingさんは初回の神戸にも参加してくれたのですが、まさにウェルカムバック。前回もそうだったんですが、このチームはけっこう無茶するんですよね(笑)。今回はAutoGenがまさにそうなんですが、情報や経験がない中、苦労して使っているのは、まさにこのチームらしいなと思いました。あと、ECを使っていない人をターゲットにしているのは面白い。そういった人たちはたとえば百貨店の外商みたいなサービスを利用する方たち、得意先専門の営業さんがお客さまと会話をしながら買い物するという世界を、磨きをかけたAIエージェントで実現できるのではないかと期待しています」とコメントした。
個人情報や人とのAIの役割分担まで踏み込んだヘッドウォータース
8社目はヘッドウォータース。普段はAIを用いて顧客や社会の課題を解決しており、ベテランから今回最年少と思われる22歳のメンバーまで含めて5人が参加した。リモートワーク主体のため、今回も集合写真は生成AIで作成。「2割増しでかっこよく、私は3割増してプロンプトを作っています」(竹川氏)とのことだ。
さて、エージェントのスコアは180.789点で、一気にトップに立った。「今回すごい数サブミットしました。そうしたらAzureのアラートが鳴りまして、あやうく評価対象外になりかける」(竹川氏)というピンチをかいくぐって得た点数だという。
アーキテクチャとしては、Azure Well-Architected Frameworkを採用。「ただ、AIエージェント時代には、Azure Well-Architected Frameworkになにかしらの要素が必要なのではないか」という議論を社内で行なった。具体的にはEntra Agent IDによる識別や認可、最小権限の原則、Microsoft Purview DSPM for AIによるガバナンスやアクションログの可視化といったエージェントの権限管理が必要だという結論になった。
「今回はRAGでデータをとってきていますが、今後は個人情報など機密性の高いデータにアクセスします。こうしたところでエージェントの権限管理はしっかりやっていかなければならない」(竹川氏)とのことで、マイクロソフトでの機能強化を前提にアーキテクチャを設計しているという。具体的にはAutoGenでマルチエージェント、マルチモーダルを実装し、MCP連携も図った。こだわりは「データの前処理」で、全員でデータを検証し、方向性を決定したという。
また、今回はGraphRAGにも挑戦した。きっかけは月曜日に出された新しいルールで、属性情報を使って良いと言われたこと。「これをどのように管理したほうがよいかを悩みました」(竹川氏)。加えて違和感があったのは、なぜ今回SQL Serverではなく、PostgreSQLなのかという点だ。ここからBuild 2025で発表されたPostgreSQL向けのAIエージェント向け拡張で実現できるGraphRAGのナレッジグラフに行き着く。具体的には過去の対話履歴から抽出されたユーザー属性情報からパーソナライズなナレッジグラフを構成し、この結果が高スコアに結びついたのではないかと分析した。
カスタマーストーリーに関しては、やはり「探す」と「迷う」が課題。情報量と選択肢の多さがユーザーのストレスになっているため、これをエージェントに「託す」というのが今後のECサイトのあるべき姿というのがヘッドウォータースの提案だった。「RAGやエージェントの技術革新が進む中、エージェント中心のECサイトは本当に実現できるのではないか」と竹川氏は語る。
ただ、大事なのはそこに人をいかにからませていくか。バーチャルとリアル、AIエージェントと人間をうまく組み合わせて、顧客の購買フローをうまく設計していくのが重要だという。店舗側で人がやるべきことは、AIエージェントの“人事”を担い、提案精度や対応品質を定期的にチューニングし、育成を続けることでエージェントは自律的に進化する。「今回作ったナレッジグラフも作れば作るほど、お客さまのパーソナルな情報をとれることがわかった。AIエージェントを育成していくことが大事なのかなと思いました」(竹川氏)。
UIはGenerative UIを使い、コンテキストに応じてUIを自動生成してくれる。「買い物に楽しさを持っていきたい」と竹川氏は語る。マルチモーダルに関しては、現時点ではテキストと画像に対応しているが、今後はVoice Live APIを用いた音声にも対応していきたいという。最後まさにコンテキストごとにUIが変わるデモを動画で披露し、セッションを終えた。
日本マイクロソフトの花ケ﨑氏は、「非常に深読みがすごいなと(笑)。特にデータベースに関しては、そこまで考えて採用したわけではないのですが、そこを考えて属性情報をナレッジグラフとして持つというところまで行き着いたのは感動でした。また、エンタープライズ基盤での利用を考えたときに、Buildの最新情報をキャッチアップし、Entra IDとの組み合わせを訴求していただいた。Why Microsoft? Why Azure? というところでEntra IDを訴求してくれたのはわれわれとしてはありがたい。UIもチャットベースながら、とてもリッチなデザインで、商品検索してみたいなと思わされました」とコメントした。
AIアバター採用 未来の買い物を披露した野村総合研究所
9社目の野村総合研究所(NRI)は流通本部のメンバー5人で構成されたメンバーで参加。青木耀平氏は、まずは「おつかれさまでした」と参加者をねぎらうコメントからプレゼンをスタートした。
今回NRIチームが目指した次世代の顧客体験は、カスタマー視点では「顔が見え、会話できるEC」を目指した。「今はECサイトで買い物をするときに当たり前のようにパソコンでキーボードとマウスを使っています。これが次世代では『対話』になると思っています」と青木氏。そして、店舗側の視点では「店員ゼロでも対面接客」。これを実現するソリューションがアバターAIとエージェントAIを用いた新しい顧客体験だった。自然な会話でアバターAIが商品をオススメしてくれるというデモ動画も披露された。
カスタマーストーリーでは、ハイパーパーソナライズした接客提案、自然な会話を通じた情報のやりとり、人手不足で確保できない接客人材の課題解決などが目的となる。これを実現すべく、多様なデータソースの情報を参照し、会話UIを介した自然な購買体験を提供し、店舗側の人手不足を補完するというのが、今回のソリューションになる。
エージェントのスコアは182.6点で、この時点でトップに立った。アーキテクチャとしては、アバターAIにStatic Web AppsとSpeech Serviceを採用。エージェントはAppServiceにホストしており、データ検索にはAI Searchを採用した。
また、信頼性、セキュリティ、コスト最適化、オペレーションエクセレンス、パフォーマンスなどの要件を満たすWell-Architected Frameworkをベースとしつつ、多くの顧客アクセスが予測されるECサイト独自の非機能要件にも対応。具体的には低遅延、スケーリング、セキュリティなどの対策を追加している。「サイトの表示が0.1秒遅れると、売上が1%下がるというデータもある」と青木氏は指摘する。
エージェントに関しては、LangGraphを用いて全体構成を整理。ユーザーからのリクエストをオーケストレーターが受け、最適なプランニングを計画し、各エージェントはこのプランに則って処理を実行。最後に回答生成を行なう。「エージェントを個別化し、小さくしていくことで、性能の向上を図りました」と青木氏。ユーザー情報取得のエージェントを呼び出し、顧客のパーソナライズ情報を取得。データに対して画像のテキスト化、テキストのベクトル化を施しつつ、チャンキング、ベクトル化、リランキングなどの処理で検索精度の向上を図っている。
実運用における課題も深掘りした。たとえば、今回は購買に至るまでに、ユーザーエージェントに対して、クレジットカード番号や住所、年齢などを聞くというフローがあったが、「これは実運用においてはリスクがあると考えている」と青木氏は指摘する。エージェントが意図しない動作を実施したり、個人情報の漏洩につながる可能性があるためだ。そこで、NRIチームでは、エージェントが決済システム側のフォームを呼び出し、エージェントに情報を収集しないような実装を提案。また、対話履歴を保存する際に、個人情報をマスキングするといった処理が必要になると指摘した。
今回は店舗以上の接客をECサイトに実装するというコンセプトでエージェントを開発したが、このシステムをARに載せれば、店舗でもAIのサポートを受けられる。また、ロボットにシステムを搭載すれば、棚卸しや在庫確認まで実現することが可能になるという。「このような未来をみなさんといっしょに作っていきたいと思っています」と語った青木氏。「今回は楽しく学習できる機会を与えてくれてありがとうございます」と運営側への感謝のコメントを残して、登壇を終えた。
審査員のスキルアップNeXt 小縣氏は、「実店舗とECサイトの連携は本当に大事だと思っていて、うちのお客さんからも相談を受けたことあります。今回、この配信を見たら、これがうちにほしいとおっしゃると思います。最後のエージェントと決済システムの分離という話も、これも考えないといけないなと思いました。ソリューションとして、両者の分離はやるべきことだなと感じたし、すごく大事な視点。今回私は投稿数をモニタリングしていたのですが、NRIさんは投稿数もとても多くて、1週間に52回も投稿している。たまに低いスコアが出てきているので、なにか戦略的にやっていたんですか?」と質問。これに対しては、青木氏は、「メンバーごとにエージェントを分けていたので、メンバーごとに採点してもらっていました」と回答した。
お客さまの「期待」から検索できるUIを魅せたソフトバンク
10社目は2回目の参加になるソフトバンク。プレゼンテーターの日吉啓氏は、「若手のメンバーとありますが、これまでのみなさんの方がよっぽど若かったので、(プレゼンに)斜線を引いておきたいです」と語る。普段はMSPサービスをメインに提供しており、エンタープライズ企業の代わりにクラウドの運用を手がけているという。
エージェントのスコアは110.0点。「率直に言って、点数がまったく出ませんでした。悔しいです」と日吉氏。エンジニアでの手元では、顧客エージェントが購入するところまで進んだが、評価用サイトを利用するためのログ機能やプロンプトの調整を行なったところ、回答まで至らなくなった。「最初にログをとっておけばよかったと反省しています」と日吉氏。
アーキテクチャはシンプル。工夫した点としては、FrontDoorによるDDoS攻撃対策やEntra ID External IdentityとEasy Authとを連携した認証システムなどセキュアな構成を前提とした。チャレンジした点としては、全部MCPでつなぐということ。慣れ親しんだSemantic Kernel+Pluginではなく、SSE MCP Serverを構築して、MongoDBやAzure AI Searchと接続したという。その他、類似画像の検索を前提に、画像データをそのままマルチモーダルで検索できるようにした。
また、AIエージェントの「記憶」という点にも配慮した。短期的には過去の会話やコンテキストウインドウ外の履歴を元にしたスレッド単位での記憶を参照。また、ユーザーの名前、性格、好みに加え、会話から得られたユーザーの目的やタスク、期待というユーザ単位での長期的な記憶も参照した。こうすることで、よりパーソナライズされた提案が可能になると見込んでいる。
UIに関しては、初日にチーム内で議論を行なった。その結果、モノにあふれている現在では、欲しいものが決まっているお客さまは検索すれば商品に行き着くが、欲しいものが決まっていないお客さまは情報過多で顧客の期待を引き出す必要があるという結論に。例として挙げたのは、「美味しいご飯を食べたい」という期待だ。「美味しいご飯を食べるには高い米だけ買えばいいわけではない。いい炊飯器、いい土鍋で、火力調整できるコンロなど、シナジーに出せる商品を提案することで、お客さまがいろいろ購入してくれる。お客さまが求めている目的に答えることができるとよいなと思った」と日吉氏は語る。
お客さまの「期待」から検索できるUI。左側にチャットウインドウを配置し、右側に提案に沿った商品を掲出するようなイメージだ。これにSNSでのポジティブなコメントを添えることで、「これ買ったら『きっと子供喜んでくれる』とか、『旦那さんが美味しいと言ってくれる』とお客さまが感じてくれるのではないかと思い、このUIを作りました」と日吉氏は発表を終えた。
日本マイクロソフトの内藤氏は、「まず視聴者に言っておきたいのは、110点は決して低い点数ではないということ。今回かなり点数がインフレしていて、低いわけではない。素でやるとたぶん20点くらい。今回は専門性のない方もAIを扱ってくれたと思うし、そういう人たちのために私たちはいる。普段の業務から離れて、ここまでのレベルのものをAIで作ってもらったことに感謝したいし、だからこそAI Challenge Dayなんだと思う。これに懲りず、AIの実装に携わってほしい」とエールを送った。
少ない日程でMCPもエージェント開発にも挑戦したSun Asterisk
11社目のSun Asteriskはフルリモート勤務の5名でチャレンジ。普段は生成AIエージェント統合プラットフォーム「AI*Agent Base」を開発しており、過去にはチャットボットや広告審査、社内文書の検索などで実績を持つメンバーが参加した。「私がいなければ、若さ部門で一位だったかなと思っています(笑)」と追立知浩氏はコメントした。
エージェントのスコアは172.154点で、暫定3位。序盤は評価用のJSON作成があまりうまくいってなかったが、構築ができてからは改善のサイクルが回り始めたという。ただ、後半はスコアを伸ばすのに苦戦。「先週の木曜日からチャレンジが始まっていたんですが、金曜日は計画休暇日で稼働できなかった。生温かい目で見てほしい」と追立氏は会場にアピールした。
1日ロスした状態でアーキテクチャは突貫で構築。とはいえ、普段使わないMCPサーバーを構築したり、LangChainを用いた開発など、チャレンジも行なった。RAGでは画像検索向けにCLIPモデルの埋め込みを採用。他のファイルもXLSXをCSVに変換したり、PDFやHTML、PPTXはDoclingでマークダウン化してエンベディング。検索はドキュメントと画像のベクトルDBを分けて行ない、検索時には過去のチャット履歴を取得し、質問とあわせて検索文を生成するといった処理も行なった。
時間的な制約でカスタマーストーリーに手が及ばなかったため、UIに関してはStreamlitで画像検索も可能なデバッグ向けUIを作成した。また、エージェントの開発でも工夫を重ねた。たとえば、「商品購入までのフローを実行してくれない」という課題に対しては、エージェントのプロンプトに具体的な指示を細かく記述してチューニングした。
「存在しない商品をリコメンドしてしまう」という課題に対しては、エージェントにテーブルやカラムを取得させて、クエリを実行できるようにしたが精度が低かった。そのためツールを用意して、あらかじめ取り扱っている商品を把握させたり、ツールの説明を明確なモノにして対応。さらにユーザーエージェントごとにEC側のエージェントもパーソナライズさせたという。
デバッグ用のUIを披露した追立氏は、「普段なかなかできないチャレンジをさせてもらった。MCPサーバーやエージェントなどを触ることができた。メンバーとしてもすごくいい機会という感想をいただいた。今後もこうした機会あれば、ぜひ参加したい」とまとめた。
マイクロソフトコーポレーションの岡田氏は、「稼働日も少なく、海外のメンバーもいたようなので、文化や言語、時間帯などの差もあったのかなと。それにも関わらず、MCPやLangChainなどにチャレンジしてもらった。Sun Asteriskと言えば、新規事業を作り出すノウハウ、テクノロジー、クリエイティブの力もあると思いますので、ネットワーキングでぜひいろいろな方とお話ししていただきたい」と語る。
「縛りプレイ」導入で、もはや勝手に楽しんでるゼンアーキテクツ
いよいよ最後12社目は、軽妙なトークで前回の大会も沸かせたゼンアーキテクツの三宅和之氏。「みなさん、おつかれだと思いますので、なるべくみなさんを楽しませるようなお話にしたい」と意気込みを語る。今回も社内で5人のギークを揃えたが、「みんな忙しいんですよね。月曜日からやりましたから。最初は人がいなかったので、週末はこうなったらコーディングエージェントを集めて、やろうかと思っていましたが、集まってくれて良かったなと」と語る。
そんな同社のエージェントスコアは164.1点。「数字じゃないですよね。このチャレンジは」という三宅節でさっそく会場を笑いに包みつつ、「ただ、今回は自分たちで制約を設けた。縛りプレイの中でのスコアという点は考慮していただきたいなと」とコメントする。同社は「Azure Light-Up」というハッカソン形式のワークショップを提供しているが、今回は半日~1日をかけた議論とGitHubのIssue登録といういつものスタイルを自ら実践したという。
今回のしばりの1つ目はすべてMCPサーバー経由でデータソースにアクセス。しかもすべてサーバーレスで実装し、「1万円を超えないようにやっています」(三宅氏)とのこと。しかも、PostgreSQL以外は拡張でき、構成変更なしでセキュリティも対応可能だという。
前回はマルチエージェント構成だったが、今回はなんとエージェントは1つ。「MCPを使ったときに、本当にマルチエージェントは必要なのかという葛藤が生まれた。だから、今回はあえて1つのエージェントでどこまでいけるかやってみたかった。それが164.1点ですね。そこはご考慮いただきたいかなと」のコメントにまた会場から笑いがこぼれる。「僕じゃなくてMCPがすごい。ECエージェントは、ほとんどコード書いてない。LLMが偉いんです。そんな中、自分たちはなにをすべきかを考えるためのアーキテクチャを持ってきた」と三宅氏は語る。
ベクター検索は愛用のCosmos DBを採用。「RAGに関してはけっこう温めてきたので、RAGの評価は満点でした」と三宅氏はコメント。MCP周りに関しては、Azure FunctionsのMCP Tool triggerを使うことで、認証もかけられ、ロジック変更なくMCPが利用できるという。「『Streamable HTTPに早く対応して」とAzureFunctionsチームに話しているので、お待ちしましょう」と三宅氏は語る。
2つ目に注力したのは、エージェントを継続的に成長させるためのLLMOpsだ。こちらは評価スクリプトの生成はすべて自動化して、GitHubから出力したモノだけを利用。また、ローカルでの実行は禁止し、Azureにデプロイした状態でのみ評価を実行した。「運営側はヒヤヒヤしたと思うのですが、まともにアップロードできたのは、昨日が初めてなんです(笑)」とのこと。ただ、「Azure AI Foundry(Evaluation)にほぼ同じ仕組みがあるので、次回の評価はこれ使えませんかね」と提案した。
UIはReactで実装。RAGに関してはチャットベース、顧客とECのエージェント同士のやりとりに関しては、UI不要と判断し、ロギングできる仕組みを専用エージェントで実行。最後は「一番時間をかけたいスライド」という7月18日に大手町で開催される「Azure OpenAI Service DevDay」の告知を行なって、セッションを終えた。
日本マイクロソフトの花ヶ崎氏は、「ゼンアーキテクツさんは、もはやAI Challenge Dayが好きすぎて、独自に縛りプレイを入れて、楽しんじゃってるんですよね(笑)。今回もMCP縛りということで、これでもかくらいMCPでつないでいて笑っちゃったんですけど、ただ、遊んでいるだけじゃない。きちんとセキュアなエンタープライズ基盤で動くファンクションベースのシステムを作ると、こうなるんだよという実例を示してくれて、とてもインサイトがある。LLMOpsに力を入れてもらい、構築だけじゃなく、運用例も示してくれた。完全自動化達成というのは、非常に実現場での運用を踏まえた参考になる内容。また、変な縛りプレイを待っています」と笑顔でコメントした。
コンペプラットフォームを提供したスキルアップNeXtから見た舞台裏
12社のプレゼンを終え、審査の幕間にセッションを行なった小縣氏は、今回AI Challenge Dayを支援したスキルアップNeXtや運営側から見た今回のイベントの裏話を披露した。
2018年に創業されたスキルアップNeXtは、AI/DXの人材育成を支援しており、最近では脱炭素・GX人材、人材紹介などを展開。「学ぶ」「実践する」「広める」を軸に顧客企業の組織変革や人材育成を支援しており、すでに950社の導入実績を持っている。
今回のAI Challenge Dayで用いられたコンペプラットフォームは、「実践する」というフェーズで利用されてきたもの。通常は人材育成の戦略を立案し、それに基づいた研修を受けた後に、実践で力を付けてもらうという。また、AIエージェントの開発も進めており、CopilotやPowerPlatformなどを用いた研修や伴走支援も手がけている。実際、キリンホールディングスでは、Copilotの定着化支援を行ない、研修後の実務でCopilotを活用し、34名で合計約123時間の業務時間の削減に成功したという。
後半はAI Challenge Dayの振り返り。1週間の投稿グラフを見ると、初日はサンプルを投稿する程度だったが、週末を挟んで投稿数が一気に伸びる。最終日の水曜日は、1日で150件の投稿があったという。また、スコアは初日は25~65点だったが、2日目には130点台に届くチームが現れる。小縣氏は、「満点いってしまうのではないかとヒヤヒヤしたが、その後はゆっくり上がっていった。我ながらちょうどよい課題の難易度だったのではないか」と振り返る。最後は165~170点程度に落ち着いている。
その他、小縣氏は、7体の顧客エージェントの設定やスコアの傾向などを披露。各チームの伸び悩んだ評価ポイントや投稿数からはじき出される傾向など、興味深い洞察が行なわれた。また、小縣氏は、ECエージェントに求められる機能として、オーケストレーターやRAG、API、関数に加えて、人に相対するための「擬人化」が肝になると持論を披露。そのため、よいエージェントを作るには、それに対応する人のふるまいを見ればよいという。
今回のECエージェントでは「売る人」になるが、当然商材によって難易度は異なり、今回は情報提供や複数商品の比較、アップセル・クロスセルに加えて、個人情報を踏まえた商品提供までが課題の範囲に入るという。ただ、今後はより難易度の高いタスクを行なうAIエージェントが求められる。具体的には、商用の使用感を語ったり、顧客との信頼関係を構築したり、個人情報に基づいたライフサイクルを考慮したり、中古自動車や不動産の営業のように価格交渉や粘り強い長期の交渉などより高いレベルのエージェントが求められるようになるという。今後のECエージェントの開発に参考になる話だった。
Agent Factoryを実現するためのAI Foundryの大幅機能拡張
幕間セッションの後半は、パートナーソリューションアーキテクト/エバンジェリストの大川高志氏による「Build 2025」のアップデート解説だ。
今回のBuild 2025で、マイクロソフトCEOのサティア・ナデラ氏がキーテーマとして掲げたのは「Building the open agentic web」だ。「エージェントが個人、組織、チームおよびエンドツーエンドのビジネスコンテキストで活動できる世界」を目指しており、AIを搭載した「Open Agentic Web」の実現に向けて、開発者用のスタックも変革していくというのが、メッセージだった。
もう1つのテーマは、「『Software Factory』から『Agentic Factory』」へという流れだ。50年前、マイクロソフトを創業したビル・ゲイツとポール・アレンが掲げたビジョンは「Software Factory」を作ることだった。あれから50年が経った2025年、このビジョンはAI時代に適応させた「Agent Factory」となり、誰でもエージェントを作れる世界を目指していくという。
こうしたビジョンに呼応し、Build 2025ではさまざまなAzure AIのアップデートやアナウンスが行なわれた。まずアプリケーションを作るという観点では、IDE上で動く「GitHub Copilot Agent Mode」やIssueを割り当てるだけで自動作業する「GitHub Coding Agent」などが挙げられる。また、運用に関しても、Azureリソースの常時監視や復旧を手がける「SRE(Site Reliability Engineering)Agent」が追加。これらの中から、テトリスゲームを GitHub Coding Agentで作るデモもスクリーンショットで披露された。
エージェントに関しては、PaaSやSaaS型でさまざまなAIエージェントを作成できるようになった。データとインフラに関しても、AI FoundryにCosmos DBやDatabricksをつなげるようになったほか、データを効率的に処理するためのデータセンターへの投資、GPUの100倍のエネルギー効率を見込める光計算も紹介された。さらにエージェント間のやりとりに関しては、MCPへの対応に加え、Agentic Webに向けた共通言語(NLWeb)の構想も披露された。NLWebをしゃべるWebサイトが増えれば、「知りたいことを聞くだけで答えが得られる」というWeb体験が拡がるという。
AI Foundryのアップデートとしては、一番重要なのはGAとなった「Azure AI Foundry Agent Service」だ。今まではシングルエージェントのみだったが、1つのエージェントに複数を接続できる「Connected Agents」や、複数のエージェントを連携させつつ、Human-in-the-loopも実現する「Multi-Agent Workflows」など、マルチエージェントのオーケストレーションも可能になった。さらにWebポータルからGUIでマルチエージェントを構築できる「Connected Agents」もプレビュー版が公開され、スクリーンショットも披露された。ノーコードのLogic Appsからのアクションにも対応するので、エージェントの再利用もしやすくなったという。
ただ、エージェントを簡単に作れるようになると、当然ながらエージェントの乱立や情報漏えいなどが課題になる。そこで提供されるのがエージェントを安全に管理するための「Entra Agent ID」になる。これは人間と同じくエージェントもIDで管理しようというコンセプトで、IDをベースにした認証や認可、ID保護、アクセス管理、可視化などが提供される。
「『簡単に作れます』、『使えます』だけじゃなく、『安全にビジネスで使えます』までやっているのが、みなさまのビジネスを支えてきたマイクロソフトならでは。これからもサポートし続けますという意思表示」と大川氏はアピール。相互接続に関しても、MCPのみならずA2A含めた、さまざまなAPIやプロトコルに対応する予定だという。
がんばって作ったあの処理を楽にするAI SearchやAI Content Understanding
今回のAI Challenge Dayでも利用されたAI Searchに関する重要なアップデートとしては、検索にLLMの力を取り込んだ「Agentic Retrieval」が挙げられる。たとえば、過去の対話履歴から会話全体のコンテキストを理解した上で、関連した検索クエリを複数生成し、統合して回答してくれる。その他、スペルミスを修正したり、必要に応じて検索クエリを分解・書き換えることも可能。モデルとしてはサブクエリの展開力が高いgpt-4o/4o-mini/4.1/4.1-mini/4.1-nanoなどがサポートされている
AI Searchはマルチモーダル検索も強化され、生成AIを利用して画像を言語化できる「GenAI Prompt Skill」やアプリUIで利用するための画像を抽出する「ナレッジストア」のほか、レイアウト情報や画像を抽出するAzure AI Document Intelligenceスキルのアップデート、長いテキストをチャンク化するためのText Split Skillの改善なども行なわれている。「現在のビジネスの世界で用いられているドキュメントをうまく活用できるアップデートが施されている」と大川氏は語る。
ノーコードのAzure Logic AppsとAI Searchによるデータ取り込みもより柔軟になり、OneDriveやSharePoint、Dropboxなどを幅広いデータソースをサポート。Azure Logic Appsも機能強化され、ワークフローの実現や認証処理も含むさまざまなコネクターも提供される。
また、Microsoft Entraをベースにしたドキュメントレベルのアクセス制御や、機密ラベルの付与による企業データの保護といったセキュリティも強化されている。Azure AI SearchはAzure用のMCPサーバー「Azure MCP」をサポート。GitHubのMCPクライアントからは自然言語でMCPサーバーから必要な情報を入手できるという。
ドキュメント、音声、画像、ビデオ、テキストなどの入力に対して、今まで個別に行なっていたOCRや画像認識などの処理をワンストップで実現する「Azure AI Content Understanding」もアップデート。コンテンツ抽出(前処理、エンリッチメント)とフィールド抽出(生成AI、後処理)に新たに推論機能と複数ファイルの入力に対応したプロモードが追加された。「契約書のシナリオだと、ルールをまとめて登録して、ポリシーに従っているかをレビューできる」と大川氏は語る。
その他、説明は割愛されたもののスタンダードモードのアップデートとして、ドキュメントの分類や分割を行なうClassifier APIや複数ページに渡るテーブルの認識精度の向上、Excelファイル内のテーブルのサポート、ビデオ全体のデータ抽出や自動的なチャプター分割、ビデオ内の顔検出や顔認識が可能なFace API(Preview)なども紹介。
最後、大川氏は、既存のREST APIをMCPサーバー化するAPI Managementの新機能を、「既存のREST APIを、極力手間をかけずにLLMから活用できる可能性がある」とイチ推し。発表内容をまとめつつ、「日本におけるAIエージェントの時代を作っていくために、これからもいっしょに活動できたら」とコメントし、20分にぎゅっと詰め込んだBuild 2025アップデートの解説を終了した。
AI駆動開発の時代に手を動かすイベントの尊さを改めて実感
幕間セッション終了後は、いよいよ各賞が発表された。既報の通り、受賞者したチームは以下の通り(関連記事:“買いたくなる体験”をAIでどう作る? ─ RAG×エージェントで火花を散らす12社の挑戦)。
「ASCII賞」 アドインテ
「UX賞」 ソフトクリエイト/ecbeing/ATLED
「セキュリティ&トラスト賞」 野村総合研究所
「ブレイクスルー賞」 ゼンアーキテクツ
「インテリジェントエージェント賞」 Sun Asterisk
「準グランプリ」 ヘッドウォータース
「グランプリ」 野村総合研究所
今回のトピックとしては、やはり野村総合研究所のダブル受賞が挙げられるだろうが、3時間12社のセッションはどれも聞き応えがあり、試行錯誤の成果が伺えた。ネットワーキングの会場でも、多くの参加者から「楽しかった!」「またやりたい」という声をいただき、本当にこのイベントに携わってよかったと思える。AIの進化を感じつつ、AI駆動開発時代にあえて手を動かすというこのイベントの尊さをつくづく実感する。
ちなみに、今回も若手の参加が多かったが、次回開催があるときは、ぜひ私のような年配にも参加してもらいたい。若手だけのイベントにしておくのはもったいないですよ。

コメント