富士山は次、いつ噴火しますか?」「愛とはなんですか?」

JBpressですべての写真や図表を見る

 2014年、ソフトバンクが発表した会話ロボット「Pepper」の技術者向けイベントでのこと。披露されたPepperはインターネットで米国にある人工知能(AI)「IBM Watson」とつながっており、来場者の質問に対してPepperを通じてIBM Watsonが回答するという、当時としては実に未来的なデモが特別に行われた。

 米国のテレビ番組でクイズ王に勝利した“モノ知り”コンピュータIBM Watsonと会話する機会など、ジャーナリストであってもまだ少なかった頃の話である。日本語版Watsonも、もちろんなかった。そのWatsonとロボットを介して会話し、質問できるというのだから、がぜん注目を集めた。

 そのとき一般の来場者から出てきた質問が冒頭のものだ。私は少々驚いたが、「これが、人々が現にAIに対して抱く期待なのだ」と理解した。

 この記事をお読みの読者は、AIが全知全能のコンピュータではないことを理解していると思う。また、AIに対する大きな期待が、一部で幻想を生んでいることもご存じだろう。

 一方で、AIはビジネスや社会に大きな変革をもたらす可能性を持っていることも事実だ。コンピュータによる画像を認識したり、識別・分類したりする能力が高まり、AIは大きく進化した。今回は、画像や映像分野においてAIを活用し、一定の成果を上げている例にフォーカスして紹介する。

 なお、AIの基礎に関しては以下の記事でまとめているので、あわせてご参照いただきたい。
「AIの民主化」がもたらした第3次AIブーム到来――経営者のためのAI入門(1)
http://jbpress.ismedia.jp/articles/-/53081
AIを賢くするニューラルネットワークの仕組み――経営者のためのAI入門(2)
http://jbpress.ismedia.jp/articles/-/53337
「正解」を示さなくてもなぜAIが学べるのか――経営者のためのAI入門(3)
http://jbpress.ismedia.jp/articles/-/53579

画像の内容を識別、人物の年齢も推定

 このところ、AIの世界市場でIT大手による覇権争いが熾烈になってきている。米アマゾン、米グーグル、米マイクロソフトなどは「AIの民主化」をうたい、AI関連技術を各社のクラウドサービスで提供している。

 マイクロソフトの例をみてみよう。同社はクラウドサービス「Microsoft Azure」でAIの機能を提供しており、そのサンプルページで実現可能な機能を端的に紹介している。画像からコンピュータがさまざまな情報を取得することができる機能「Computer Vision」は、AIの有用性をイメージしやすいもののひとつだ。デモページ(https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/)で閲覧したり、AI技術を体験したりできる。

 図1に示したのは、デモページに掲載されているサンプル画像の一つだ。複数の人が写った画像をコンピュータが解析して、どのような内容の写真なのかを右隣のボックス内に「タグ」で表している。屋外の写真、人、ポーズをとっている、草、グループで撮った写真、立っているところ、女性がいる、若い人がいる、白など、AIが認識したモノや人、風景に関わるワードがタグとして記録されている。写真1枚ごとにこうしたタグが付いていれば、膨大な量の画像の中からキーワード(タグ)を使って画像を探しやすくなることは容易に想像できる。

(* 配信先のサイトでこの記事をお読みの方はこちらで本記事の図をご覧いただけます。
http://jbpress.ismedia.jp/articles/-/53809

 右隣のボックス内には「成人向けコンテンツ」や「わいせつ性」などの項目もあり、アダルト向けの画像なのかどうかもAIが判断していることが分かる。ユーザーが自ら撮影した画像を投稿できるようなサイトでは、反社会的な画像かどうかのチェックが欠かせない。大量の画像を目視でチェックするのはあまり現実的ではないが、AIに代替させれば人手を増やさなくても確認作業を遂行できる。

 写真に写っている人物の顔が四角く囲まれていることにお気づきだろう。これは、デジタルカメラやスマートフォンのカメラ画面でお馴染みの顔認識機能だ。Computer Visionは単に顔を認識するだけでなく、誰かの顔の部分にマウスカーソルを合わせると、性別と年齢(推定)までを表示する。

 あらかじめ膨大な数の「人間が写った写真」をニューラルネットワークに機械学習させることで、コンピュータは人を識別するとともに、特徴量から写っている人の性別や推定年齢を識別できるようになる。もっとも、人間でも写真だけでは年齢を言い当てられないケースがあるように、AIの判断レベルも完全ではない。

 画像から人の顔を認識する機能をFacebookで体験している読者もいるかもしれない。友達と写った写真をFacebookに投稿したとき、写真に対してシステムが自動的に友達の名前をタグ付けしたことはないだろうか。

 Facebookは投稿された写真を瞬時に解析して人物の特徴量を抽出し、友達リストの中にほぼ同じ特徴量の(同一人物としてのスコアが高い)人がいれば、同一人物とみなして自動でタグ付けをする。よく似ているけど自信がない(スコアが低い)場合は「写っているのは××さんですか?」と聞いてくる。ときどき別の人と間違ってタグ付けされるが、特徴量から人の顔を識別するAIによる顔認識はすでに身近な存在になっているのだ。

動画に写っているものをリアルタイムで検出

 マイクロソフトの「Computer Vision」のページでは、動画解析のサンプルも掲載されている。図2の左側は解析対象の元動画、右側は動画がどのようなシーンなのか、動画をAIが解析して情報を検出しテキストで表示したものである。動画をシーンごとに解析して、ビーチ、海、波、晴れ、子ども、男性、ボールなど、解析した結果をタグとしてリアルタイムで表示できる。これを動画のタイムラインに記録しておけば、見たいシーンをすぐに探し出すことができる。

 この機能は映像編集の世界でとてもニーズが高い。ビーチで親子が遊ぶ映像を使いたいと思ったとき、従来は人間が動画を全部チェックしてタグ付けしておく必要があった。だが、AIを活用すれば、長時間にわたる動画や膨大な量の動画も自動でタグ付けを代行してくれるので、タグ検索で候補のシーンを見つけやすくなる。

 動画のタイムラインのどこで自動車が登場したのか。特定の女優が登場するシーンはどこからどこまでか。女優が傘を持って出かけているシーンはどこか。あらゆるシーンを自動抽出できるようになれば、動画の使い勝手は格段に高まり、活用領域がこれまで以上に広がる可能性がある。

スーパー来店客の移動経路や購入商品を把握

 映像とAIをマーケティングに役立てているところも出てきた。全国221店舗で小売業(スーパー)を展開するトライアルは、福岡市アイランドシティにオープンしたスーパーセンターに約700台のカメラを設置。P&Gと連携してディープラーニングを活用したマーケティングを行っている。カメラの映像からは来店客の人数、属性(性別や年齢層)、移動経路などを把握できる(図3)。

 また、顧客がどの通路を通り、どこの棚に立ち止まったのか、どの商品を手に取り、どれを棚に戻したのか、結果的にどの商品をカートに入れたのか、属性別に分析することも可能だ(図4)。

 もう一つ興味深いのは、店内のディスプレイ広告の内容を、見ている顧客の属性(性別・年齢層)に合わせて自動的に切り替えるシステムだ。ディスプレイ広告の前に立った顧客の映像からAIが属性を分析。その結果に応じた製品を広告表示する。限られた広告スペースを有効に活用するのに効果的だ(図5)。

 カメラの映像によって、陳列している商品の欠品を認識することもできる。

 例えば、バナナは山積みすると痛みが早くなるので平積みが望ましい。しかし、平積みだと陳列できる商品数に限りがあるため、完売のタイミングが早まる。販売機会を逸しないためには、完売する前に商品を補充する必要がある。

 そこでAIの出番だ。カメラで陳列棚を監視してバナナが完売する前、または完売したらすぐに店舗スタッフのスマートフォンなどに通知する。

必要な場所にだけドローンで農薬を散布

 AI関連技術の開発と実利用に積極的なオプティムは、AIとドローンを農業に活かしている。具体的には、ドローン(オプティムアグリドローン)によって枝豆の栽培地を上空から撮影する。その画像をAIが解析し、害虫や病気があるところを判別。そのうえで必要な場所にだけドローンで農薬を散布する(図6)。

「ピンポイント農薬栽培」と呼ぶこの取り組みによって、散布する農薬の量を90%削減できたという。農家にとって大きなコスト削減につながることはいうまでもない。もともと使用する農薬の量が少ないこともあり、収穫時の残留農薬も、もちろん激減する。そんな付加価値を持たせた「スマートえだまめ」は一般の枝豆より高額(約3倍の価格)で販売しているが、すぐに完売するそうだ。

 最近はディープラーニングなどのAI関連技術の登場より「コンピュータが目を持った」と言われる。カメラで撮影した映像からさまざまな解析や識別、判断ができるようになるからだ。画像解析へのAIの応用はいろいろな可能性を秘めている。うまく生かせば、多様な産業で「自動化」や「最適化」の利点を享受できるはずだ。

[もっと知りたい!続けてお読みください →]  「AIの民主化」がもたらした第3次AIブーム到来

[関連記事]

AIを賢くするニューラルネットワークの仕組み

「正解」を示さなくてもなぜAIが学べるのか

カメラの映像から来店客の行動を追跡できるようになった