いつ、どこにいても最新のニュースにアクセスしたい。学生の頃に抱いていた夢だ。ん10年前、スマホはおろか携帯電話もなく、一介の学生にはインターネットも「雲の上」の存在。せいぜいアパートの電話回線を通じて、気の遠くなるほど遅い通信速度のパソコン通信で遊ぶぐらいが関の山だった。やっとダウンロードしたニュースのテキストを電車の中で読むのが自分なりの「最先端」だった。ところがどうだ。今や「だれでも、どこにいても、いつでも」リアルタイム情報の海で好きなように溺れることができる。それどころか、情報発信も思いのままだ。音も写真も映像も、全世界に向けて誰もが発信できる。それもごくごく低コストで。思えば遠くに来たもんだ。

画像付きの記事はこちら



 ここ数年の技術で言えば、音声認識とそれに紐づく翻訳技術が格段に進歩した。スマートフォン(スマホ)のアプリで会話を録音しておけば、言葉の文字化はおろか、翻訳までこなしてしまう。ちょっと前なら、意味不明の誤認識も多く、思いっきり想像力を豊かに働かさなければ、正しい言葉にたどり着けなかった。しかし、そんな誤りは格段に減った。しかも、翻訳の質も飛躍的に向上している。きわめて自然な言葉で翻訳できるエンジンが増えてきた。もはや語学の勉強は不要なのでは、と思うほどだ。人と会ってインタビューした内容を記事にするような仕事をしていると、こうした技術の恩恵を直接受けられる。ありがたいことだ。

 映像の世界も進化が著しい。特に人間の動きをリアルに再現する技術は、メタバースの世界を一気に推進する原動力になる。振り返れば、一番最初にCGの滑らかな動きに触れたのは、1989年に米ブローダーバンドがApple II向けに発売したゲーム「プリンス・オブ・ペルシャ」だった。後にPC-9801スーパーファミコンなど、数多くのプラットフォームに移植されたアクションゲームだ。ドット絵のキャラクターが妙に人間臭いリアルな動きを実現していて驚いた。後に聞いた話では、実写の映像をなぞって作画する、ロトスコープという手法でキャラクターのリアルな動きを実現していたという。古くからアニメーションなどで使われていた手法で、膨大な手間と時間がかかるのが欠点だ。

 ロトスコープの進化版ともいえる技術がモーションキャプチャーだ。人間などが実際に動き、その軌跡を数値化する。データをCG画像に当てはめることで、極めて自然な動きが再現できる。無数のマーカーが装着された黒い全身タイツに身を包んだ演者が、いくつものカメラに囲まれたスタジオの中で動き回る……。ハリウッド映画のメイキングでよく見かける光景は、モーションキャプチャ―の現場だ。機材の価格は数1000万円は下らないだろう。最近では100万円前後でも実現できるようになったというが、素人お断りの、まさにプロフェッショナルの世界だ。

 ところが、YouTubeなどで自分の分身、アバターによる動画を制作する、いわゆるVTuberが徐々に増え始めた。個人レベルでもモーションキャプチャ―をしたいというニーズも盛り上がっている。そこに目を付けたのがソニーだ。スタジオもカメラも不要。たった六つのユニットで全身の動きをデジタル化できる。屋外でも使用可能だ。製品名はmocopi(モコピ)。スマホとBluetoothで接続して使用することを前提に、徹底的なコストダウンを図った。価格は驚きの4万9500円。しかも税込みだ。来年の1月下旬に発売する。

 頭、両手首、両足首、腰に装着する、たった六つのセンサーだけで、全身の動きをデジタル化する。AIとディープラーニングを駆使し、飛んだり跳ねたり回ったりも自由自在。アバターが滑らかに動く。開発を指揮したソニーの新規ビジネス・技術開発本部 モーション事業推進室の相見猛 室長は「映像制作をされている方に価格を明かすと『業界が変わっちゃいます』と、うれしいコメントをいただいた。一般の方でも気楽に使えるよう、スマホを買うぐらいの価格感を目指した。開発には要素技術研究から含めると5~6年以上かかっている。体にセンサーを装着して一歩前に出るだけでキャリブレーションが取れる。わずかな動きでセンサー間の位置を取得しその人の体格を検知する。この手軽さにもこだわって開発した。将来的には、例えば格闘ゲームなどを始め、ゲーム用途にも応用できるだろう」と話した。

 VTuberだけでなく、映画やアニメの制作にも応用可能だ。この価格で最新のテクノロジーを体験できるなら、ちょっと遊んでみたくもなる。まさに「モーションキャプチャ―の民主化」だ。今後の展開に大いに期待したい。(BCN・道越一郎)

頭、両手首、両足首、腰の6か所にセンサーをつけるだけで、アバターが滑らかに連動