【元記事をASCII.jpで読む】

 6月19日、画像生成サービス「Midjourney」に新たに搭載された動画生成機能「V1 Video」が高い人気を集めています。理由はいくつかあります。1つはMidjourneyのコミュニティはすでに約2000万人の登録ユーザーを抱えるほどで、画像生成AIに慣れている課金ユーザーを多数抱えていること。もう1つは、UIがすでにこなれており、操作が簡単な上、品質が高いことです。価格が従来より安く設定されている点も、人気を支えていると考えられます。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

1回で4本の動画を生成、「当たり」が出やすい

 Midjourney Videoの特徴はとにかく表現の幅の広さにあります。実写から、アニメから、多種多様なスタイルで、自然な動画が生成可能。なによりその一貫性を保つ力が強いです。一般的に動画AIでは細部がよく崩れるのですが、Midjourneyは、480pという比較的小さなサイズの生成にもかかわらず、かなり一貫性が維持されます。V1という最初のバージョンにもかかわらず、クオリティーは現在の最高クラスの動画AIとして登場したという印象です。

 また、動画をダウンロード時に「Download for Social Media」を選ぶと、SNS用に最適化された画像サイズの動画になります。SNS上ではきれいに見せるようにするためのうまい工夫がされています。

▲いつもの作例に使っているキャラクター「明日来子さん」。プロンプトは「若い女性が通りを歩きながら笑顔で手を降る」。Midjourney Videoではシンプルな方が機能するよう

▲アニメ、イラスト系画像の作例。最後は延長を1度している。動かすものと動かさないものをはっきり分けている傾向は感じられる

 操作は本当に簡単です。画像をドラッグドロップするだけで5秒間の動画が4つ生成されるようになっています。Midjourneyで生成した画像を指定することもできれば、自分で用意した画像を動かすこともできます。プロンプトも設定して制御することもできますし、まったくしなくても適当に動いてくれます。作った動画を延長することも可能で、4秒ごとを4回まで繰り返し、最大21秒まで拡張することができます。

▲「若い女性が、ネコを抱きしめている」の作例。5秒x4本を繋いだもの

 Midjourney Videoの面白さは、1回につき4本の動画が同時に生成されることです。一般的な動画生成AIサービスは、1本だけ生成されるか、追加でお金を払うと複数のバリエーションが生成されるのが一般的な出る仕組みです。ところが、Midjourneyは、生成すると必ず4本の動画が生成されます。画像を生成する場合にも、4枚の画像を作る方式でしたが、動画でもそれを踏襲していまいた。通常、1本しか生成しないのは、計算量を増やさないための当然の方式なのですが、Midjourneyは逆に必ず4本生成することにこだわっています。

 理由は単純で、満足度が上がるからです。ユーザーから1回の生成数を減らすことを希望する質問に対し、Midjourneyは「気に入ったものを手に入れるには4つ必要だと感じています。そのため、4つ未満を購入するとお金は節約できますが、満足度は大幅に低下します」として、4本の動画生成は意図的であると回答しています。

 実際に、動画を4本作ると、1本くらいは満足度の高い「当たり」と言えるものが出ます。逆に動きが適切でなかったりする動画も生成されます。指が6本になったり、細部が破綻したりという「ハズレ」もほぼ必ず出ます。Xなどでユーザーにより共有される動画は、選別された出来がよいものとなるため、相対的に品質が高いものが出回るようになるわけです。

 一方で、センシティブ判定はかなり厳し目です。画像生成はできても、動画が認められないものは多く、特に、現実に存在するような写真や、イラスト風であっても未成年に見える画像、露出度の高い画像は拒否される傾向が高い印象です。この連載のために作成した明日来子さんの画像であっても、動画生成が拒否されることは少なくありません。他のサービスよりも厳しめに判定されているようです。

月額30ドル(4500円)で画像も動画も生成できる

 もうひとつ大きいのは、値段の魅力です。Midjourneyはこれまでの動画AIサービスよりも安いことをアピールしています。

 Midjourneyは、料金プランによって使える計算量が決まっています。月額30ドル(4500円)のスタンダードプランでは、月15時間分の静止画の生成が認められています。これは約900枚に該当します。時間数がオーバーした場合、スタンダードプラン以上では「リラックスモード」に移り、生成時間が長くなるものの、無制限に生成することができるようになります。Midjourneyの説明では、動画生成は画像生成に比べて約8倍の計算量に該当するとしているため、そのまま適応すると動画112回分に相当します。

 これをトータルコストとしてまとめなおすと以下のようになります。Midjourney Videoで1回の生成で生み出される20秒(5秒x4)の前提だと、1秒あたりコストは他社に比べて4分の1近くになり、たしかに格安です。

 ただし注意が必要なのは、他サービスで1回しか生成しない場合には、必ず20秒生成するMidjourneyの方が割高になることもあります。また、現時点では高解像度での生成には対応していません(今夏に対応すると予告されています)。ただ、他サービスでも、常に1回で満足の動画が出ることは少ないので、やはり価格優位性はあります。

 月60ドル(9000円)のプロプランでは、30時間分の計算量が提供され、それを使い切ると、動画でもリラックスモードを使うことができる、無制限モードも用意されています。

 Midjourney Videoの注目度の高さは、グーグルレンドでその一端を垣間見ることができます。グーグルの動画生成AI「Veo3」はリリースされた直後にその高い性能が注目を集めましたが、月額3万6400円の「Google AI Ultraプラン」加入がほぼ前提となっていることもあり、話題としては落ち着きつつあると言えます。Midjourney Videoは発表直後から、Veo3を上回る注目を得ています。

 Midjourney Videoの面白い使い方も模索が始まっています。アーティストの852話さんが発表したのは、自分で作ったキャラクター画像と実写画像を組み合わせ、Midjourneyに読み込んで動画を作成する手法です。画風の違った画像がなじんだ動画が作成できています。Midjourneyの画風適応力の幅広さを利用して、単に動画を作るだけでなく、それを利用することで、新しい表現方法を作り出すことができるというわけです。

▲852話さんの手法を試した作例。白黒のキャラクターも、背景も、どちらもMidjourneyで作成し、Photoshopで合成した後に、Midjourney Videoで動かしている

著作権訴訟で「Batman」検索には対応も

 もう一方で、注目されているのはMidjourneyを相手どった著作権裁判です。ディズニーNBCユニバーサルマーベルなどを含む)など複数の関連制作会社が6月、Midjourneyによる著作権侵害を理由に連邦裁判所に訴訟を起こしました。アメリカの著作権法の「フェアユース」がどこまで認められるかが重大な争点です。生成AI各社が直面する学習モデルの学習データに著作物がどの程度認められるのかという争いの1つになります。

 ディズニーはMidjourneyに対し、自社のキャラクター生成を防止するフィルタリングを講じるよう求めていましたが、十分な対応がなかったことが提訴の引き金になったとされています。Midjourneyでは、他のユーザーが生成したものを検索して表示する機能があります。例えば、「Batman」と入れると、ユーザーが生成したバットマンの画像の一覧が表示されるというわけです。性的な連想をさせるワードは軒並み表示できなかったため、フィルタリングをかけていなかったのはMidjourneyの方針であったと考えられます。

 生成した画像が著作権侵害をしていないかは、ユーザーの責任というのが基本的な画像生成AIサービスの一般的な立場ですが、それらのユーザーデータがすべてサーバに残り、他のユーザーにも閲覧可能な状態であったため、ディズニーは他社コンテンツをプロモーションに利用していると主張しているのです。

 ただ、提訴後しばらくして、対応をしたようです。現在では、「Batman」「Starwars」「Mickey Mouse」などのキャラクターやIP名を入れても検索結果は表示されなくなりました。ただし、単純な抜け道もあり、バットマンシリーズの映画タイトル「dark knight」と入力すると表示されます。同じように「pikachu」では検索結果は出ませんが「pika」では出るようになっています。このあたりはディズニー側の主張に、Midjourneyはどう反論していくのかに注目が集まっています。

まずは立ち上げ成功、裁判の行方に注目

 7月2日のMidjourneyがユーザーに開発状況を共有する「Office Hours」で明らかにされたところによると、今後は動画の高解像度化や、開始フレームだけでなく終了フレームの指定機能、ループ再生機能が告知されており、さらに高速生成機能などを順次実装していくようです。これまでのMidjourneyと同様に、毎月単位でじわじわとアップデートをかけていくものとみられます。まず、動画を黒字化できるような環境を作っていくのでしょう。

 Midjourney Videoは、まずは世界的な立ち上げに成功したといえます。AI動画導入のハードルを大きく下げ、今後も一般に広がっていくと予想できます。一方で、著作権を巡る裁判がどうなっていくのか、今後の動きにも注目です。

   
Midjourneyの動画生成AIが強い 驚きの高性能で価格破壊