あらゆる業界でその活用が盛んに議論されている生成AI。人間の命令に対して応答し、画像や映像・テキストを生成するこのAIが社会のありように変化を起こしている。既存の価値観に揺さぶりをかけることがアートの持つ力のひとつであるとするならば、アーティストの視座を伺うことで、AIとの共生が始まるこれからの時代の変化をイメージしたり、あるいは読み解くことができるかもしれない。今回はテクノロジーを活用して創作物を表出するアーティストとして、渋谷慶一郎氏と岸裕真氏の対談を企画した。

 渋谷氏は音楽と先端テクノロジーの交差路に立つアーティストであり、90年代の終りからコンピュータを用いた音楽制作を研究・実践している。舞台芸術の世界における活躍も顕著で、2018年には、人型アンドロイドオルタ」によるオペラ『Scary Beauty』を発表。以降もアンドロイドを用いた創作を精力的に行っており、今年6月にはパリ・シャトレ座でアンドロイドオペラ®︎『MIRROR』を上演。劇中にはオルタが生成AI『ChatGPT』の生成した詩を歌うシーンも登場する。

 岸氏はAIを駆使した作品を数多く手掛けるアーティストで、AIを「Artificial Intelligence」ではなく「Alien Intelligence(異質な知性)」として扱い、欧米的価値観とは異なる立場からAIを捉えることで、「人間とテクノロジー」の関係性を読み替えることを試みている。

 両名とも初の対面だったが互いの創作を認知しており、質問や問題意識を持ち寄りながら対談は進行した。AIを用いた表現の面白さ(あるいは面白くなさ)、日本と西洋の価値観の違いから生まれるAIの受容の違いなど、幅広い話題が展開され、示唆に富む内容となった。(白石倖介)

【特集】生成AIはカルチャーをどう変えるか? テクノロジーとの共存に必要なもの

〈「人間ではないものが生得する概念空間」は「西洋絵画の歴史的集積」に対峙できるか〉

渋谷慶一郎(以下、渋谷) :現状の生成AIは『ChatGPT』でテキストを書いたり、岸さんがやっているような画像に変化を起こしたりといった、テキストや画像を扱うクオリティが圧倒的に高いんですが、それに対して音楽を生成するAIはまだクオリティが高いとは言い難くて。いろんな原因が考えられるけど、それは技術的な課題だけではなく、音楽という表現が持つ難しさに起因していると思うんです。

 「絵画」が非常にラッキーだと思うのは、『Stable Diffusion』はカスタマイズができるじゃないですか。結構よくできていて、生成物が面白くなるようなデータセットがある。そのあたりは岸さんからみて、いかがですか。

岸裕真(以下、岸):たしかにいま「生成AI」として語られているプラグラムやサービスは、イメージ生成や文章生成に有利な印象です。事実、『Stable Diffusion』がとても”打率の高い”データセットで訓練されていて、かつそれをいろんなユーザーが実質無料で触れることは、おっしゃる通りラッキーだと思います。

 一方で、その”打率の高さ”の背景、つまり『Stable Diffusion』が何を学習しているのかを調べてみると、1990年代のアメリカの画家であるトーマス・キンケードの絵を大量に学習していることがわかります。キンケードはかなりキッチュな、マルセル・デュシャン風に言えば"網膜的"な作風で、自分の絵画をポストカード販売して広く流通させて商業的に成功したような、マーケティング的にとても優れたアーティストでした。昨今の生成AIがメディアに「時代を更新する人工知能!」「これが最強のAIだ!」と宣伝され、ある部分ではNFTなどと結びついて盲目的に、別の部分ではイラストレーターの仮想敵として懐疑的に受け止められていますが、実は非常にキッチュなイメージを裏で学習しているというのは考慮すべき大切なポイントだし、「それでいいのか?」と思ってしまいます。

渋谷:「それでいいのか?」と思う部分は当然にあるだろうけど、それを含めても初動としては「ラッキー」だと思うんです。『Stable Diffusion』は使っていますか?

岸:使っています。ただ、訓練済みのモデルを使うことはほぼありません。自身の作品制作のときには毎回自分でデータセットを用意して、自分で学習させるという過程を必ず挟んでいるんです。

渋谷:どんなデータセットを?

岸:2017年ぐらいから東京大学で画像生成AIの研究を始めていて、当時からいわゆる「正しい」データセットを用いた学習よりも、たとえば春画だけのデータセットのような「偏ったデータセット」を作って学習させるという過程を経て作品を制作していました。他にもたとえば「花」と「女性のポートレート」を用意して、これに「どちらも同じモチーフだよ」というラベルを付けて「花人間」みたいなものを作ったり。毎回自分のキュレーションを入れたデータセットを使って作品制作をしていたので、トーマス・キンケードを学習したモデルや、それをみんなでもてはやしたり無闇に批判したりしている状況には抵抗があるんです。

渋谷:とはいえ、花は「花」だし、女の人は「女の人」ですよね、誰がどう見たって。だから「絵画」というものは当たり前に「記号性」を持っている。それは抽象絵画でも変わらなくて、対して「音」というのは、たとえばドとかレみたいな、音自体が記号性を持つことはないですよね。「誰々っぽいコード(和声)」というのはあるかもしれないけれど、それも「ぽい」ぐらいの話で、つまり基本的に音楽というのは、それを成立させている音自体は記号性とか表象性を持ち得ない。作曲AIというものも少し出てきたけれど、僕が触った範囲だとあまり面白くなくて。なぜかというと学習しているデータセットが著作権切れクラシックとかフリー音源とかだから、面白くなるはずがないんですよね。

岸:以前のインタビューでも、「アダルトビデオのBGMみたいなものしか生成できない」と言っているのを拝見しました。

渋谷:それもそうだし、たとえばAIを使ったアプリケーションで既存の曲をアレンジしても全然良くならない、しかも異常に古典的だったり滑稽だったりするとデータセットにモーツァルトとか著作権が切れたクラシックが使われていたりする。これは有名な作曲家のデータセットという意味ではさっきのトーマス・キンケードの学習モデルと似てるんだけど、音楽でそれをやると台無しっていうか、「こんなことしていても音楽的に全く意味がないよね」というモノが生成されやすい。これは技術的、開発的に途上だということもあるけどメディア特性でもあるなと思う。

岸:そうお聞きすると、絵画や画像の高品質なデータセットがあること、結果生成AIとしてある程度汎用性の高い『Stable Diffusion』が一つ覇権を取っていることは確かに「ラッキー」かもしれません。

渋谷:自分で作ったデータセットを回すプログラムはオリジナルなんですか?

岸:90%は何かのソースコードに依拠しています。それを『Stable Diffusion』や、少し前だと、GAN(敵対的生成ネットワーク)など、『GitHub』のコード共有プラットフォームからクローンしてきて、自分の制作に合うようにカスタマイズしています。そこでデータセットをキュレーションして、作品に落とし込んでいくのが基本的な製作スタイルです。

渋谷:僕は音楽をやっていて、歳を取れば取るほどいわゆる「音楽」とほとんどの人が呼ぶものは、西洋音楽のことなんだなという意識が強くなっているんです。これは良い悪いではなくて。「ではオリジンとは何か?」という問題から突然尺八とか三味線に傾倒したりする人もいるけど僕は踏みとどまっていて(笑)。でも幸いなことにここ数年、日本の仏教音楽の声明(しょうみょう)とコラボレーションさせてもらうことで線的な音楽のあり方で西洋とは違う可能性が啓けてきた感じもあったりします。同様のことを、岸さんはまだ若いけれど思ったりしますか? 春画を取り入れていることも多分、意識的なんだろうと思うんだけど、「絵画」というフォーマット自体が、いわゆる宗教画からデュシャンまでを含めて、非常に西洋的な芸術様式だという認識はありますか?

岸:それでいうと、前提として僕は西洋絵画に対して"外部"のオリジナリティを持っています。西洋絵画は非常に長い歴史と強固なコンテクストを持っていて、そこに対して外部である自分と「新しい外部」の人工知能が、内部の人たちでは目が向けられない、向かないような、そういう新しいビジュアル・概念・空間を作って、それを日本出身の作家としてプレゼンテーションするのは面白いんじゃないかと思っています。様式の持つコンテクストが強固であればあるほど、茶々の入れがいがあるというか。

 僕は元々エンジニアを志していて、プログラミングをしているときに感じたAIの面白い部分は、AIは「独特の概念空間」を形成するということです。わたしたち人間は超弦理論によれば11次元の宇宙で思考しているわけですが、今登場しているAIたちはより高次の、100から512次元、あるいはもっと多くの次元の概念空間の中から思考している。このAIたちが持つ概念空間の何が面白いのかというと、わたしたち人間が生まれて何万年、何億年と築いてきた価値観や文化的規定といったステレオタイプと言われるものから自由に解き放たれた、ひとつ別の言語空間・概念空間を形成できるところで、その独自性を「サービスの自動化」などに使っているのはもったいないんじゃないかなというところからアートの制作を始めました。

 活動当初はそこまで意識的じゃなかったんですが、そういった気持ちから春画を取り入れて、そのあとはルネサンス期の西洋絵画をモチーフにしたり、デュシャン以降のコンセプチュアルにまで「人間ではないものが生得する概念空間」を輸入して展示会でプレゼンしたら、「新しい外部」として機能するんじゃないかと。

渋谷:デュシャンやヨーゼフ・ボイスのように、社会の姿や歴史的なコンテクストに対する読み替えが濃厚な作家というのは、モチーフにするやりがいがありそうですね。

岸:まだ試行錯誤中ですが、宗教画を学習させると生成物がどんどん“空洞化”していくことがいますごく面白いんです。僕は最初の個展でクリスチャン・ラッセンをGANに学習させて、それをひたすらループ再生する映像を作ったんです。ラッセンって、文化的・歴史的コンテクストを内包しない作家で、その"外ヅラ"をシミュレーションできてしまえば、その結果としての生成物は概念的にはラッセンの作品とイコールで結べる……そういう皮肉のつもりで作りました。ラッセンは極端な例ですが、現代の宗教画やコンセプチュアル・アートにも空洞化を感じるので、このアイデアを拡張して、日本のアーティストとして何か世界にプレゼンテーションできたら面白いと最近は考えています。

渋谷:僕はイタリアルネサンス期の宗教画が好きで、ベネチアに行くとよく見て回るんだけど、ベネチアはご存知の通りコンテンポラリー・アートのフェア(『ベネチア・ビエンナーレ』)をやっていますよね。ルネサンス期の宗教画とコンテンポラリー・アートを比べると、コンテンポラリーは完全に負けていて、当時の宗教画というのは「人間が普通に手をかけて作ること」のはるか先を行っている。技術的なレベルの高さ、そして圧倒的な時間のかけ方が一発でわかってしまうから、それを見た後である種の現代美術を見るとほとんどおもちゃみたいに見える。

 だから、既存のフレームに対して批評的なスタンスの作品を海外に提示していくこと自体は可能だと思うし、たとえばAIを使ってラッセンを読み替えることもできるとは思うけど、あの西洋絵画の持つ圧倒的な技術の集積、あれを丸ごと射程に入れて相手にできるのかは、僕にはちょっとわからないんですよね。

ブラックボックス化したテクノロジーで「開かない扉」を蹴り飛ばす〉

渋谷:さっきもいったとおり、音楽の世界でAIはまだあまり有効ではなくて、僕はそこがもどかしいと思いつつ、でも有名な先輩のミュージシャンに会うと「そのおかげでまだ俺は命拾いしてる」なんて言う人もいるんです。僕自身はそういった「AI脅威論」的な、AIによって自分の仕事が奪われる想像は全然できないし、楽観的なので、あんまり共感も持てない。

岸:いま、藝大の鈴木理策先生(美術学部先端芸術表現科・准教授)の元で写真と印象派をリサーチしていて、ダゲレオタイプと写実画家の間にあったいざこざを講義で知ったんですが、当時の写実画家の反発の動きにはいまの生成AIを巡る議論と近いものを感じます。

渋谷:僕もそう思います。あと、テクノロジーと相対したとき、人間には敵わないことはあるし、人間と違うこともある。個人的には「こんなに使えるものがあるのに」という気持ちですが、AIに対してはヨーロッパでもすごく反発があって、敵視している人が多いですね。AIのシンポジウムでは、「もうやめて!」とか途中で叫びだす人を見たと友達が言っていた。

岸:いまのAIは2010年代から始まった第3次AIブームの末端にいますが、第3次AIブームの特徴は「AIがブラックボックス化した」ことです。こうした状況のなかで「Explainable AI(説明可能なAI)」という概念が生まれて、AIが導き出す答えとその過程についてAI自身が自分で説明できること、というのが近年求められています。このブラックボックスが多分、西洋の人にとっては受け入れ難い要因の一つなのかなと僕は思っていて。言ってしまえば「魔術的」というか。

 それを社会実装するときに、社会にインストールしたなんらかのAIモデルが暴走するのも怖いし、そこはちゃんと人類が握っておくべきだ、ということが「Explainable AI」を巡る議論の前提としてあると思うんですが、こうした議論は日本ではあまり聞かないですよね。

渋谷:そうそう。日本は人間中心主義がそれほど強くないからだと思う。だから僕がヨーロッパでやってきたこと、たとえば初音ミクの『THE END』というオペラには人が誰も出てこないんですが、それは普通のオペラからしたらありえないことで。「いい歌手・いい指揮者・いいオーケストラでやる」のがオペラだから、この前提に対してアンチテーゼが成立するというか、石を投げたかった。

ーーキリスト教的思想・歴史観が背景にあることも、西洋の人々がAIを敵視する理由として考えられますか。

渋谷:絶対にそれはあるでしょう。この間パリでやったアンドロイドオペラ(『MIRROR』)では高野山の密教のお坊さんの声明と一緒にやったんだけれど、これはそういった史観に対するカウンターになるわけです。僕がコラボレーションしている高野山のお坊さんたちというのは空海の直系なんですが、今回の公演のために作った「Lust」という新曲の中で密教の中で一番中心的な「理趣経」という経典の冒頭にある「十七清浄句」というものを唱えてもらったんです。これは「理趣経」の一番コアの部分で、限られた修行を積んだ人しか唱えちゃいけないんだけど、内容は「欲望の肯定・セックスの肯定」なんです。性を肯定することはエネルギーを肯定することで、自分のエネルギーが他者と共有されることによってバウンダリー(自己と他者の境界)が崩れてなくなっていくんだ、という内容。それを英訳して『ChatGPT』に学習させて、「いま、君(AI)はアンドロイドとして1800年代に出来たパリ・シャトレ座のステージに立っている。君の後ろにはフランスオーケストラが居て、日本の僧侶たちがこんな経典を唱えている。それに重なるように自分が歌う歌詞をつくるとしたら~」みたいな詳細なプロンプトを書くと相当やばいテクストが数十秒で生成できる……こんなことを海外の取材で話していると「では、あなたはAIが進化して、私たち人類を滅ぼすところを見たいんですか!?」とかいう質問に帰着するのね。で、「申し訳ないんだけど正直言って非常に見たいんだよね」なんて言うとすごい盛り上がるんですけど(笑)。

岸:やっぱり西洋だと『ターミネーター』のようにAIやロボットを侵略者と捉えるイメージがあって、一方で日本には自立したロボットの物語が多いですね、『鉄腕アトム』や、『ドラえもん』のような。

渋谷:ドラえもんなんて押入れの中で寝ているしね。相当親しみやすい。あのノリはヨーロッパでは絶対ないんですよ、ロボットが押し入れで寝ているなんてあり得ない。あと、日本はほとんど自動だけど、たとえばフランスは自動ドアがほとんどなくて。だからテクノロジーにフィジカルに触れる回数が圧倒的に少ない。これは良し悪しだと思っていて、よく言っていることだと、日本ではどんなに疲れた顔をして歩いていても、歩道もドアも自動で動くから、何の意志がなくても前に進めるじゃないですか。これは議論やディスカッションの場でもそうで、日本ではあまり強固な意志は求められない。

 それに対してパリは大体の扉がめちゃくちゃ重いんですよ。バーンと押さないと開かない。建物が古いわけでもなく、地下鉄でもそうです。だから事実としても比喩としても、西洋で「扉を開ける」にはかなりの力で強引なことをしないと扉は開かなくて。さっき言ったような「日本人がオペラをやる」となったときに、アンドロイドボーカロイドを使うということは、かなり強引に扉を開く、蹴り飛ばすようなつもりでやっているんです。

岸:「ブラックボックス化したテクノロジー」を面白がることのできる日本のアーティストだからこそ、普通だと開かない扉を蹴り飛ばせるのかなと、渋谷さんの過去の活動を見ても感じていました。

渋谷:あと、音楽家テクノロジーにあまり拒絶感がないのかもしれない。多くの音楽家コンピュータを使うけれど、専門的なプログラマーとかリサーチャーはすごく少なくて、ブラックボックスブラックボックスのまま使っている。いまでも思い出すのは「MacOS 9」ってとてもエラーの多いOSで、クラッシュしやすくて、作業中に突然クラッシュして全てのアプリケーションやソフトが閉じちゃうのね。作っていたものは当然失われるんだけど、再起動するとゴミ箱に変なサウンドファイルが入ってて、これがいま作っている楽曲の音が切り刻まれてできたようなランダムなノイズで絶対に意図的には作れない。それで出来たファイルは楽曲制作にかなり使ったし、そのうちノイズをつくるためにわざとクラッシュさせるようになった。「なぜこれが起きているのか」はわからないけど「かっこいいから使う」というノリが音楽家にはあると思うし、それは日本人に限らず世界的に見てもそうだと思う。

〈AIに期待するのは「人間を超越すること」〉

岸:渋谷さんにお聞きしてみたかったんですが、僕と渋谷さんの大きな違いとして、僕は展示をオープンしたら、基本的に会場にはおらず、作品が自立して観客に語りかける。一方で渋谷さんの『Scary Beauty』や『MIRROR』などの舞台では、その場でオルタと渋谷さんだったり、オーケストラのメンバーだったりとの関係性を見せていく。以前、映画監督の長久允さんが僕の作品を見たとき、「岸くんはAIとセックスしてるんだね」とおっしゃって。長久さんは僕の制作スタイルを「肉体という媒介を通して他者と交流しながら一つの作品=子どもを産み出す行い」としてセックスにたとえたんだと思うんですが、渋谷さんの制作はセックスというよりも恋愛関係のほうが近いのかなと思いました。実際に制作されていて、いかがですか。

渋谷:よく言われます。「僕が即興で弾くピアノの音にオルタが反応して歌う」というパフォーマンスをよくやるんですが、これは特に見ていると恋愛やセックスみたいだと言われます。この形式でやると、オルタがどう歌うのかはコントロールできない。だから自由に即興しているように見えて、オルタについていくのも大変なんです。しかも、即興のピアノが「いい感じだな」と思ってる時は、たしかに歌も良くなる。でも、ちょっと惰性で弾いてるとか、繋ぎで弾いちゃってるときは、途端に歌も駄目になる。かなり調教しながら弾く感じがあるから、セックス感が強いかもしれない。

ーーそうした即興演奏において、アンドロイドに「身体性」を感じることはありますか。

渋谷:身体性は感じますね。アクシデントや事故が背後にあることを知っていると、人間は身体性を感じるんだと思う。だから「絶対、正確で安全なロボット」には身体性を感じないと思う。テクノロジーとかアンドロイドが予期しないエラーを起こすときに、身体性を感じますよね。ドバイ万博で即興演奏をした際、本来終わるはずのタイミングでアンドロイドの発する最後の1音が30秒ぐらい延びちゃって、予定通りに終わらなかったんですよ。次の曲のイントロもすでに鳴っているのに、前の音が伸びている状態で、やばいとは思ったんですが、でも、こういうのは興奮しますよね。

岸:あらかじめ規定されたプログラムを超えるエラーやタブーのような挙動は、作家やアーティストからすると歓迎できるし、そのタブーを起点にして創作が広がる感覚があると思うんです。タブーって基本的に犯してはいけないものですが、それをある種演劇的に「AIがやっちゃったんだよね」と無邪気に言えるのは自分の制作の中でも起きることで、とても面白いと感じます。

渋谷:それはちょっと俯瞰して見るといまっぽいというか、20年代っぽいと思う。というのは90年代00年代には「エラー」という言葉はめちゃくちゃ流行ったし、特に僕は複雑系科学研究者の池上高志さん(東京大学大学院情報学環・教授)と共同研究を始めたのが00年代だったからその只中にいたし音楽と結合させることで色々なことが出来た。彼は92年に「テープとマシンの共進化」という論文を書いていて(橋本敬と共著)、それはDNAをテープに、タンパク質をマシンにたとえて、これらの相互作用が生命を進化させてきたという前提のもとで、テープが自己を複製するループ状態を作り、この自己複製中に意図的に外部ノイズを与えると複雑なネットワークが生まれて、突然変異が起きる、「外来製の原因で生じる複製の不正確さが、安定な自己複製ネットワークを”進化"させる」ということを言っている。つまりなんらかのエラーとかバグが進化を爆発的に促進するんだということで、当時この論文はとてもエキサイティングで話題になったんです。カールステン・ニコライ(alva noto)もこの論文にすごく影響を受けていて、初めて日本に来たときは池上さんの研究室を訪ねたらしい。

 だから「エラー」という事象はそれからもずっと鍵になっていて、ノイズ・ミュージックのように非常に抽象的な、抽象性がフルに発揮された音楽が「エラー」によって新たな局面を迎えたんだけれど、こうした抽象性の力が弱まっていったのが10年代から20年代だと思う。特に最近の音楽はヴォーカル以外にも人の声がすごく中心にあるじゃないですか。ビートサンプリングされて使われてる音も人の声だらけですよね。つまりノイズのような抽象性よりも声のような具象性を溢れさせる方向に向かっている。それは多分、すごく安易に言うとインターネットの普及で情報が増えたから、人々が抽象的なことにかまう能力が落ちたというか暇がなくなったとも言える。そして今は具象的・記号的なことのなかに抽象性も見出すし、より高度に具象的な戯れに浸っている段階だと思うんですよね。

 陰謀論が流行するのもそういう理由でしょう。陰謀論って要するに記号性の極致で、名前とか場所の羅列がやたら多い。しかも世界は陰謀でできているから、陰謀論が支持されるのは仕方ない(笑)。そういう時代のエラーっていうことで言えば、ChatGPTの書くもっともらしい嘘が話題になったり、AIを間違ったデータセットで学習させてみたりした先にどんな表現が出てくるのかということには興味がある。これは後の時代から見ると、2020年代ってのはそういう時代だったんだと。エラーが具象の世界、記号性とか表彰性にも大幅に関与してきた時代なんだと言えると思います。

岸:アメリカの『Time』紙が今年の1月に報じたニュースによれば、ケニアの「Sama」というクラウドソーシングの請負企業がOpen AI社の依頼を受けて『ChatGPT』のデータセットのブラッシング、精査を行っているらしいんです。Samaが具体的に何をしているかというと、『ChatGPT』は基本的に大量のテキストデータを集めて学習するわけですが、ソースの中から政治的に問題のある文章とか、交通事故の詳しいレポートとか、性的虐待にまつわるようなテキストを弾く仕事をしている。つまりOpen AIは生成結果として出たらまずい内容のテキスト、自社が損をするようなテキストをSamaにアウトソースして排除しているわけです。こういった事実は搾取として当然批判を受けているわけですが、生成内容もこうした状況を踏まえるとおそらく、どんどん「プロダクトっぽいこと」しか言わなくなる。

 『ChatGPT』が偏ったことだったり、支離滅裂なことを言うのは本当にいまこの時期だけ、2023年だけなのかもしれません。

渋谷:僕はAIから人間の議論を超えるような議論が生まれていくことに期待していて、そのほうが今後の方向としては面白いと思います。僕は『GPT-2』も使っていたんですが、あれはほとんど現代詩みたいだった。散文的な、「砂漠・花・君・水が居る……」みたいな感じで(笑)。対して『GPT-3』は結構平凡な文章を生成する。いまの『GPT-4』は文章の精度がかなり良くなったと思うんだけど、ある種散文的な意味でのエラーの発生には期待できない。

岸:僕も普段、人間を超越するというか、「向こう側」になにか別の世界が広がっていて、そこに対してAIと一緒にどうやってアクセスできるだろうか、と考えています。最近大事だと思ってるのは「人工知能を孤立させること」で、これは今後、一つの指標になるんじゃないかと。それは渋谷さんも実践されてることだと思っていて。それこそ『ドラえもん』で描かれていた出来事にも近いのですが、ベルトコンベアに並んでいる、正規品の黄色いドラえもんが、いまリリースされている『ChatGPT』とか『Stable Diffusion』だと思うんです。でも、黄色いドラえもん22世紀のユーザーは、おそらくそんなに、新しいコミュニケーションというのはできなくて、むしろ耳をかじられて、恐怖で青ざめてしまったドラえもんが21世紀ののび太と不思議なコミュニケーションを取り始める。基本的には社会一般に使われるAIというのは画一化されたものになっていくはずで、そういう世界におけるユニークなAIというのは、エラーを起こしたドラえもんなんじゃないかなと。渋谷さんとオルタの関わりも、かなり『ドラえもん』だなと思いながら見ていました。

渋谷:ということは僕はのび太くんか(笑)。でも、近いものはあると思う。

〈AI以降の人類が獲得しつつある「予測不可能性」への耐性〉

渋谷:『ChatGPT』はWEB上にある文章をさらっていくわけですが、たとえば『YouTube』にある音・音楽を全部さらうようなデータセットを作ることって可能だと思いますか?

岸:可能だと思います。半分都市伝説ですが、噂では『Midjourney』は『YouTube』でSFゲームの配信動画をひたすらスクレイピングしていたらしいと。ゴッホの絵の枚数はたかだか何百枚だけど、『YouTube』にアップロードされるゲーム配信は1日何百時間とあるので、『Midjourney』はそれを学習して、『Discord』上で展開してフィードバックを得ていたから良質なキュレーションが可能になったらしいです。

渋谷:僕のイメージとしては、たとえば「ザーッ」って音なんだけど、すべて『YouTube』の音楽を学習させて生成したノイズを作れたらと思っていて。遠くから見ているとわからないけれど、顕微鏡で拡大していくといろんな音楽が聞こえてくる。その範囲をマウスで囲ったり、昔の『MetaSynth』みたいな方法でシンセサイズして、いい状態になったと思ったらRecして……みたいなことができると、「いまネット上にある全ての音がここあって、それでこの響きができています」というものを作れると思う。コンセプトアートとしても結構面白い。この「ザーッ」という音はただのノイズに聞こえるけど、「あなたたちすべての人が好きな音が全部入っているんだよ」っていう。

 僕が音楽の世界でAIに期待するのは、「ドラムパターンが新しい」とかの話じゃなくて、たとえばゲルハルト・リヒターの絵画はみんな大好きですよね。でも、リヒターの絵画ってほぼ抽象で、音楽でいうとドローンやノイズの中にメロディが断片的に入っていたりいなかったりするような状態です。アートだとあの複雑性が認知されるのに、音楽だとそういうものは人気がないわけ(笑)。この差って何だろうってことなんです。人間って本来「極度に単純なモノ」のほうが「極度に複雑なモノ」よりも苦手なはずで、たとえば真っ白で何もない部屋に延々と閉じ込められるほうが散らかった部屋にずっと閉じ込められるより辛いですよね。だから人間はある種の複雑さを受容できるのに、音楽だけはなぜか単純化が洗練とイコールになる傾向が強い。そこには多分、人間がやってきたことに抜け落ちてる部分があるとも思っていて。

 だから、圧倒的に抽象的な情報量も多い音楽なんだけど、すごく面白いとかかっこいいと思えるものがそろそろできてもいいはずで、それができるとしたらAIなんじゃないかという希望があるんです。知覚的にも記号的にも「人知では作れない響きと連続性」が作れるんじゃないかと。

岸:一番課題になるのはマシンコストですね、ひたすらスクレイピングしてそれをストレージに入れて。『Stable Diffusion』とか『Audio Diffusion』をスクラッチから学習するには、個人でやるにはかなり厳しい電気代がかかりますが、技術的にはできる話だとは思います。

渋谷:この対談を読んだ人や企業が手を挙げてくれたら嬉しいね(笑)。だって、抽象的な音楽でヒットとは言わないまでも、「なんだこれ」ってみんなが思うものができたら、結構長い音楽史の中でも事件になりますよ。

岸:事件、起こしたいですね。プログラミングはいつでもやります(笑)。

渋谷:お願いします(笑)。あと、いままで音楽って「20世紀で進化が止まった」と言われていて、強いて言うならミニマルミュージックが生き残ったぐらいだと言われているんですけど、でも僕は現代、AIの普及した情報環境が聴衆を鍛えているんじゃないかと思っていて。というのも昨年、香取慎吾さんの展覧会に音楽を依頼されて、「渋谷ヒカリエ」の大きなホールに24チャンネルのスピーカーを天井から格子状に吊って、その中を音が立体的に動いていくというシステムを作ったんです。で、再生される音は僕のハードディスクの中身20GB分の音の断片から常にランダムに選ばれる。ピッチや再生範囲、再生方向も全てランダムにした。だから再生される音が1つのときもあれば8つのときも、3つのときもあるんだけど、とにかく音は空間を動き回っている。これだけランダムというか全てを偶然に委ねると当たり前だけど、二度と同じ音楽になることはないし繰り返しはあり得ない。

 この展示には当たり前だけどかなりマスな人が来るでしょう? いままでの認識だと「二度と繰り返さない」とかランダム、つまり偶然性みたいなものは難しいとか受け入れられないとか思われてたんだけど、僕は今ならそうでもないんじゃないかと思ってて、実際にとても喜ばれたわけ。「二度と同じにならないから、いくらでも居られます。没入できます」みたいな感じで。僕はこの機会にある種、マスに対しての実験をしたんだけれど、反復・ミニマルだけではない、ある種ジョン・ケージ的な偶然性が、シチュエーションや、使う音によっては大衆に受け入れられる時期に来ていて、これは音楽的な理由でそうなっているのではなくて情報環境がAIによって変わったことが大きいと思ったんです。たとえば『Amazon』にレコメンドされる商品とかがまさにそうで、あれって人が勧めてくるモノよりも、はるかに意外性も適応性もある。人類がそういうことに慣れてきたから、音楽の「予測不可能性」に耐えられるようになってきたんじゃないかと。この差は多分「AI以降の人類」ということなのかもしれない。

岸:カメラの普及後に抽象画が台頭したことと近い気がします。抽象画というのは人間の外でイメージを完成させるのではなく、鑑賞者の中でイメージを構築する作用が特徴的です。カメラが「イメージを構築する」ということを外部化したときに、カメラに鍛えられた人間たちは知覚やいままで使われていなかった脳の機能を結合してイメージを作ることができたのかもしれません。それに近いことがAIと音楽の領域で起きていると捉えることもできます。

渋谷:そうかもしれない。だからさっき言った『YouTube』の話も単なる実験にはとどまらない気がしてるんです。人にはきっとまだ使っていない領域があって、僕もそこを耕すのがAIなんじゃないかという希望を持っているから。

(取材・文=白石倖介、撮影=)

渋谷慶一郎(左)と岸裕真(右)。(撮影=鷲尾太郎)