【元記事をASCII.jpで読む】

 本連載もいったん今回で最終回。劇的な速度で変化する生成AI関係だが、そろそろ本格的な社会実装の時期に入った。技術の進化自体も継続しているが、「ビジネスの現場に対し、いかに生成AIを機能として実装するか」という点こそが重要となってくる。

 そこでは、LLMの違いによる特性をどう使うか、ローカルとクラウド、オンプレミスでの使い分けをどうするのか、生成したコンテンツの管理と効果計測をどうするのか、といった点が求められる。LLM自体の性能だけでなく、そうした部分をどの企業がどのような形で手掛けるのか、という話につながってくる部分だ。

 NTTKDDIといった国内企業はもちろん、アドビなどもそこでの姿勢をはっきりとさせつつある。

 まさに「生成AI元年」は終わり、いよいよあってあたりまえの時代をどう作るか、という段階に入ってきた。

ついに「GPT-4」を超えた Anthropic「Claude 3」3月2日

 LLMの価値は多彩であり、賢さの評価は難しい。GPT-4を本当に超えたかどうかはともかくとして、Claude 3が「GPT-4のオルタナティブ」として十分な性能を発揮している、というのは筆者も感じるところだ。

 特に、回答に対する文章の「簡潔さ」がかなり違うと感じる。GPT-4は一般論的な解説を長くくっつけてくる傾向があるが、Claude 3は目的に合った指摘だけをシンプルにまとめてくる傾向が強い。筆者はチャットベースのLLMを校正支援やフォーマット変換に使うことが多いが、その用途だと、今は、GPT-4 TurboベースのChatGPTより、Claude 3 Opusの方が向いていると判断している。

 オルタナティブがあると競争も激化するし、ビジネス実装には選択肢が必須だ。そういう意味でも、どう使われていくかに注目して起きたい。

KDDI、生成AIの領域でAI研究の第1人者が立ち上げたELYZAとパートナーシップを締結3月18日

 ELYZAはKDDI子会社となり、日本向けのLLM開発を進めていく。これもまた選択肢の拡大、と言える。

 ここで重要なのは、KDDIが演算リソースに対して1000億円規模の投資を準備しており、ELYZAは今後、それを使って学習を進めていくという点だ。

 ELYZAは、ABCI(AI橋渡しクラウド。産業技術総合研究所が運用する日本最大級のAI向けスーパーコンピュータ)の演算リソースを、「優先的に13%占有して」日本語LLMを開発した。だが、それでも「学習は1度しかトライできなかった」と、同社の曽根岡侑也社長は会見で説明した。LLMの学習に際し、日本が持つ演算リソースが決定的に不足しており、KDDIがそこで大きな投資を決めたことも、ELYZA買収の背景にはあるわけだ。

 ELYZAがトライした規模の学習を日常的にやっているビッグテックとどう戦うのか、単純な規模でないところも考えなくてはならない。

アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表3月18日

 アップルは生成AIで出遅れ気味、と言われる。オンデバイスAI自体はけっこう使っているので「AIで遅れている」というのは一面的な見方に過ぎないが、実際、生成AI自体は製品にはあまり目立つ形で実装しておらず、他社に比べ見劣りする。

 アップルのティム・クックCEOは「2024年中にAIに関する発表をする」としており、おそらくは、6月開催のWWDCでなんらかの発表をする、と予測されている。

 噂や報道として、アップルがGoogleと組んでGeminiを使うのでは……という話もあったが、「時間を買う」という意味では可能性は高いだろう、と思う。

 論文発表された「MM1」がどう使われるのかはまだわからない。製品実装まではまだ時間がかかる可能性もある。

 だが、スマホやApple Vision Proのようなデバイスでは、カメラやマイクからの情報を活用した「ローカルかつマルチモーダルなAIの活用」が重要になる。MM1はそうした用途に向いているように見えるし、同様に、Androidを持つGoogleのGeminiも、マルチモーダル性を重視している。

 そんなところからも、メーカーとしての特性や狙いが見えてくる。

Sakana AI、新手法「進化的モデルマージ」を公開 複数AIを自動でかけあわせ新モデルを生み出す3月25日

 LLMを学習させるには膨大な演算リソースが必要になる。ビッグテックにとってはある意味有利だが、それが持続的で公平なことか、というと疑問があるのもまた事実。

 そこで色々な「省エネ」手法が検討されてきたわけだが、「モデルのマージ」は非常に有望だ。特に言語による差異や特殊事情による違いなど、特化モデルを作るための手法として、進化的モデルマージはかなり面白い。

 Sakana AIはどんな方法でAIを作っていくのだろう……と注目していたのだが、このパターンで来るとは予想していなかった。

軽さを誇るNTTのLLM「tsuzumi」開始 オンプレ利用の声に応える3月25日

 ビッグテックと同じやり方では難しい、というのはNTTでも同じ。tsuzumiは学習ソースの精査と事前処理によって、パラメータ量は少なくても賢くニーズに合った反応を返す……というのがポイントになっている。

 クラウドでなくオンプレミス運用、という話が出てくるのも日本らしい。海外のプラットフォーマーのクラウドにデータを保存したくない、というニーズゆえだろう。NTTとしても、tsuzumiを軸にシステム案件を多く受注したいだろうし、相当に力が入っている。

 ただ、導入後どのような価値が生まれたか、という評価はこれから出てくる。海外プラットフォーマーとの競争の中で、コストや機能性向上などでどう戦っていくかが重要となる。

 パラメータ数では戦えないが故に、tsuzumiでは将来的に、複数の専門性を持ったLLMを連携させた「フェデレーション型」での運用も想定されている。そうした部分も含めた独自の価値をどうアピールするか、注目しておきたい。

アドビ 生成AI「Firefly」、同じレイアウトで複数の画像バリエーションを生成可能に(3月27日

 筆者は3月26日(アメリカ時間)から、米・ラスベガスで開催されていた「Adobe Summit 2024」を現地取材していた。Adobe Fireflyの新機能もここで発表されている。

 Fireflyはちょうど1年前にスタート。以来65億枚以上の画像を生成しており、利用拡大は好調だ。

 とはいえ、マーケティングなどの素材に生成AIの画像をそのまますぐ使えるか……というとなかなか難しい。実際、生成AIを現在使っているのは、なにが起きても画像には頓着しないジャンクな広告か、「生成AIであること」自体をウリにした広告か、どちらかであることが多い。

 生成AIで効率を上げたいところは多いだろうが、「自社のルールに合った画像だけを生成させたい」「生成した画像の管理を楽にしたい」「使った結果を計測して効率を高めたい」という要望がセットで存在しており、そのためのツールも必須になる。

 アドビはFireflyの新機能だけでなく、「GenStudio」という管理機能を含むマーケティングツールも発表した。これはアドビのデジタルマーケティングツールの簡易版でもあり、個々のサービスに契約していなくても、管理・効果計測などの機能を持つ。その上でAdobe ExpressやFireflyと連動して、「生成AI時代らしいデジタルマーケティング」を提供するわけだ。

 画像を生成することから一歩踏み込み、ビジネス実装の段階に入っているところが「生成AI元年のあと」らしい流れと言える。

 
“生成AI元年”が終わり、ビジネスへの実装段階になってきた