【元記事をASCII.jpで読む】

生成系AIのキモといえるVRAM搭載量の多いビデオカード
GeForceよりもRadeonのほうが格段に安い

 強力なビデオカードを買う理由は「ゲームの画質やフレームレート向上」にあると断言するのはもう時代遅れだ。今ビデオカード利用が最もアツい分野といえば「生成系AI」を置いてほかならない。

 どういった学習データをどう使うべき/使わないべきか、まだ模索中であるものの、「Stable Diffusion」を使って自分に絵心がなくても美しいイラストを生成できる(プロンプトなどの試行錯誤はそれなりに必要だが)というのは魅力的である。

 この生成系AIにおいてはGeForceCUDA)を利用するのが一番良いとされている。Stable Diffusionのローカル実行環境の構築ひとつとっても、GeForce環境を前提にした情報が多い。

 一方Radeonは情報量という点においてGeForceに劣る一方、生成系AIのキモといえるVRAM搭載量の多いモデルがGeForceよりも格段に安いというメリットがある。VRAM 16GBならRTX 4080だと最低でも17万円以上だが、RX 7800 XTならば9万円程度で手に入る。

 VRAM 24GBとなればRTX 4090で30万円は必要だが、RX 7900 XTXなら16万円スタートだ。コストと情報量のどちらを優先するかは人によるが、Radeonの方がより低予算で済むという点は見逃せない事実だ。

 そこで本稿で紹介する「AI QuickSet」の登場だ。これはASRockが同社製Radeon RX 7000シリーズ搭載カード向けに無償で公開している生成系AIの環境構築キットであり、これを利用することでStable Diffusionのローカル実行環境をワンストップで構築できるようになる。

 AI QuickSetを使わずにStable Diffusionのローカル実行環境(Radeonで動作するもの)を整えようと思ったらネットの海をあちこち回って「Git」や「Python」を導入し“適切な”リポジトリーをクローン、さらに適切設定な設定も必要になる。

 知識ゼロからの構築ならある程度の試行錯誤が必要だが、AI QuickSetなら誰でも間違いなく実行まで持ち込める。ちなみに、Windows向けのAI QuickSetはStable Diffusionのみが導入されるが、Linux向けのAI QuickSetはLllama(テキスト生成)やYOLO v8(オブジェクト検出)、Image/Manga Translator(文字通り画像や漫画の翻訳)といった機能が利用できる(本稿はAI Quickset v1.1.5をベースにしている)。

 なお、Windows環境とLinux環境では利用できるAIの種類が異なる。Linux環境の方が使えるAIの種類が多いが、反面GPUの縛りがWindowsより厳しい。

 AI QuickSetの動作条件も軽くおさらいしておこう。マザーASRock製でなくてもよいが、ビデオカードだけはASRock製のRX 7000シリーズを搭載したカードが必要だ(インストール時にビデオカード情報をチェックしている)。

 AI QuickSetのインストールについては特に注意すべき部分はない。デフォルト設定のまま進めていけば、Stable Diffusionの3種類のフレーバー(使用するライブラリーがそれぞれ違う)がセットアップされる。即ちAMDが推すSHARK、Automatic 1111を使用するStable Diffusionが2種類となる。

 どの環境も初回起動時は必要なファイルをネットからダウンロードするため、高速なネット接続がなければじっくり待つ忍耐力も必要だ。たださまざまな理由(主に必須ファイルのダウンロード失敗)から起動しないこともある(実際に本稿の検証時に筆者が経験したことだ)。

VRAM 16GB以上のRadeonで生成時間を比較
検証したのは3モデル

 今回はASRock製のRX 7900 XTXとRX 7800 XT、さらにRX 7600 XTの3種類のGPUを用い、Stable Diffusionの画像生成速度にどの程度の差が出るかをチェックするとしよう。この3種類のRadeonに絞った理由はVRAMが16GB以上と多いからである。

 生成画像の出力解像度が低ければ8GB程度でも十分だが、1024×1024ドットより上だと12GBではかなり厳しくなってくる。以下使用したカードの簡単な紹介となるが、価格情報は3月下旬時点のものとなる。

AMD Radeon RX 7900 XTX Phantom Gaming 24GB OC
実売価格:18万円前後

 RDNA 3世代のフラッグシップであるRX 7900 XTXは、VRAMがRX 7000シリーズ最多の24GBを誇る。4Kゲーミングはもちろんのこと動画編集や生成系AIでもその強みを発揮してくれるだろう。“Phantom Gaming”の名を冠しているだけあり、ゲームクロック2455MHzという強めのOC設定となっている。

AMD Radeon RX 7800 XT Steel Legend 16GB OC
実売価格:8万4000円前後

 流行の“白系”パーツで組みたい場合にも最適なSteel Legendsシリーズを冠したRX 7800 XTカード。下位のRX 7600 XTと同じVRAM 16GBだが、RX 7800 XTの方がGPUパワーは格段に上。生成系AIはGPUパワーが試行錯誤時間短縮に必須なので、予算的に余裕があれば積極的にこちらを選ぶようにしたい。

AMD Radeon RX 7600 XT Steel Legend 16GB OC
実売価格:6万円前後

 RX 7000シリーズの中で最もエントリークラス寄りのRX 7600はVRAMが8GBと少ないため生成系AIにはやや厳しいスペックだが、VRAM搭載量を2倍の16GBにすることで生成系AIでの可用性を高めたモデルだ。このSteel Legendsシリーズだけあって耐久性重視の設計と、流行の白系パーツという2つのうれしいポイントをおさえている。

 その他の検証環境は以下の通りだ。CPUにCore i9-14900Kを使用しているが、特別な理由はない。処理時間はGPU側の性能で大勢が決まるからだ。GPUドライバーはRadeon Softwareの24.3.1を使用している。

グラフィックパフォーマンスを確認
いい塩梅でスコアーに差が付いている

 Stable Diffusionの検証に入る前に、今回テストする3枚のカードが、実際どの程度の描画パフォーマンスを出しているのか確認しておこう。テストは定番「3DMark」を使用する。

 負荷の軽いFire Strikeだけを見るとRX 7800 XTはRX 7900 XTXにわりと近いスコアーを上げているが、それよりもやや負荷の高いTime Spyレイトレーシングも含めて激重なSpeed Wayを見るとRX 7900 XTXの強さが引き立つ。全体の雰囲気としてはRX 7900 XTXからRX 7600 XTまで、いい塩梅でスコアーに差が付いている。この関係を覚えておこう。

VRAMの多いRX 7900 XTは別格に強い

 まずはNod.AIによるSHARKを利用したStable Diffusionの画像生成速度を検証しよう。学習モデルはプリセットの“stabilityai/stable-diffusion-2.1”を利用し、解像度は512×512ドットと768×768ドットの2通りで検証した(AI Quickset 1.1.5に搭載されているSHARKの制限による)。その他のパラメーターは以下の通りとなる。

 検証はGenerate Imagesボタンを押してから10枚出力しきる時間の平均値(3回)を採用するが、初回生成時の時間も掲載している。パラメーターを変更するとそれに合わせ最適化が入るため、初回生成時は必ず時間がかかるためだ。そのためパラメーターを試行錯誤する際は生成枚数を減らして時間を節約し、ある程度固まったらBatch Countを増やすという手順がオススメだ。

 3DMarkのスコアーの優劣がそのまま処理時間に反映されている。512×512ドットだとRX 7600 XTもRX 7800 XTに食らいついている印象だが、768×768ドットになると処理時間が一気に延びる。これはVRAM容量というよりもGPUの根本的なパワーの差というべきか。最強は言うまでもなくRX 7600 XTX(でも高価)だが、RX 7800 XTは768×768ドットも攻められて価格的なバランスも良いと言えるだろう。

SHARKを利用したStable Diffusionの生成画像

Automatic 1111+ONNXのビルドでは
RX 7600 XTとRX 7800 XTの差が拡大

 続いてはStable Diffusion+Automatic 1111、かつONNXを利用したビルドでの検証となる。学習モデルは“stable-diffusion-v1-5-olive”を使用し、512×512/768×768/1024×1024ドットの3種類の解像度で検証した。パラメーターは以下の通りだ。

 SHARKの時とは異なり、初回生成時間と2回目以降の生成時間にあまり差が出ていない点に注目。このテストではHires.fix(アップスケーラー)も使用して負荷を上げているため、RX 7600 XTとRX 7800 XTの差が拡大している。RX 7600 XTでもStable Diffusion+Automatic 1111は十分利用できるが、パラメーターを少し軽くする工夫が必要だろう。RX 7800 XTXはここでも強みを発揮するが、画像生成だけに限って言えばRX 7800 XTの方が費用対効果が優れている。

ONNXを利用したStable Diffusionの生成画像

AI Quicksetは誰でも簡単に生成系AIのすごさを味わえる
アップデートで画像生成だけでなく音声生成にも対応

 以上で簡単ではあるがASRockRadeon+AI Quicksetを利用したStable Diffusionの力比べは終了だ。パラメーターを欲張らなければRX 7600 XTでも十分戦力になるが、パラメーターの試行錯誤を含めガッツリと楽しみたいなら、RX 7800 XTの選択がオススメだ。級力的にはRX 7900 XTXに行くのが理想だが、費用もそれなりにかさむため覚悟が必要だ。

 そして、本稿をまとめている間にASRockAI Quicksetを1.2.3にアップデート(Linux版は1.1.6に更新)した。このバージョンでは新たにAIを利用した音声認識ツール「Whisper Desktop (Windows版)」やサウンド生成ツール「AudioCraft (Linux版)」が追加された。

 生成系AIの利用は今PC界隈において最もホットな話題だが、初心者にとっては試してみることすら難しい。しかしAI Quicksetのようなツールがあれば、誰でも簡単に生成系AIのすごさを味わえ、かつPCのパワーのことをもっと考える動機になり得る。

 AI QuicksetがASRockビデオカード用であるのは残念(理解はできる)ではあるが、この施策はASRockの唯一無二の強みとして、持続的なサポートに期待したい。

生成系AIの実行環境を爆速構築! ASRock製ビデオカードの「AI QuickSet」が便利すぎる