GB200 Grace Blackwell SuperchipのTDPは1200W　NVIDIA GPUロードマップ

Blackwellアーキテクチャーは
コンシューマー向けにも適用されるかもしれない

　前回に引き続きBlackwellについて解説する。ちなみに現時点でもまだBlackwellのホワイトペーパーが公開されていない(Architecture Technical Briefは公開されたが、ここには個々のSMの構造などはまだ含まれていない)ので、前回説明した内容がどの程度妥当だったのかの確認はできていない。

　あともう1つ。これは公式発表ではないのだが、このBlackwellアーキテクチャーはデータセンター向けだけではなく、コンシューマー向けにも適用される予定という話が流れている。実際以下のとおりリリースされてきている。

　今年は刷新されると考えるのが普通だし、そうなるとBlackwellアーキテクチャーを使うと考えるのが妥当と言えば妥当である。ただその一方で、以下のようなあまりコンシューマー向けに向かない特徴が気になるところである。

　もちろん、例えばBlackwell世代はアプリケーションの設定と無関係に常時DLSSがTensor Coreで稼働しており、なのでGPUでのレンダリングの負荷が相対的に低くなって結果として性能が向上する、なんて方針であればこれでも良さそうだが、正直ちょっと考えにくい。あるいはTensor Coreが実はRay Tracing Engineの機能も搭載しているなどならあり得るのかもしれないが。

　仮にBlackwell世代からそのまま持ち込んでうれしい機能があるとすれば、マルチチップ構成だろうか？　もしこれがコンシューマー向けGPUにも適用できるのであれば、それは意味があるだろう。ただ同じくマルチチップ構成(正確に言えばマルチGCD)を目論みつつ開発中止で消えてしまったNavi 40のことを考えると、AI向けでうまくいったからといって、GPU向けにそのまま使えるとは限らないので、これも可能性は低いだろう。

　まだ断言はできないが、今年登場すると思われるコンシューマー向けのアーキテクチャーは、Blackwellと異なるものになる気がする。これは過去にも事例がある。2018年はデータセンター向けがVolta、コンシューマー向けがTuringだった。Voltaも後追いでTitan Vというコンシューマー向け(?)のラインナップは用意されたが、基本はデータセンター向けのみである。

　Blackwellも同様にメインはAI推論/学習向けで、コンシューマー向けはまた違ったもの(そのコード名がBlackwellを継承するかどうかも不明)になるのではないかというのが筆者の推定である。このあたり、Blackwellのホワイトペーパーが公開されたら、もう少しクリアになるのだが。

GB200 Grace Blackwell Superchipは
Grace Hopper比で2.5倍～6倍の性能

　さて今回のメインとなるのは、このBlackwellを利用したシステムの話だ。前回示したロードマップにもあるように、本来B100をベースに、ArmベースのGrace CPUを組み合わせたGB200やGB200NVLというソリューションと、x86と組み合わせるB100とB40というソリューションの2つが用意される。

　現時点で公開されているのは、以下の3種類のみである。

　まずGB200 Grace Blackwell Superchipというのが下の画像だ。その下の拡大図を見ると、Grace Hopper比で2.5倍～6倍の性能という数字が出てくるが、FP6やFP4を使った場合の数字ということを考えると、この性能が本当に発揮されるのかどうかはTransformer Engineの頑張り次第という感じがする。

　基調講演ではこの開発用のボードも披露された。

　このGB200 Grace Blackwell Superchip(ボードなのにチップ呼ばわりするのもどうかと思うが)を2枚、1Uのブレードに収めたのがBlackwell Compute Nodeであり、このブレードを18枚集積したのがGB200 NVL72となる。

I/Fチップは1つあたり4本のNVLinkを外部に出せる

　インターコネクトは引き続きNVLinkが利用されるが、こちらもなかなか壮絶な構成である。今回利用されるNVLinkは第5世代になるが、I/Fチップは1つあたり4本のNVLinkを外部に出せるようになっている。

　1本のNVLinkは18本の100Gbpsのレーンから構成される。上の画像には200Gbpsと書いてあるが、これはUp/Downの合計であり、1方向あたりでは100Gbpsになる。

　NVLinkそのものは1本あたり1.8Gbpsの帯域を持つわけだが、Blackwell Compute NodeにはこのNVLink Switchが2つ搭載される。つまり1つのBlackwell Compute Nodeから8本のNVLinkが外部に引っ張り出せる計算だ。ちなみにインターコネクトとしては、これとは別にConnectX-800 InfiniBand Switchカードを4枚搭載できるようだ。

　このNVLinkのI/F同士の接続に、9枚のInfiniBand Switchシステムが、Blackwell Compute Nodeの間に挟まるように入る。

　これでBlackwell Compute Node同士の相互接続だけでなく、複数のNVL72同士の接続も行なう形であろう。ただこれはあくまでもBlackwell GPU同士の相互接続であって、Graceの方はこのNVLinkの接続の恩恵を受けない。いやがんばってGraceからBlackwell経由でNVLinkを使った通信を行なうことも不可能ではないのだろうが、効率が悪すぎる。

　こちらの用途のために、TOR(Top of Rack)にInfiniBand Switchも搭載される格好だ。

　これで1つのNVL72が構成されるわけだが、当然配線はすさまじいことになっている。

　NVIDIAはこのNVL72を8本組み合わせた構成では、従来(おそらくGH200)比で冷却コストを半分にできるとしている。これは同一数のラックと比較してなのか、同一の演算処理で比較してなのかはっきりしないが、なんとなく前者な気がする。

　要するにGH200ベースだと9本のラックのうち8本をGH200が占めるのに、GB200では4本なので半減という計算な気がする。さらに将来的には400本以上のNVL72を並べれば、645EFlopsの猛烈なAI Factoryが構成可能とアピールするが、そもそも16000枚のGB200 Grace Blackwell Superchipを製造できるのはいつのことなのか？　というのが偽らざる感想である。

　さて、ここまではGraceと組み合わせたGB200 Grace Blackwell Superchipの話だが、これ以外にキャリアボードに実装されたB100/B200のみの構成も用意されている。それがHGXB200/B100である。

　8つのB100/B200をまとめて提供する形なのは、AMDのInstinct MI300Xなどと同じである。ロードマップ的にはB40という製品もあるようなので、いずれはPCIeカードの形の提供も予定されているのだろうが、当面はこのキャリアボードの形のみでの提供になると思われる。

フルスペックのB200はTDP 1200W、
HGX B200は性能が1割減、HGX B100は3割減

　ところで先程からGB200 Grace Blackwell SuperchipとB100/B200が入り乱れているわけだが、要するにNVIDIAは今回の発表に合わせてB100/B200に3つのSKUを用意した形だ。SKUといっても基本的な同じパッケージ、同じダイであり、動作周波数を変えるか、あるいは一部のSMを無効にする形での対応になっている「らしい」。

　「らしい」というのは、実際の動作周波数やSM数そのものはいまだに未公開で、ただ性能の数字のみが示されているからだ。下表は先程も説明したArchitecture Technical Briefから拾った数字をまとめたものだ。

　一番左のB200はGB200 Grace Blackwell Superchipに搭載されているB200で、これがおそらくフルスペックのものである。次のHGX B200の方は、同じB200ながら性能が1割程落ちている。

　そしてHGX B100に搭載されるB100は、フルスペックのB200と比べて3割ほど性能が落とされている。おそらくはこれはSM数の制限と動作周波数の変更の両方で実現しているのであろう。

　結果、HGX B200に搭載されるB200はGPU1つあたりがTDP 1000Wなのに対し、B100は700Wに抑えられている。実際にはこれが8つなので、HGX B200のTDPは8KW、HGX B100でも5.6KWの消費電力になる。

　GB200 Grace Blackwell Superchipの方はトータルで2.7KWという数字しか示されていないが、2チップのGraceを搭載したNVIDIA Grace CPU SuperchipのTDPが500Wと発表されているから、1個あたりで言えば250W。ということはGB200 Grace Blackwell Superchipに搭載されるB200のTDPは1個あたり1225Wという計算になる。実際はもう少し少ない1200Wあたりと想定される。

　HGX B200がやや低めなのは、おそらく空冷の限界が1000Wあたりにあるためだろう。仮にGB200 Grace Blackwell Superchipと同じスペックなら8つでほぼ10KWにも達する。これはいろいろ厳しいと思われる(いや8KWでも十分厳しいと思うのだが)。

　連載761回の最後のスライドで、2024年には液冷でTDP 1000Wになり、その後1300Wを超えるという予測が示されていたが、すでにこれを超える消費電力を実現しているあたりはさすがとしか言いようがない。

関連ニュース

コメント

ネット・科学もっと見る

ニワトリは“興奮すると顔が赤くなる”…

「入社後に年間休日91日と知った」休み…

職場の店舗トイレが「糞尿まみれにされ…

あの“千年に一度の悪魔”拡散時の心境…

研修1週間のはずが1日で放置された女性…

「48歳の夫がピアスを開けて帰ってきた…

ニコール・キッドマン、父親の遺体見て…

大家志津香が全身脱毛決めたきっかけ、…

VTuberみけねこ、声優名義“恋糸りあ”…

「入社後に年間休日91日と知った」休みが少なすぎて過労で休職した男性の決断

研修1週間のはずが1日で放置された女性 ついには「勝手に仕事している」と叱責されて……

ニワトリは“興奮すると顔が赤くなる”と判明

職場の店舗トイレが「糞尿まみれにされたりゴミを撒き散らしたり…公衆トイレ化している」と嘆く小売店勤務の女性

VTuberみけねこ、声優名義“恋糸りあ”でのアーティストデビュー中止に 「製作上の事情」と説明、「重大〇〇」発表配信も予告

あの“千年に一度の悪魔”拡散時の心境「橋本環奈ちゃんと並べられて…えっ、えっ、えっ」

スクエニHD、221億円の特別損失を計上へ 開発方針の見直しによるコンテンツ廃棄損

まもなく｢新聞がなくなる日｣がやって来る…新聞協会の報告書が明かした"部数激減"より深刻なヤバイ数字

「お父さん悲しんでるよ！」純金茶わん窃盗の堀江容疑者 SNSで衝撃広がる上京前に投稿していた“イケメンYouTube動画”

「子供にゲーム機買わない」はむしろ悪影響？SNSで論争勃発！「反動でバケモノになります」「なくてもいいじゃん」

「入社後に年間休日91日と知った」休みが少なすぎて過労で休職した男性の決断

研修1週間のはずが1日で放置された女性 ついには「勝手に仕事している」と叱責されて……

ニワトリは“興奮すると顔が赤くなる”と判明

職場の店舗トイレが「糞尿まみれにされたりゴミを撒き散らしたり…公衆トイレ化している」と嘆く小売店勤務の女性

VTuberみけねこ、声優名義“恋糸りあ”でのアーティストデビュー中止に 「製作上の事情」と説明、「重大〇〇」発表配信も予告

あの“千年に一度の悪魔”拡散時の心境「橋本環奈ちゃんと並べられて…えっ、えっ、えっ」

スクエニHD、221億円の特別損失を計上へ 開発方針の見直しによるコンテンツ廃棄損

まもなく｢新聞がなくなる日｣がやって来る…新聞協会の報告書が明かした"部数激減"より深刻なヤバイ数字

「お父さん悲しんでるよ！」純金茶わん窃盗の堀江容疑者 SNSで衝撃広がる上京前に投稿していた“イケメンYouTube動画”

「子供にゲーム機買わない」はむしろ悪影響？SNSで論争勃発！「反動でバケモノになります」「なくてもいいじゃん」

「子供にゲーム機買わない」はむしろ悪影響？SNSで論争勃発！「反動でバケモノになります」「なくてもいいじゃん」

賛否の「産休クッキー」、10年クレームなく製造業者は戸惑いも…大阪2児餓死事件が原点「どこがダメか一緒に考えたい」

台湾人が明かした「日本旅行で困ること」に賛同の声―台湾メディア

スクエニHD、221億円の特別損失を計上へ 開発方針の見直しによるコンテンツ廃棄損

慰安婦像に日本ビールや寿司を置く”テロ行為”、30代男性に批判殺到「日本人？」「追放して」

モーリーが解説。世界に広がった日本アニメをめぐる「ややこしい議論」

【速報】政権は信任に値せずと明確にすると立民代表

“触らない痴漢”が急増中？ あおちゃんぺ「凝視しながらついてきた男性が『触ってないから犯罪じゃないよね』と」

EVが炎上、「7分で骨組みだけ」火の勢いに驚きの声―上海市

日本は人口の5割が独身者の｢超ソロ国家｣になる…これから｢ひとり暮らしの高齢者｣が激増していく理由

4/27(土)21:00～選挙戦最終日に東京15区の立候補者が集う「ネット演説」生放送 主催：ニコニコ

【LIVE】5/5（日）9:00～【アメリカ海軍の航空ショー】岩国基地フレンドシップデー2024

5/3(金)午前0時〜声優・古谷徹と三石琴乃の朗読で聞く「日本国憲法」を24時間配信【憲法記念日特集2024年】

ネット・科学
もっと見る

研修1週間のはずが1日で放置された女性　ついには「勝手に仕事している」と叱責されて……

VTuberみけねこ、声優名義“恋糸りあ”でのアーティストデビュー中止に　「製作上の事情」と説明、「重大〇〇」発表配信も予告

スクエニHD、221億円の特別損失を計上へ　開発方針の見直しによるコンテンツ廃棄損

「お父さん悲しんでるよ！」純金茶わん窃盗の堀江容疑者　SNSで衝撃広がる上京前に投稿していた“イケメンYouTube動画”

研修1週間のはずが1日で放置された女性　ついには「勝手に仕事している」と叱責されて……

VTuberみけねこ、声優名義“恋糸りあ”でのアーティストデビュー中止に　「製作上の事情」と説明、「重大〇〇」発表配信も予告

スクエニHD、221億円の特別損失を計上へ　開発方針の見直しによるコンテンツ廃棄損

「お父さん悲しんでるよ！」純金茶わん窃盗の堀江容疑者　SNSで衝撃広がる上京前に投稿していた“イケメンYouTube動画”

スクエニHD、221億円の特別損失を計上へ　開発方針の見直しによるコンテンツ廃棄損

“触らない痴漢”が急増中？あおちゃんぺ「凝視しながらついてきた男性が『触ってないから犯罪じゃないよね』と」

4/27(土)21:00～選挙戦最終日に東京15区の立候補者が集う「ネット演説」生放送　主催：ニコニコ