旧世代のグラフィックボードではあるがVRAMだけを見れば現行製品に引けを取らないRadeon VII。入手することができたので、どこまでやれるのか試すことにした。

スペック

ここ参照。
VRAMがHBM2で実装されているので、GDDR実装の一般的なグラフィックボードと比較すると、メモリバス幅が広くメモリクロックが低いのが特徴。 どのメーカーもリファレンスモデルのみの販売だった。(オリファンモデルを見たことがない)
動画のフレーム補間技術Fluid Motionを使用できる最後のグラボとして、また仮想通貨のマイニングといった用途に重宝されていたようだ。もっとも後者は電気代の高騰もあったりしてほとんど下火だが…。

Radeon VII
お前、やれるのか…?

PC環境

眠っていたPCパーツにメモリとグラボを取り付けてUbuntuをインストールしただけのPC。

CPUAMD Ryzen 7 1700
メモリDDR4-2400 32GB(8GB x 4)
マザーボードFatal1ty AB350 Gaming K4
グラフィックボードSAPPHIRE RADEON VII
SSD(NVMe)PX-256M9PeG
無線LANアダプターArcher TX3000E
OSUbuntu 22.04.2 LTS

NVMeへのUbuntuインストールは初めてだったが特に問題なし。 ただしTX3000Eは別途ドライバーをインストールしないと認識しないので注意すること。当初はエレコムのUSB接続の無線LANアダプターを使っていたが、SSH接続がよく切れて使い物にならなかったので変更した。まあ古いものだし多少は仕方ないよね。

Stable Diffusion導入

「Stable Diffusion Radeon」でググれば出てくるので割愛。
使用したリポジトリはこちら

パフォーマンス確認

よく言及されているハローアスカベンチマーク(Hello Asuka Benchmark)はNovelAIのリークモデルを使用する必要がある。 そのリークモデルはµTorrentを利用して入手するらしいが、あまりこの手のソフトウェアはPCに入れたくないのでパス。

そこで、ちもろぐに掲載されている「Ayaka Benchmark」を採用しデータを取った。

設定

使用するモデル

AbyssOrangeMix2_nsfw

ポジティブプロンプト

masterpiece, best quality, soft lighting, absurdres, looking at viewer, solo, ponytail, kamisato ayaka, serafuku, kamisato ayaka (heytea), official art, official alternate costume, blunt bangs, hair bow, hair ribbon, red ribbon, school uniform, sailor shirt, sailor collar, pleated skirt, 1girl, skirt, black bow, cate, genshin,

ネガティブプロンプト

nsfw, (worst quality, low quality, extra digits, male:1.4), bad_prompt,

他設定

Sampling methodDPM++ 2M Karras
Sampling steps20
Width512
Height768
Batch count10
Batch size1
CFG Scale7
Seed1091979662

測定結果

描画時間(Time taken):182.5s
普通に遅い。 Radeon RX 6700XTを少し上回るパフォーマンスだ。

生成された画像
画像はちゃんと出る

高解像度の画像生成パフォーマンス

だが、Radeon VIIには16GBというVRAMを搭載している。これをフル活用するような設定ではどうだろう。

設定

使用するモデル

AbyssOrangeMix2_nsfw

ポジティブプロンプト

a photograph of an astronaut riding a horse

ネガティブプロンプト

nsfw, (worst quality, low quality, extra digits, male:1.4), bad_prompt

他設定

Sampling methodDPM++ 2M Karras
Sampling steps20
Width/Height後述
Batch count10
Batch size1
CFG Scale7
Seed2382819807

WidthをHeightを徐々に上げ限界点を確かめる。

結果

WidthHeight描画時間(Time taken)Sys VRAM
51251258.7s2364/16368 MiB (14.44%)
64048071.8s3158/16368 MiB (19.29%)
800600137.7s3692/16368 MiB (22.56%)
1024768349.6s3464/16368 MiB (21.16%)
1280720304.9s3740/16368 MiB (22.85%)
1280768強制終了強制終了

16GBのVRAMでもHD以上の画像生成は無理そう。

生成された画像

まとめ

最初から分かり切っていたことではあるが、現状Radeonを選ぶ理由はない。 素直にGeForce RTX 3060の12GBを買おう。

生成された画像
出てくる画像は悪くない