KOREDO?com
ホーム
| パソコン関係 | ソフ | ハード | その他 | お問合せ  

 


■ Palit GeForceGTX1660 Super ■

ミドルクラスビデオカードで
AIお絵描き

2022/10/12
o-yam

●前書き

AIお絵描き

2022年8月頃、MidJourney(ミッド ジャーニー)が出現。呪文を唱えるだけでプロの絵描きと同等、もしくはそれ以上の絵をコンピュータが生成する。

やり方は簡単で、DiscordなるSNSのアプリ/WEBサイトでチャット形式で呪文を唱えると1分くらいで

うおぉぉおおおおお

と声が出るような絵が生成される。

AI恐るべし!

これはスゴい。革命と言っても過言ではない。
拡大
ただのテキトーな英単語から生成された絵

だがこのMidJourney@Discordには難点がある。
英語なのはいいとして、
有料(お試しで何回かは無料)
・何の絵をを生成してるのか他人にバレバレ


次に google Colab に行ってみる。
こちらは無料だが
・チマチマと面倒
・混んでると「今は満員だからダメだよ」などとぬかす
・エ□い絵を生成すると垢BANの危険がある

他にも何個か画像生成サービスが出てきたが、やはり有料であったり生成できる枚数が少なかったり制約が多い。


ここはやはりローカルでコソコソと生成できる環境を作らねば!
ほとばしるエ□パワー!!

そうこうしている内にオープンソースの「Stable Diffusion(ステーブル ディフュージョン)」が発表され、ローカルでガシガシ生成出来るようになった。

なったのはいいが敷居が高い。CUDA対応nVIDIAのビデオカードでビデオメモリが12GBとか。
どこのゲーミングマシンだよ。こっちは内蔵GPU使ってんだぞ!的な。

しかしそこはオープンソース。ほどなくして
stable diffusion openvino

がリリース。GPU無し、CPUだけで生成する。
これはサクッとインストールして夜な夜な怪しい絵を生成出来る環境ができた。

$ python3 ./demo.py --prompt "ここに呪文を書くエ□エ□エッサイム"

すばらしい!!


のはいいが、やはり問題はある。512×512の絵を生成するのに7分かかる(@Ryzen5 2400G)。一晩回して60枚。
拡大


ここはやはりGPUのパワーを試してみたいところである。

とは言えハイエンドビデオカードは高い。。。。
3060 12GBで5万円〜10万円
人生最期だ!!!と気合を入れても無い袖は振れない。

ここは貧乏人らしく中古を漁る。
1660 6GBでも一応動くらしいのでその辺に狙いをつけて中古屋とヤフオクを徘徊。
マイニングで酷使したジャンク品を少し競り合ってなんとか15000円で落札。

新品1660は今でも購入可能で相場は25000〜5万円くらい


金曜夜落札
土曜出荷
日曜到着(ヤマト)

たまたま同じ県内だったので多少早かったかも。

外観

拡大
ファンは1個でコンパクトサイズ
箱あり・付属品無し
特に問題はないが妙に臭かった。さすがジャンク品。


拡大
デジタルのみ
HDMI、DP、DVI-D
2スロット専有

最近はアナログが出ないようだ

多少薄汚れているがそんな物は気にしない。動けばOK。

拡大
補助電源は8ピン

拡大
6ピンしかないので8ピン変換ケーブルを手配


拡大
装着した感じ


仕様
世代    Turing
プロセス    12nm
CUDAコア    1,408
ベースクロック    1530 MHz
ブーストクロック    1785 MHz
メモリ 6GB GDDR6
TDP    125 W
MSRP    $229
国内価格    26,980円〜
発売日    2019/10/29

環境構築
ハード環境:
CPU Ryzen5 2400G
メモリ 16GB
ビデオ GeforceGTX1660 Super / 6GB
OS Ubuntu 22.04


参考にしたサイト
https://qiita.com/db0091/items/cf03c59bb4138d9a4dbb
他にも多数・・・・

Ubuntu22.04新規インストール
NVIDIA ドライバ(CUDA)
NVIDIAコンテナ
basujindal版stable diffusion
モデルデータの入手
ドッカーでコンテナの起動

これでなんとかブラウザをUIにしたモノが起動し、やっとこさGPUで生成できる状態になった。

拡大
検証
肝心のスピードは

Ryzen5で生成:7分=420秒
GF1660で生成:1.5分=90秒

うむ。
確かに速い事は速い。
しかし、90秒では「見てる間に終わる」とか言うレベルではない。
CD-Rを焼くのに倍速が8倍速になった!みたいな感じでかなり微妙。

ハイエンドクラスでさらに約3倍速い=30秒くらいか
それはコスパが悪すぎるような。。。。

(追記:)

3ヶ月くらい放置していたらかなり状況が改善していた。

Ryzen 5600G + GF1660で生成=14秒

これくらいなら見てる間に終わる。これくらいで十分である。
でかいサイズで生成する場合のみ強力なビデオカードを用意すればいいだろう。


また、ソフトはAUTOMATIC1111版一択になったようだ。

CPUのみで生成も可能。

現在の起動オプションは
COMMANDLINE_ARGS="--precision full --no-half --medvram --listen"



モデルデータも多数出てきているのでお好みで。実写系、アニメ調、流出モノなど。



騒音は気になる/嫌になるレベルでは無く普通

発熱はさすがに多い。演算中は排気口から温かい風がもうもうと出る。
今から寒くなるので暖房兼用で丁度いいが、暑い時期はとても使ってられないだろう。

画質不明。演算専用ボードなのでモニタには繋がっていない。画面は元々のCPU内蔵GPUのまま。



●結論

先に言っておこう
ローカルAIお絵描きは現時点ではやめた方がいい。めんどくさすぎる。
Windows環境でも似たような物(WSLからやる方式など狂気の沙汰)

StableDiffusionはオープンソースなのでどんどん進化していくであろう。(特にアニヲタとエ□ガキ、エ□ジジイには突き刺さっているようなので目を見張るような進化速度である)

その内snapかなんかでスコっと入れられるようになる日が来るような気がする。
もしくは有料パッケージか。

AIお絵描き自体はGoogle Colabあたりでサワリだけやっておけばいいのではないだろうか。
サワリだけでも召喚呪文詠唱の鍛錬が待っているが。。。

もしくはCPUだけで生成するか。12世代i7クラスであれば1660に迫る速度で演算可能。



GeForce自体は他のAI系のソフト(将棋など)にも有用なので1枚持っておいて損はない。。。。。。かもしれない。

演算を任せられるのでCPUの使用率は低いまま。

巨大な電源が要らない分、1660などのミドルクラスはコスパがいいような気がする。

 

●後書き
最初コンテナ方式がイヤで、なんとかドッカーなしで構築しようとしたのだがマイナーなディストリを使っていたので頓挫。
OSの入れ直しからやらざるを得なくなった。。。。

この辺は自身の知識不足(ドッカー?ああ触ったことあるよ/Python?なんか簡単な言語らしいね、くらい)が敗因である。。。

エ□ジジイは今から色々覚えたところであまり意味はない。そのうち墓に行くだけである。

コンピュータの進化はいつの時代もやはりエ□パワーである。

フレームバッファ等でで256色、4千色、6万色表示可能!総天然ショック!
スキャナーで画像を取り込める!
カラープリンタで印刷可能!
メーリングリストで海外の画像が入手可能!
怪しい個人運営BBSに行けば画像が入手可能!
デジカメで直接取り込み!写真屋でプリント不要!!
インターネットで海外のエ□サイトとつながる!
高速回線で動画が見れる!
怪しいソフトで画像/動画ファイルが交換できる!
CD-Rで大量保存可能!!
スマホで手の中で観れる!!
晩のおかずが自前で生成できる!←今ココ