管理人Utanoの戯言やIT関連情報やゲームリプレイや日々の出来事などをつれづれなるままに書きなぐる、そんな感じのブログです。
皆様いかがお過ごしでしょうか。歌乃です。
3D modeling してますか?
大規模学習モデルで画像生成 (PromptGraphics) に傾倒している私ですが、PromptGraphics もモデルによって得手不得手があり、求める画像がなかなか生成されない、もしくは生成されているがいまいち納得がいかない、かゆいところに手が届かない状況も多く発生します。
そういった場合、納得のいかない部分を手描きしてしまうという手っ取り早い解決法があり、私も良くこの方法を使っています。
ですが、私の画力の低さもあって、求めるイメージが学習モデルになかなか伝わらない (学習モデルが手描き画像を元にしたノイズから求めるイメージを復元してくれる確率が低い) という自体が起こるわけです。
※いつものごとく大半が戯言です。
皆様いかがお過ごしでしょうか。歌乃です。
やっと私のとこにもやってきましたよ。
なにがって?あれですよ、X 冬のBAN祭りですよ!( ゚Д゚)
皆さまいかがお過ごしでしょうか、歌乃です。
新しい Model はないかしらん?とハギングフェイスを物色していてみつけた OmniGen v1。
GitHub はここ。ライセンスは MIT 。
元プロジェクトは コーネル大 (Cornell University in NYC) のコンピュータ科学の研究。
皆さま、いかがお過ごしでしょうか。歌乃です。
SD3.5 は prompt を複雑にすると良さげな絵がでる。いわゆる「mega prompt」がいいのかもしれません。
あとは内容によって CFG と STEP 数を増加させるといい気がします。
という事で、今日の一枚です。
皆さまいかがお過ごしでしょうか。歌乃です。
AI 楽しいですね。主に画像生成を使ってますが、翻訳やら部位認識やら画像のキャプションやらほかにもいろいろ試しています。
ツールとして ComfyUI を利用しているのですが気付くと以下のようなメッセージが出ておりました。
「Could not find the bitsandbytes CUDA binary at WindowsPath('D:/Data/AI/StabilityMatrix/Data/Packages/ComfyUI/venv/lib/site-packages/bitsandbytes/libbitsandbytes_cuda124.dll')」