管理人Utanoの戯言やIT関連情報やゲームリプレイや日々の出来事などをつれづれなるままに書きなぐる、そんな感じのブログです。

皆さまいかがお過ごしでしょうか、歌乃です。

新しい Model はないかしらん?とハギングフェイスを物色していてみつけた OmniGen v1

GitHub はここ。ライセンスは MIT 。

元プロジェクトは コーネル大 (Cornell University in NYC) のコンピュータ科学の研究。

続きを読む… 7 分 10 秒

皆さま、いかがお過ごしでしょうか。歌乃です。

SD3.5 は prompt を複雑にすると良さげな絵がでる。いわゆる「mega prompt」がいいのかもしれません。

あとは内容によって CFG と STEP 数を増加させるといい気がします。

という事で、今日の一枚です。

続きを読む… 1 分 54 秒

皆さまいかがお過ごしでしょうか。歌乃です。

AI 楽しいですね。主に画像生成を使ってますが、翻訳やら部位認識やら画像のキャプションやらほかにもいろいろ試しています。

ツールとして ComfyUI を利用しているのですが気付くと以下のようなメッセージが出ておりました。

「Could not find the bitsandbytes CUDA binary at WindowsPath('D:/Data/AI/StabilityMatrix/Data/Packages/ComfyUI/venv/lib/site-packages/bitsandbytes/libbitsandbytes_cuda124.dll')」

続きを読む… 3 分 13 秒

皆さま、いかがお過ごしでしょうか。歌乃です。

SD3.5 で LoRA 生成できたのは良かったのですが、画像生成の方はなかなか難しいです。

prompt の再現性というか、忠実性がいまいちつかめません (´・ω・`)

という事で、今日の一枚です。

続きを読む… 2 分 18 秒

皆さまいかがお過ごしでしょうか。歌乃です。

今月 (2024年10月) 22日付で、stability.ai から Stable Diffusion の最新バージョン 3.5 シリーズが 公開されました。

不評だった sd3 からのコミュニティ・フィードバックを反映して改善された (らしい) モデルとなります。

公開されているモデルは三種類で

  • Stable Diffusion 3.5 Large 最上位版。最高品質。
  • Stable Diffusion 3.5 Large Turbo Large のFineTune版、4ステップで生成可能。高品質。
  • Stable Diffusion 3.5 Medium 品質と速度のバランスを取ったモデル。

となっております。

続きを読む… 6 分 43 秒