Stable Diffusionを試していて、生成される画像が512x512だと使いづらいなと感じていました。
16:9で出力しようと試みたんですが、意外と大変だったのでその方法を残しておきます。
まず結論から
--Wで幅を896に指定。--Hで高さを512に指定する。
$ python scripts/txt2img.py --W 896 --H 512 --prompt "a photograph of an astronaut riding a horse" --plms --ckpt models/ldm/stable-diffusion-v1/sd-v1-4.ckpt
厳密に言えば、16:9ではなく、16:9.143ぐらいです。
896x504にすると16:9になるので、厳密に16:9の画像を使いたい場合は、生成した画像をPhotoshop等で加工する必要があります。
実際に生成したもの
本当は、1920x1080を出力したい
--Wで幅を1920に指定。