ИИ для обоев, макс разрешение
May. 5th, 2025 06:56 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Пытаюсь выяснить какое максимальное разрешение картинки потянет мой комп. Это не совсем бессмысленное занятие, к примеру можно делать обои рабочего стола.
Одно понятно что при росте размера матрицы картинки в арифметической прогрессии, время её обсчёта растет в геометрической прогрессии (хотя вру, тоже в принципе в арифметической), если 512*512 обсчитывается менее 30 секунд шаг то 1080*1080 больше 2 минут.
В принципе можно сделать в 2 раза меньше, к примеру 960*540, а потом двукратно увеличить в Aiarty. Получится как-то так, качество не очень...

Ну поскольку обычно я тренируюсь на кошках то вот флюксшнель мне родил кота в 1400*1080 6,5 минут на шаг (2 шага стандартно, я редко когда 4 во флюксе испольхзую это если только набело какой-нибудь шыдевр).

И видно не предел, надо продолжить искать этот предел.
Я ему увеличил разрешение до 1784*1000 и вот что он мне почти через 15 минут выдал.

Откровенно говоря схалтурил он и даже где-то смухлевал, 3/4 изображения какая-то грязная стена и небольшой котенок.
Тогда я поступил по-другому, вытащил сид из первого кота 978230829 (котик получился хороший, обойный) и установил его на разрешение 1856*1040 Подразумевается что при одном и том же сиде и одинаковом запросе с одинаковым количеством шагов (естественно на одной и той же модели) должно получиться идентичное изображение. По умолчанию сиды рандомные. И... он опять смухлевал, видимо измененное разрешение, матрица так сказать тоже изображение на сид меняет... Но выдал... Нахалтурил, типа на тебе мебель, пол, а кота тебе и котенка опять хватит... Хорошо хоть по центру сцены. Но разрешение уже приближается к HD но и время обсчёта уже приближается к 20 минутам, 19:02 то бишь...

Попробую продолжить с тем же сидом. Ничтоже сумняшеся я сразу задал 1920*1080 то есть HD. Ждать долго, но такие разрешения никакой интернет-генератор вам по крайней мере бесплатно не выдаст. Леонардо выдаёт например максимум 1120*1120. Впрочем я сейчас использую интернет генераторы только с той точки зрения, что я могу с них получить то, что не могу получить на домашнем и хотя они быстрее время у меня тут не в приоритете (хотя хочется быстрее что уж говорить). Раньше у меня на таком разрешении ошибку выдавал но теперь у меня Forge новый сборка этого года, решил убрать всякие "ускоряющие" аргументы из командной строки (он и без них нормально управляет моей скудной видеопамятью, попытка ускорить просто приведет к ошибкам на таких больших нагрузках) оставил только классический для моей карты --zluda и жду HD... 26 минут!
Опять котенок, опять халтура с антуражем (впрочем и запрос простой cat без уточнения). Но HD! На этом эксперименты можно закончить ибо большего размера мне не нужно в принципе. Хотя чисто теоретически можно попробовать максимальный размер картинки в Forge 2048*2048 Но что-то час ждать не хочется чтобы потом ещё ошибка, да и зачем...
Можно уже думать об обоях.

Вот пару рабочих кабинетов сгенерировал,
Промт такой a warmly lit, surreal, and vibrant cinematic photo of a steampunk-inspired cozy cabin interior, set deep in the woods, with lush greenery and vines crawling through the wooden walls and furniture, featuring a golden ratio composition, rich textures, and subtle film grain, showcasing a cluttered yet cozy reading nook with leather-bound books, intricately carved wooden clocks, and vintage scientific instruments, illuminated by soft, warm candlelight and lanterns, with a hint of misty fog rolling in through the windows, capturing the essence of a secluded, fantastical retr
Второй мне особенно нра, но увы заметная нечеткость, надо взять бы сид и на 4 шага, а не на 2 как тут и может семплинг поменять


Сделал, ну вот это наверное максимум от флюкса 4 шага с более медленными и качественными смплерами Heun/SGM Uniform вместо Euler/Simple Время 54 минуты. Поробовать что-ли Stable diffusion джаггернаут или какой-там, на 20 шагов... наверное попробую

Вот заказал джаггернауту ту же картинку на 20 шагов, делал он её быстрее около 40 минут.

Сразу видна разница между стейблдифьюжном и флюксом. Флюкс он делает всё как бы более реалистичнее и уютнее, создаёт тот уровень хаоса который даёт сцене реализм. А стейблюдифьюжн разбросал всё как по запросу, совершенно не регулируя уровнь хаоса ведь не может же быть по стенам захламлено а такой большой пол в центре чистый, да и сам антураж больше похож на театральную декоарцию нежели на комнату, неестественно совсем... Это я и называю пластиковостью Поэтому конечно стейблдифьюжн надо пользовать только для того, чтобы ещё раз убеждаться, что флюкс лучше. Хотя наверное лоя каки-нибудь простых или мультяшных сцен стейблдифьюжн просто быстрее и проще.
Запустил Fooocus там тоже джаггернаут, на 30 шагов он мне выдал примерно то же самое что и джагггернаут в форж, поставил там максимальное качество в 60 шагов, увы там HD не поставить поставил примерно максимум что там есть 1344*704 и в общем комнатенка мне понравилась, уже лучше со стольки итераций но качество, увы откровенно не очень. Но наверное если 60 шагов поставить в форже джаггернауту в HD и подождать часа полтора мож чего и выйдет.. но флюкс всё равно лучше

P.S. Я думаю что количество докупленной памяти 48 Гиг повлияло на возможность крупноразмерных фото, несмотря на то что я не включаю функцию эмуляциию видео в оперативке в самой форже, поскольку она всё равно ошшибку выдает, видимо 48 для этого тоже недостаточно, тем более что она всё равно и так выжирает прилично оперативной памяти 82% как с куста занято около 30 гиг. Слышал что рекомендуемое количество памяти для проги 64 гига оперативки ну и 16 видео.
Одно понятно что при росте размера матрицы картинки в арифметической прогрессии, время её обсчёта растет в геометрической прогрессии (хотя вру, тоже в принципе в арифметической), если 512*512 обсчитывается менее 30 секунд шаг то 1080*1080 больше 2 минут.
В принципе можно сделать в 2 раза меньше, к примеру 960*540, а потом двукратно увеличить в Aiarty. Получится как-то так, качество не очень...

Ну поскольку обычно я тренируюсь на кошках то вот флюксшнель мне родил кота в 1400*1080 6,5 минут на шаг (2 шага стандартно, я редко когда 4 во флюксе испольхзую это если только набело какой-нибудь шыдевр).

И видно не предел, надо продолжить искать этот предел.
Я ему увеличил разрешение до 1784*1000 и вот что он мне почти через 15 минут выдал.

Откровенно говоря схалтурил он и даже где-то смухлевал, 3/4 изображения какая-то грязная стена и небольшой котенок.
Тогда я поступил по-другому, вытащил сид из первого кота 978230829 (котик получился хороший, обойный) и установил его на разрешение 1856*1040 Подразумевается что при одном и том же сиде и одинаковом запросе с одинаковым количеством шагов (естественно на одной и той же модели) должно получиться идентичное изображение. По умолчанию сиды рандомные. И... он опять смухлевал, видимо измененное разрешение, матрица так сказать тоже изображение на сид меняет... Но выдал... Нахалтурил, типа на тебе мебель, пол, а кота тебе и котенка опять хватит... Хорошо хоть по центру сцены. Но разрешение уже приближается к HD но и время обсчёта уже приближается к 20 минутам, 19:02 то бишь...

Попробую продолжить с тем же сидом. Ничтоже сумняшеся я сразу задал 1920*1080 то есть HD. Ждать долго, но такие разрешения никакой интернет-генератор вам по крайней мере бесплатно не выдаст. Леонардо выдаёт например максимум 1120*1120. Впрочем я сейчас использую интернет генераторы только с той точки зрения, что я могу с них получить то, что не могу получить на домашнем и хотя они быстрее время у меня тут не в приоритете (хотя хочется быстрее что уж говорить). Раньше у меня на таком разрешении ошибку выдавал но теперь у меня Forge новый сборка этого года, решил убрать всякие "ускоряющие" аргументы из командной строки (он и без них нормально управляет моей скудной видеопамятью, попытка ускорить просто приведет к ошибкам на таких больших нагрузках) оставил только классический для моей карты --zluda и жду HD... 26 минут!
Опять котенок, опять халтура с антуражем (впрочем и запрос простой cat без уточнения). Но HD! На этом эксперименты можно закончить ибо большего размера мне не нужно в принципе. Хотя чисто теоретически можно попробовать максимальный размер картинки в Forge 2048*2048 Но что-то час ждать не хочется чтобы потом ещё ошибка, да и зачем...
Можно уже думать об обоях.

Вот пару рабочих кабинетов сгенерировал,
Промт такой a warmly lit, surreal, and vibrant cinematic photo of a steampunk-inspired cozy cabin interior, set deep in the woods, with lush greenery and vines crawling through the wooden walls and furniture, featuring a golden ratio composition, rich textures, and subtle film grain, showcasing a cluttered yet cozy reading nook with leather-bound books, intricately carved wooden clocks, and vintage scientific instruments, illuminated by soft, warm candlelight and lanterns, with a hint of misty fog rolling in through the windows, capturing the essence of a secluded, fantastical retr
Второй мне особенно нра, но увы заметная нечеткость, надо взять бы сид и на 4 шага, а не на 2 как тут и может семплинг поменять


Сделал, ну вот это наверное максимум от флюкса 4 шага с более медленными и качественными смплерами Heun/SGM Uniform вместо Euler/Simple Время 54 минуты. Поробовать что-ли Stable diffusion джаггернаут или какой-там, на 20 шагов... наверное попробую

Вот заказал джаггернауту ту же картинку на 20 шагов, делал он её быстрее около 40 минут.

Сразу видна разница между стейблдифьюжном и флюксом. Флюкс он делает всё как бы более реалистичнее и уютнее, создаёт тот уровень хаоса который даёт сцене реализм. А стейблюдифьюжн разбросал всё как по запросу, совершенно не регулируя уровнь хаоса ведь не может же быть по стенам захламлено а такой большой пол в центре чистый, да и сам антураж больше похож на театральную декоарцию нежели на комнату, неестественно совсем... Это я и называю пластиковостью Поэтому конечно стейблдифьюжн надо пользовать только для того, чтобы ещё раз убеждаться, что флюкс лучше. Хотя наверное лоя каки-нибудь простых или мультяшных сцен стейблдифьюжн просто быстрее и проще.
Запустил Fooocus там тоже джаггернаут, на 30 шагов он мне выдал примерно то же самое что и джагггернаут в форж, поставил там максимальное качество в 60 шагов, увы там HD не поставить поставил примерно максимум что там есть 1344*704 и в общем комнатенка мне понравилась, уже лучше со стольки итераций но качество, увы откровенно не очень. Но наверное если 60 шагов поставить в форже джаггернауту в HD и подождать часа полтора мож чего и выйдет.. но флюкс всё равно лучше

P.S. Я думаю что количество докупленной памяти 48 Гиг повлияло на возможность крупноразмерных фото, несмотря на то что я не включаю функцию эмуляциию видео в оперативке в самой форже, поскольку она всё равно ошшибку выдает, видимо 48 для этого тоже недостаточно, тем более что она всё равно и так выжирает прилично оперативной памяти 82% как с куста занято около 30 гиг. Слышал что рекомендуемое количество памяти для проги 64 гига оперативки ну и 16 видео.