<b>img2img ломается не из-за модели, а из-за плохого входа и слабого контроля</b>
img2img — это не «перерисовать картинку», а управляемая трансформация. Если исходник шумный, кропнутый или с кривой композицией, stable_diffusion будет чинить ошибки вместо задачи. Поэтому сначала проверяй три вещи: читаемость силуэта, чистоту фона и то, не противоречат ли друг другу референс и промпт.
Рабочая схема в comfyui обычно упирается в контроль силы изменения. Слишком низкий denoise оставляет старую картинку почти без правок, слишком высокий убивает идентичность. Для серии креативов лучше двигаться маленькими шагами и сравнивать не один результат, а связку из 3–5 вариантов: так быстрее ловится граница, где image_generation ещё держит объект, но уже меняет стиль.
Если нужна стабильность, добавляй опоры: маску, controlnet, reference-референс или отдельный препроцессор под позу и края. Чем слабее вход, тем больше модель начинает «додумывать» детали и тем выше шанс артефактов — лишних пальцев, грязных текстур, расплывчатого текста.
Хороший img2img-пайплайн строится не вокруг магии, а вокруг повторяемости: один и тот же вход, фиксированная логика правок, понятный контроль силы вмешательства. Тогда open_source_models работают предсказуемо, а не как генератор случайных сюрпризов.
Open Source Image Gen
@oss_image_gen
<b>img2img ломается не из-за модели, а из-за плохого входа и слабого контроля</b>
Этот пост опубликован в Telegram-канале Open Source Image Gen. Подписаться можно по ссылке: @oss_image_gen.