Stable Diffusion

Генерация и редактирование изображений по тексту.
Открытая модель для создания и доработки картинок (реализм, арт, фото). Подходит для локального запуска и интеграции в графические редакторы.
Основная информация
Разработчик: Stability AI
Год выпуска: 2022 (Stable Diffusion 1.0), обновления до версии 3 (2024)
Тип модели: Диффузионная (latent diffusion)
Доступ: Открытые веса (можно запускать локально)
Как работает?
Текст → Эмбеддинг: Модель преобразует текстовый запрос (промпт) в числовой вектор (CLIP).
Диффузия: Шумное изображение постепенно «уточняется» до четкого, следуя текстовому описанию.
Декодирование: Финал генерируется в формате 512×512 или выше (с апскейлером).
Ключевые особенности
✔ Гибкость: Поддержка разных стилей (реализм, аниме, пиксель-арт) через LoRA и ControlNet.
✔ Локальный запуск: Работает на GPU с 4+ GB VRAM (например, через WebUI).
✔ Дополнения: Плагины для Photoshop, Blender, автоматическая ретушь.
Где использовать?
Генерация концепт-арта
Ретушь фото (например, Stable Diffusion + GFPGAN)
Создание текстур для игр
Пример запроса:
*«Реалистичный портрет киберпанк-женщины с неоновыми глазами, детализированная кожа, фотореализм, 8K»*