Stable Diffusion – нейросеть, предназначенная для создания изображений на основе текстовых описаний. Является онлайн-сервисами, но Stable Diffusion может быть также установлена на компьютер. Для чего? Чтобы получить больше возможностей в плане настроек и не сталкиваться с ограничениями веб-версий.
Помните, что нейросеть предъявляет к графическому оборудованию достаточно высокие требования, а это примерно наличие 6 Гб видеопамяти, кроме того, официальный дистрибутив не имеет GUI, поэтому все операции придется выполнять в командной строке. К счастью, благодаря открытому исходному коду, у Stable Diffusion появились форки с поддержкой графического интерфейса и к тому же не столь требовательны к ресурсам видеокарты.
Примером такого форка является Stable Diffusion WebUI от разработчика с ником Automatic1111. Данная версия нейросети предъявляет несколько меньшие требования к графике, хотя назвать их низкими никак нельзя: для работы сети на вашем ПК должна быть установлена дискретная видеокарта NVIDIA GeForce с объемом видеопамяти 4 Гб, но теоретически можно и меньше. Управляется Stable Diffusion WebUI через веб-интерфейс локального браузера, что также является плюсом. Итак, давайте установим нейросеть.
Первым делом скачайте и установите актуальную версию Python, хотя вообще-то разработчик рекомендует использовать 3.10.6.
Пакет Python устанавливается как обычная программа, отметьте только в окне мастера-установщика пункт «Add Python to PATH».
Скачайте и установите компонент Git.
В параметрах установки можно ничего не менять, просто жмите каждый раз «Next».
Далее с сайта проекта Automatic1111 скачайте архив со Stable Diffusion WebUI, для чего нажмите на странице кнопку «Code» и выберите в меню «Download ZIP». Распакуйте архив в любое удобное расположение, главное, чтобы в пути не было пробелов и не использовались кириллические символы.
Скачайте с официального ресурса (для этого потребуется регистрация) саму нейросеть – файл sd-v1-4.ckpt,
переименуйте его в model.ckpt и забросьте в каталог распакованного архива Stable Diffusion WebUI, который был скачан на предыдущем шаге.
Запустите двойным кликом расположенный в этой же папке командный файл webui-user.bat и дождитесь завершения процедуры скачивания и установки недостающих компонентов. Процесс может занять некоторое время, так как скачать нужно будет не менее 3 Гб данных. Не закрывайте консоль даже если вам покажется, что процесс завис.
Если всё пройдет нормально, в командной строке появится сообщение Running on local URL: http://127.0.0.1:7860/.
Перейдя по этому локальному IP-адресу в любом веб-браузере, вы должны увидеть вот такую панель управления нейросетью.
Все основные настройки доступны на вкладке txt2img, здесь же расположено поле для ввода описания генерируемого изображения. Описание следует вводить на английском языке. Принцип настройки тот же, что и в продвинутых режимах веб-сервисов:
- Sampling Method — метод генерирования изображения.
- Sampling Steps — количество шагов генерирования.
- Batch count — количество наборов генерируемых изображений.
- Batch size — количество изображений в наборе.
- Height и Width — ширина и высота изображения.
- CGF Scale — точность соответствия результата описанию.
- И другие…
Старайтесь по возможности избегать высоких значений для третьего, четвертого и пятого параметров, оказывающих значительное влияние на производительность. Особенно это касается ширины и высоты генерируемого изображения, ведь чем меньше картинка, тем меньше ресурсов памяти требуется нейросети. Созданные Stable Diffusion картинки по умолчанию сохраняются в папку outputs, в расположении установки Stable Diffusion WebUI, при желании целевой каталог можно задать на вкладке Settings веб-интерфейса нейросети.
Ссылки на ресурсы:
|