Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Создавать изображения можно прямо в браузере. Чем сложнее запрос, тем лучше результат.

Разработчики нейросети Stable Diffusion, ранее доступной только в бета-версии, выложили проект в открытый доступ. Теперь пробовать сервис для преобразования текстовых запросов в изображения может любой желающий.

⚡️Новости из мира гаджетов, обзоры, гайды и не только — в телеграм-канале «Технологии | Лайфхакер».

Проще всего протестировать Stable Diffusion на Hugging Face, но на сайте длинные очереди: один запрос обрабатывается примерно за 5 минут. Через платформу DreamStudio всё работает куда быстрее, но нужен аккаунт (авторизоваться можно через учётную запись Google или Discord).

Кроме того, в DreamStudio каждому пользователю даётся ограниченное число кредитов, которые можно тратить на генерацию. Чем больше картинок и выше разрешение, тем дороже выходит каждая итерация. Чтобы восстановить ранее сгенерированные картинки, тоже нужно тратить кредиты, так что долго развлекаться не получится.

Генерация в Stable Diffusion через DreamStudio / Лайфхакер

Также проект выложили на GitHub. Пока что для работы требуется компьютер с видеокартой NVIDIA и 6,9 ГБ VRAM, в будущем планируется добавить поддержку видеочипов AMD, включая Apple M1/M2.

Насколько хорошо всё работает? Зависит от пользователя. Чем сложнее и точнее запросы, тем больше шансов на крутые результаты. Например, вот результаты по фразе “Дейенерис Таргариен в свадебном платье с драконом в стиле Альфонса Мухи”:

Иллюстрация: Лайфхакер, Stable Diffusion

Это — “Волшебник Йода в киберпанк-городе”.

Иллюстрация: Лайфхакер, Stable Diffusion

А это — “Гарри Поттер ужасы”. Пугать-то оно пугает, но совсем не так, как должно было.

Иллюстрация: Лайфхакер, Stable Diffusion

Иными словами, думать вместо себя нейросеть не заставишь: для внятного результата надо самому продумать, что хочешь получить на выходе.

Stable Diffusion позволяет настраивать точность соответствия запросу, число шагов и прочие параметры. Максимально возможное разрешение — 1024 × 1024 пикселя, одновременно можно вывести до 9 картинок. Увеличивать разрешение нейросеть не умеет, для этого придётся полагаться на сторонние программы.

Если опробуете сервис, делитесь результатами в комментариях!

Обложка: Лайфхакер, Stable Diffusion
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Это упрощённая версия страницы.

Читать полную версию
O K
Не только лишь хахлы борются за "в и на" )))
Yevgeny V
неужели? а вы видимо великоросс-интернационалист?
Yevgeny V
какое вы дали задание системе?)
Максим Ламбин
"Man face, winter colors, super realistic, hdr, 8k, remaster extremely detailed, artstation, digital paint, post processing, ambient lighting, octane render, unreal engine, illustration, wide-angle perspective, cinematic, ray tracing, global illumination"А далее уже подбор общего варианта и "игра" с cfg/steps - не с первого раза получается то что нужно, как правило.С масками тож прикольно получается, кстати
Читать все комментарии