Вышла новая нейросеть Stable Diffusion. Она генерирует картинки по описанию

Разработчики нейросети Stable Diffusion, ранее доступной только в бета-версии, выложили проект в открытый доступ. Теперь пробовать сервис для преобразования текстовых запросов в изображения может любой желающий.

⚡️Новости из мира гаджетов, обзоры, гайды и не только — в телеграм-канале «Технологии | Лайфхакер».

Проще всего протестировать Stable Diffusion на Hugging Face, но на сайте длинные очереди: один запрос обрабатывается примерно за 5 минут. Через платформу DreamStudio всё работает куда быстрее, но нужен аккаунт (авторизоваться можно через учётную запись Google или Discord).

Кроме того, в DreamStudio каждому пользователю даётся ограниченное число кредитов, которые можно тратить на генерацию. Чем больше картинок и выше разрешение, тем дороже выходит каждая итерация. Чтобы восстановить ранее сгенерированные картинки, тоже нужно тратить кредиты, так что долго развлекаться не получится.

Генерация в Stable Diffusion через DreamStudio / Лайфхакер

Также проект выложили на GitHub. Пока что для работы требуется компьютер с видеокартой NVIDIA и 6,9 ГБ VRAM, в будущем планируется добавить поддержку видеочипов AMD, включая Apple M1/M2.

Насколько хорошо всё работает? Зависит от пользователя. Чем сложнее и точнее запросы, тем больше шансов на крутые результаты. Например, вот результаты по фразе “Дейенерис Таргариен в свадебном платье с драконом в стиле Альфонса Мухи”:

Иллюстрация: Лайфхакер, Stable Diffusion

Это — “Волшебник Йода в киберпанк-городе”.

Иллюстрация: Лайфхакер, Stable Diffusion

А это — “Гарри Поттер ужасы”. Пугать-то оно пугает, но совсем не так, как должно было.

Иллюстрация: Лайфхакер, Stable Diffusion

Иными словами, думать вместо себя нейросеть не заставишь: для внятного результата надо самому продумать, что хочешь получить на выходе.

Stable Diffusion позволяет настраивать точность соответствия запросу, число шагов и прочие параметры. Максимально возможное разрешение — 1024 × 1024 пикселя, одновременно можно вывести до 9 картинок. Увеличивать разрешение нейросеть не умеет, для этого придётся полагаться на сторонние программы.

Если опробуете сервис, делитесь результатами в комментариях!

Нейросеть нарисовала постеры культовых фильмов. Выбрали 15 самых крутых

Нейросеть показала героев «Гарри Поттера» в мире киберпанка

Google представила нейросеть Imagen. Она генерирует картинки по описанию

Комментарии

Написать комментарий

O K

25.08.22 20:03

Не только лишь хахлы борются за "в и на" )))

+1 -3 Ответить

Yevgeny V

25.08.22 23:23

неужели? а вы видимо великоросс-интернационалист?

+1 -1 Ответить

25.08.22 23:24

какое вы дали задание системе?)

+1 - Ответить

Максим Ламбин

26.08.22 09:04

"Man face, winter colors, super realistic, hdr, 8k, remaster extremely detailed, artstation, digital paint, post processing, ambient lighting, octane render, unreal engine, illustration, wide-angle perspective, cinematic, ray tracing, global illumination"А далее уже подбор общего варианта и "игра" с cfg/steps - не с первого раза получается то что нужно, как правило.С масками тож прикольно получается, кстати

Читать все комментарии