«Сбер» добавил в нейросеть Kandinsky аналог генеративной заливки из Photoshop

Можно дорисовать картинку или добавить в кадр новый объект. А ещё Чебурашки больше не похожи на монстров из-под кровати.

«Сбер» представил большое обновление генеративной нейросети Kandinsky. С обновлением до Kandinsky 3.0 значительно улучшилась генерация иллюстраций, а новая Kandinsky Video первой из российских нейросетей способна создавать видеоролики.

⚡️Новости из мира гаджетов, обзоры, гайды и не только — в телеграм-канале «Технологии | Лайфхакер».

Начнём с Kandinsky 3.0. Главным нововведением по сравнению с версией 2.2 стало улучшенное распознавание запросов: генерация теперь точнее соответствует промпту без ущерба качеству. Кроме того, кратно увеличилось качество понимание запросов на тему отечественного культурного кода — героев советских и российских фильмов и мультиков. Разницу наглядно показали на запросах с Чебурашкой и домовёнком Кузей:

Слева результаты генерации с Kandinsky 3.0, справа — с Kandinsky 2.2. Иллюстрации: «Сбер»

Также показали сравнение со старыми версиями Kandinsky и другими популярными моделями — Midjourney (подписана как MJv.52), Stable Diffusion XL (SDXL) и DALL‑E 3. Вот результаты генерации по запросу “красивая девушка”:

Иллюстрация: «Сбер»

Это — “мужчина с бородой”:

Иллюстрация: «Сбер»

А это — “Барби и Кен занимаются шоппингом”:

Иллюстрация: «Сбер»

Ещё одним нововведением стали режимы Inpainting и Outpainting — возможность “вписать” новый объект в существующую картинку или дорисовать её (напоминает генеративную заливку в Photoshop). Вот пример дорисовки:

Иллюстрация: «Сбер»

А это — примеры добавления объекта.

Иллюстрация: «Сбер»

Опробовать нейросеть можно на платформе Fusion Brain, в официальном Telegram-боте или «ВКонтакте».

Kandinsky Video позволяет создавать небольшие анимации по текстовому запросу — до 8 секунд с частотой около 30 кадров в секунду и разрешением до 512 пикселей по большей стороне. Высоту и ширину может задавать пользователь.

Иллюстрация: «Сбер»

Создание видео доступно в бета-режиме на Fusion Brain, а Telegram-бот пока предлагает только записаться в список ожидания.

Обложка: «Сбер»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Это упрощённая версия страницы.

Читать полную версию
Виктор Подволоцкий
Ну конечно самые удачные генерации взяли в примеры, где не три глаза, а всего два.
Игорь Ильич
Fusion Brain с некоторых пор стал требовать регистрацию
Marina Squirrel
Скоро начнёт и денег требовать