«Сбер» добавил в нейросеть Kandinsky аналог генеративной заливки из Photoshop

Можно дорисовать картинку или добавить в кадр новый объект. А ещё Чебурашки больше не похожи на монстров из-под кровати.

«Сбер» представил большое обновление генеративной нейросети Kandinsky. С обновлением до Kandinsky 3.0 значительно улучшилась генерация иллюстраций, а новая Kandinsky Video первой из российских нейросетей способна создавать видеоролики.

⚡ Самое интересное и важное за день — в телеграм-канале «Лайфхакер. Новости».

Начнём с Kandinsky 3.0. Главным нововведением по сравнению с версией 2.2 стало улучшенное распознавание запросов: генерация теперь точнее соответствует промпту без ущерба качеству. Кроме того, кратно увеличилось качество понимание запросов на тему отечественного культурного кода - героев советских и российских фильмов и мультиков. Разницу наглядно показали на запросах с Чебурашкой и домовёнком Кузей:

Слева результаты генерации с Kandinsky 3.0, справа - с Kandinsky 2.2. Иллюстрации: «Сбер»

Также показали сравнение со старыми версиями Kandinsky и другими популярными моделями - Midjourney (подписана как MJv.52), Stable Diffusion XL (SDXL) и DALL-E 3. Вот результаты генерации по запросу "красивая девушка":

Иллюстрация: «Сбер»

Это - "мужчина с бородой":

Иллюстрация: «Сбер»

А это - "Барби и Кен занимаются шоппингом":

Иллюстрация: «Сбер»

Ещё одним нововведением стали режимы Inpainting и Outpainting - возможность "вписать" новый объект в существующую картинку или дорисовать её (напоминает генеративную заливку в Photoshop). Вот пример дорисовки:

Иллюстрация: «Сбер»

А это - примеры добавления объекта.

Иллюстрация: «Сбер»

Опробовать нейросеть можно на платформе Fusion Brain, в официальном Telegram-боте или «ВКонтакте».

Kandinsky Video позволяет создавать небольшие анимации по текстовому запросу - до 8 секунд с частотой около 30 кадров в секунду и разрешением до 512 пикселей по большей стороне. Высоту и ширину может задавать пользователь.

Иллюстрация: «Сбер»

Создание видео доступно в бета-режиме на Fusion Brain, а Telegram-бот пока предлагает только записаться в список ожидания.

Это упрощённая версия страницы.

Читать полную версию
Обложка: «Сбер»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Виктор Подволоцкий
22.11.23 18:10
Ну конечно самые удачные генерации взяли в примеры, где не три глаза, а всего два.
Игорь Ильич
22.11.23 21:03
Fusion Brain с некоторых пор стал требовать регистрацию
Marina Squirrel
29.11.23 20:49
Скоро начнёт и денег требовать