«Сбер» представил нейросеть Kandinsky. Её можно опробовать в приложении на смартфоне

Это самая большая модель генерации изображений по текстовому описанию на русском языке.

«Сбер» официально представил нейросеть Kandinsky. Это улучшенная версия мультимодальной ruDALL‑E, генерирующей картинки по описанию и представленной ещё в прошлом году.

⚡️Новости из мира гаджетов, обзоры, гайды и не только — в телеграм-канале «Технологии | Лайфхакер».

Разработчики отметили, что смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями. Kandinsky умеет генерировать картинки с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения.

Изображение: Sber

Создание изображений происходит в три этапа:

  • Сначала одна нейросеть (Kandinsky) генерирует заданное число изображений по описанию.
  • Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию работы.
  • А после третья увеличивает картинки в размере.

Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.

Опробовать нейросеть Kandinsky может любой желающий. Она доступна в мобильном приложении «Салют» и на умных устройствах «Сбера» по запросу «Включи художника».

Kandinsky попросит произнести описание, а спустя несколько минут вернётся с девятью вариантами изображений. Останется лишь выбрать одно из них для увеличения размера.

Салют! Умные устройства
Цена: Бесплатно
Приложение не найдено
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Это упрощённая версия страницы.

Читать полную версию
Олег Макаров
18.06.22 14:11
«опробовать может любой желающий» — некоторое преувеличение, кмк.Ну, или этот любой желающий должен сначала завести счёт в Сбере
Valery Chernov
08.10.25 11:14
Интересно посмотреть, как с 2022-го до сегодня развилась идея. Тогда Kandinsky воспринимался как эксперимент, сейчас — уже полностью рабочий инструмент с нормальной поддержкой русского языка и надписей.