«Сбер» представил нейросеть Kandinsky. Её можно опробовать в приложении на смартфоне

Это самая большая модель генерации изображений по текстовому описанию на русском языке.

«Сбер» официально представил нейросеть Kandinsky. Это улучшенная версия мультимодальной ruDALL-E, генерирующей картинки по описанию и представленной ещё в прошлом году.

⚡ Самое интересное и важное за день — в телеграм-канале «Лайфхакер. Новости».

Разработчики отметили, что смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями. Kandinsky умеет генерировать картинки с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения.

Изображение: Sber

Создание изображений происходит в три этапа:

  • Сначала одна нейросеть (Kandinsky) генерирует заданное число изображений по описанию.
  • Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию работы.
  • А после третья увеличивает картинки в размере.

Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.

Опробовать нейросеть Kandinsky может любой желающий. Она доступна в мобильном приложении «Салют» и на умных устройствах «Сбера» по запросу «Включи художника».

Kandinsky попросит произнести описание, а спустя несколько минут вернётся с девятью вариантами изображений. Останется лишь выбрать одно из них для увеличения размера.

Скачать в googleplayСкачать в appstore

Это упрощённая версия страницы.

Читать полную версию
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Олег Макаров
18.06.22 14:11
«опробовать может любой желающий» — некоторое преувеличение, кмк.Ну, или этот любой желающий должен сначала завести счёт в Сбере