«Сбер» анонсировал крупное обновление нейросети Kandinsky, которая генерирует картинки по текстовому описанию.
Нейросеть умеет изменять существующие картинки по запросу, объединять несколько изображений, дорисовывать фрагменты, создавать изображения в том же стиле, что предложил пользователь, и не только. Она понимает запросы на 101 языке, включая русский и английский.
В версии 2.1 нейросеть получила дополнительное обучение (на 170 миллионах пар текст-изображение и отдельной подборке из 2 миллионов картинок). Заодно улучшили модель кодировки, благодаря чему нейросети стали лучше даваться картинки в высоком разрешении, а также лица и другие сложные объекты.
Нейросеть доступна на сайте и виде Telegram-бота, также её можно активировать на умных устройствах «Сбера» командой «Запусти художника».