Новая #нейронка способна всего за несколько секунд
создавать высококачественные изображения по текстовому описанию, а также менять их, смешивать и дорисовывать недостающие части. Приятный бонус — поддержка русского языка.
#Kandinsky 2.1 — новая генеративная модель
#Сбера. Работает так же, как и многие современные популярные ИИ-генераторы изображений вроде
#Midjourney и
#Stable Diffusion. Модель умеет рисовать в разных стилях и понимает запросы на 101 языке, в том числе на русском и английском.
Что может Kandinsky 2.1
Создавать картинки по текстовому описанию;
Смешивать несколько рисунков;
Менять рисунки по текстовому описанию;
Генерировать изображения, похожие на заданное;
Дорисовывать недостающие части картинки;
Формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices. В отличие от предыдущей версии, Kandinsky 2.1 обучалась на большем количестве картинок. Среди них были и традиционно сложные для нейросетей варианты. К ним относятся арты с текстом и лицами людей. Впрочем, проблемы с ними еще есть:
Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере ее получится использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов.
Думаю, у каждого найдется задача для Kandinsky 2.1, и поэтому улучшенная модель, как и ее предыдущая версия, находится в открытом доступе: протестировать ее может любой желающий, причем бесплатно.