Обновленная версия нейросети Сбера Kandinsky 2.1 находится в открытом доступе |
Автор: По инф. Телеинформа |
05.04.2023 10:00 |
Новая генеративная модель Сбера Kandinsky 2.1 способна всего за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке, сообщает пресс-служба Сбербанка. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях. Фото: пресс-служба Сбербанка Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices. Новая модель Kandinsky 2.1 унаследовала веса предыдущей версии, обученной на одном миллиарде пар «текст – изображение», и была дополнительно обучена на 170 миллионов пар «текст – изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из двух миллионов пар качественных изображений. В этот сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. Нейросеть также была усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 миллиарда параметров вместо двух миллиардов в Kandinsky 2.0. Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подаёт его на вход основной генеративной модели. Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере её можно использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов. – Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это ещё один важный шаг к AGI – сильному искусственному интеллекту. Думаю, у каждого найдётся задача для Kandinsky 2.1, и поэтому улучшенная модель, как и её предыдущая версия, находится в открытом доступе: протестировать её может любой желающий, причём бесплатно, – говорит первый заместитель председателя правления Сбербанка Александр Ведяхин. СПРАВКА:
МНОГИХ ЗАИНТЕРЕСОВАЛО: В России потребители начали чаще покупать товары собственных торговых марок (СТМ). В прошлом году 98,7% россиян брали такую продукцию в сетевых магазинах и супермаркетах, говорится в совместном исследовании «Ромира» и FixPrice. При этом показатель в Санкт-Петербурге и Москве достиг 100%, то есть все опрошенные брали товары СТМ. Энергетико-металлургический холдинг Эн+ (MOEX: ENPG; LSE: ENPL), один из мировых лидеров в производстве низкоуглеродного алюминия и возобновляемой энергии, в 14-й раз организовал волонтёрскую акцию «360». С начала мая более 5 тысяч участников из разных уголков России, от Нижнего Новгорода до Забайкалья, собрали свыше 186 тонн мусора. РУСАЛ, один из крупнейших в мире производителей алюминия, объявляет о новых кадровых назначениях. Евгений Зенкин, с 2015 года занимавший должность Управляющего директора Публичного Акционерного Общества «РУСАЛ Братский алюминиевый завод» (ПАО «РУСАЛ Братск»), с 18 ноября 2024 года займет должность Директора по связям с государственными органами и специальным проектам РУСАЛа в Иркутской области. |