МЫ, ИРКУТЯНЕ
Сергей ШМИДТ, Langobard
2023-10-23-01-02-54
В словаре В. Даля про словечко «ходор» сказано следующее: «ходить ходором» это «расходиться, ходить козырем, кричать, браниться, хорохориться». И пример Даль такой приводит: «Петух ходором расходился!». Получается, что судьба Михаила Борисовича Ходорковского* была прямо его фамилией обозначена.
МНЕНИЯ И СОМНЕНИЯ
Николай Яременко, доцент Финансового университета при правительстве РФ
2025-06-30-01-22-32
Чтобы защититься от дипфейков, депутаты хотят заставить маркировать весь созданный человеком контент.

Сбер выпустил новую версию нейросетевой модели ruGPT-3.5 для генерации текстов на русском языке

Автор: По инф. Телеинформа   
20.07.2023 17:40

Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B, сообщает пресс-служба банка.

Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B – самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT от английского MIT License – лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом).

ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей – NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 миллиардов параметров (ruGPT-3.5 13B) – новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели – это базовый претрейн для дальнейших экспериментов.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.

– Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому, мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами, – говорит старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка Андрей Белевцев.

По инф. Телеинформа

МНОГИХ ЗАИНТЕРЕСОВАЛО:
2025-06-06-14-46-42
«Ростелеком» запустил специальное предложение для малых и средних предприятий (МСП): в течение лета новые клиенты — владельцы бизнеса могут подключить услугу широкополосного доступа в интернет (ШПД) со скидкой 50%.
2025-06-03-22-11-43
Душить решено не только окопавшиеся в России западные сервисы, но и отечественных производителей некачественных продуктов. Размышляет Telegram-канал «Мастер пера»
2025-06-11-10-30-36
Цена на шаурму выросла на 40% за год. Причины — логистика, зарплаты и электричество. Об этом рассказала директор по закупкам сети шаурмичных Елена Ивакова в интервью 360.ru.
2025-06-06-10-35-44
Интересно наблюдать, как цифровые платформы ломают привычные схемы, а те, кто десятилетиями сидел на старых моделях бизнеса, вдруг осознают, что их роль больше не обязательна.
2025-06-11-12-07-32
На первом Глобальном цифровом форуме «Ростелеком» при поддержке Минцифры России провел сессию, посвященную развитию государственных цифровых сервисов. В мероприятии приняли участие представители министерств цифрового развития и связи из различных стран, которые обсудили опыт внедрения электронных госуслуг и перспективы их развития.

 

Полезные советы для бизнеса и не только

ПОСЛЕДНИЕ ПУБЛИКАЦИИ
2025-06-30-10-06-13
Возможно внесение в Госдуму законопроекта о снижении НДС на продукты питания до 5%. О том, на что направлен этот шаг рассказал Степан Алексеев.
2025-06-30-10-01-54
Такси дорожает, а машин становится все меньше и это не только из-за цен на топливо. Причин много: от кредитов до правил по окраске авто. Об этом рассказал автоэксперт Дмитрий Попов.
2025-06-30-01-25-05
В том, что исчезает, как признают наши министры, недолгий рост экономики, нет ничего загадочного. Как и в том, что никакого «апокалипсица» у нас за последние годы не случилось.
2025-06-30-01-22-32
Чтобы защититься от дипфейков, депутаты хотят заставить маркировать весь созданный человеком контент.
2025-06-30-01-19-59
Показатель снизился на 61%, передает ТАСС со ссылкой на информацию ДОМ.РФ.
2025-06-27-10-54-17
Ирано-израильская война закончилась — сейчас основной спор идет вокруг операции Midnight Hammer, которая якобы «обнулила» иранскую ядерную программу.
2025-06-27-12-07-04
О том, как устойчиво, безопасно и с опорой на искусственный интеллект строить будущее на отечественных решениях на встрече бизнес-сообщества «Высшая лига» в Иркутске рассказал председатель Байкальского банка Сбербанка Рушан Сахбиев. Об этом сообщает пресс-служба Сбера.

В преддверии Дня молодёжи «СберСтрахование жизни» и СберНПФ провели ежегодное исследование ценностей и финансовых привычек россиян в возрасте до 35 лет, сообщает пресс-служба Сбера.