МЫ, ИРКУТЯНЕ
Сергей ШМИДТ, Langobard
2023-10-23-01-02-54
В словаре В. Даля про словечко «ходор» сказано следующее: «ходить ходором» это «расходиться, ходить козырем, кричать, браниться, хорохориться». И пример Даль такой приводит: «Петух ходором расходился!». Получается, что судьба Михаила Борисовича Ходорковского* была прямо его фамилией обозначена.
МНЕНИЯ И СОМНЕНИЯ
Кирилл Шулика, Rosbalt.ru
2025-05-05-10-00-05
Президент России Владимир Путин по просьбе ветеранов и участников СВО, которую передал ему губернатор Волгоградской области Андрей Бочаров, подписал указ о присвоении аэропорту Волгограда исторического названия «Сталинград». Однако если в Северной столице вышло, как в песне, которую исполняли Борис Моисеев и Людмила Гурченко: «Я уехал в Петербург, а приехал в Ленинград», то в данном случае, согласно указу президента, «присвоенное международному аэропорту Волгоград историческое наименование не является составной частью установленного наименования этого географического объекта» и «не влечет за собой изменение установленного наименования этого географического объекта».

Сбер выпустил новую версию нейросетевой модели ruGPT-3.5 для генерации текстов на русском языке

Автор: По инф. Телеинформа   
20.07.2023 17:40

Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B, сообщает пресс-служба банка.

Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B – самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT от английского MIT License – лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом).

ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей – NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 миллиардов параметров (ruGPT-3.5 13B) – новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели – это базовый претрейн для дальнейших экспериментов.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.

– Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому, мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами, – говорит старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка Андрей Белевцев.

По инф. Телеинформа

МНОГИХ ЗАИНТЕРЕСОВАЛО:
2025-04-07-10-02-54
На прилавках магазинов в России в ближайшем будущем могут появиться продукты питания из белка насекомых.
2025-04-08-00-45-15
Российские магазины должны соблюдать требования законодательства при осуществлении хозяйственной деятельности и не повышать цены на яйца перед Пасхой. С таким предупреждением выступила Федеральная антимонопольная служба, текст распространила пресс-служба ведомства.
2025-04-07-00-26-42
В России продолжают падать продажи новых автомобилей. Одним из последствий станет повышение спроса на подержанные машины.
2025-04-18-10-15-16
В России могут подорожать лимоны. В чем причина, рассказал профессор, сотрудник кафедры торговой политики РЭУ им. Г. В. Плеханова Вячеслав Чеглов.
2025-04-11-00-56-53
Более 210 автосалонов китайских автомобильных марок закрылись в России с января по март 2025 года из-за снижения интереса со стороны инвесторов.

 

скандалы - деловые и политические

ПОСЛЕДНИЕ ПУБЛИКАЦИИ
2025-05-06-00-12-34
У жительницы Великобритании Джессики Збинден-Вебстер диагностировали опасное заболевание — рак кожи.
2025-05-06-00-09-53
После апрельской встречи совета директоров Центробанка России пять ведущих российских банков, входящих в двадцатку крупнейших по объему вкладов физических лиц, скорректировали процентные ставки по своим депозитным продуктам.
2025-05-06-00-08-01
Россиян может охватить массовое снятие денег со вкладов. О возможных причинах рассказал банковский брокер Георгий Гогитидзе
2025-05-05-14-55-52
В Иркутске компания «Ростелеком» провела бизнес-завтрак, на котором собрались представители региональных операторов связи. Встреча прошла в формате открытой дискуссии и была посвящена обсуждению актуальных вопросов развития телекоммуникационной отрасли.
2025-05-05-10-02-58
Мировые рынки лихорадит, рубль теряет устойчивость, а бюджет России под давлением. Все больше факторов указывает на приближение девальвации. Что это значит для обычных потребителей,  рассказал член наблюдательного совета Гильдии финансовых аналитиков и риск-менеджеров Александр Разуваев.
2025-05-05-10-00-05
Президент России Владимир Путин по просьбе ветеранов и участников СВО, которую передал ему губернатор Волгоградской области Андрей Бочаров, подписал указ о присвоении аэропорту Волгограда исторического названия «Сталинград». Однако если в Северной столице вышло, как в песне, которую исполняли Борис Моисеев и Людмила Гурченко: «Я уехал в Петербург, а приехал в Ленинград», то в данном случае, согласно указу президента, «присвоенное международному аэропорту Волгоград историческое наименование не является составной частью установленного наименования этого географического объекта» и «не влечет за собой изменение установленного наименования этого географического объекта».
2025-05-05-09-15-37
В год 80-летия Победы в Великой Отечественной войне на АО «Труд» организовали и свой «Бессмертный полк». Сотрудники предприятия прислали 26 историй дедов и прадедов на вахту памяти, сообщает пресс-служба компании.
2025-05-04-23-57-00
В Минпросвещения готовят список «правильных» кукол, машинок и «развивашек».
БайкалИНФОРМ - Объявления в Иркутске