Все новости

2025-07-13T08:15:27Z

В Казахстане объяснили усиление досмотра фур на границе

2025-07-13T08:14:19Z

На Украине заявили о ликвидации подозреваемых в убийстве полковника СБУ

2025-07-13T08:14:06Z

Российским спортсменам запретили публиковать флаг страны в соцсетях

2025-07-13T08:13:09Z

Водитель иномарки погиб при опрокидывании машины в Пермском крае

2025-07-13T08:13:00Z

SuperJob: Молодежь чаще всех выступает за отказ от пластиковой посуды

2025-07-13T08:10:00Z

Новый комплекс киностудии имени Горького откроют до конца 2025 года

2025-07-13T08:08:01Z

Сколько стоит содержать домашнего питомца в Москве

2025-07-13T08:08:00Z

В Подмосковье задержали мигранта, пырнувшего ножом мужчину в ходе конфликта

2025-07-13T08:07:38Z

Москвичам пообещали идеальное "бархатное" лето на выходных

2025-07-13T08:06:45Z

МЧС доставило в Курскую область 50 тонн мясных консервов

2025-07-13T08:03:02Z

Лавров: Россия будет действовать по направлениям, в которых заинтересована КНДР

2025-07-13T08:02:52Z

«Можете кидаться помидорами»: Боня рассказала, как худела на самом деле

2025-07-13T08:01:22Z

«Как только, так сразу»: Бородина рассказала о будущем ребёнке от Сердюкова

2025-07-13T08:01:00Z

В лесах Башкирии потерялись три человека

2025-07-13T08:00:24Z

Михаил Мишустин поздравил работников российской почты с профессиональным праздником

Зачем стране свои большие языковые модели и как устроены отечественные конкуренты ChatGPT

2025-07-01T04:15:00Z — Елена Тутубалина — о возможностях и вызовах развития российских нейросетей

В июне 2025 года председатель правительства России Михаил Мишустин провел в Сарове совещание по вопросам высокопроизводительных вычислений, искусственного интеллекта (ИИ) и обработки больших данных. Он подчеркнул, что развитие отечественных нейросетевых технологий, суперкомпьютеров и собственных компонентов — одно из ключевых условий достижения технологического суверенитета страны.

А на каком этапе сейчас в РФ находится этот процесс и чего ждать?

ИИ как элемент технологической независимости

В последние годы тема ИИ стала одной из центральных в мировой повестке. Особенно активно развивается направление больших языковых моделей (LLM), на которых основаны такие решения, как ChatGPT от OpenAI, Gemini от Google, Claude от Anthropic или DeepSeek от High-Flyer. Эти системы умеют анализировать текст, отвечать на вопросы, писать статьи и программный код, вести диалог с человеком на естественном языке. Появление подобных технологий существенно меняет самые разные сферы — от образования до государственного управления. А также оно повышает производительность труда, что критически важно с учетом дефицита кадров, который к 2030 году может увеличиться до 2 млн человек.

Россия, как и ряд других стран, делает ставку на развитие собственных языковых моделей. Вопрос здесь не только в научных амбициях или экономических выгодах, но и в обеспечении технологического суверенитета. Теме уделяется внимание на самом высоком уровне. Например, в декабре 2024 года президент России Владимир Путин принял участие в Международной конференции AI Journey, посвященной искусственному интеллекту.

Развитие собственных решений важно в том числе потому, что зависимость от зарубежных продуктов, особенно в стратегически чувствительных сферах, несет в себе риски — как с точки зрения кибербезопасности, так и в аспектах контроля над данными и доступности сервисов с учетом международной обстановки.

Поэтому сегодня в России одновременно развиваются сразу несколько проектов в области больших языковых моделей. Среди них выделяются GigaChat от Сбера, YandexGPT от Яндекса, а также Gen-T от Т-Банка и Cotype от МТС. Они различаются подходами к обучению и степенью самостоятельности разработки.

Собственные и адаптированные модели

Наиболее комплексный подход к разработке ИИ демонстрирует GigaChat от Сбера — эта модель полностью обучена внутри страны с нуля. Такой путь наиболее затратен: он требует масштабных вычислительных ресурсов, больших обучающих выборок на русском языке, сложных экспериментов по оптимизации архитектуры. Впрочем, именно подобный подход позволяет полнее учитывать специфику языка и национального контекста, что особенно важно при работе с официальными документами, юридическими и техническими текстами, а также при взаимодействии с государственными и корпоративными системами.

Часть других российских моделей базируется на глубокой адаптации уже существующих зарубежных разработок. Например, YandexGPT строится на основе китайской Qwen2.5 от Alibaba Group, но в процессе дообучения и модификации разработчики "Яндекса" переработали большую часть начальных параметров модели и наполнили ее обширными русскоязычными датасетами. Такой подход позволяет существенно сократить затраты на обучение, но требует глубокой экспертизы по интеграции и доработке исходных моделей под нужды русского языка и российских пользователей.

Сложнее всего адаптировать модели, если исходный датасет был преимущественно не русскоязычным. Здесь появляется риск ошибок из-за искажения смыслов ввиду "мировозрения" моделей — изложенные точки зрения на одни и те же события от российских, китайских и западных авторов могут различаться, что влияет на ход "рассуждения" нейросетей, — или недостаточной точности в узких профессиональных областях.

Именно поэтому участие в сборе и разметке собственных данных остается ключевым элементом развития российских LLM. В стране существует активное сообщество специалистов по обработке естественного языка (NLP), которое формирует качественные датасеты — такие как Saiga или GrandMaster Pro Max — с учетом национальной специфики.

Преимущества и ограничения

Если говорить о качественных показателях, то на русском языке отечественные модели демонстрируют результаты, сопоставимые с зарубежными системами. Особенно заметен прогресс в области технических и юридических текстов, где национальные модели обладают более релевантными знаниями. Также российские LLM лучше справляются с малыми языками народов России, что имеет значение при работе с локальными образовательными и административными системами.

Пока сохраняется тенденция, согласно которой стоимость использования отечественных LLM может быть выше, чем зарубежных аналогов. Это обстоятельство становится критичным при масштабировании решений, связанных с использованием больших языковых моделей — например, в системах клиентской поддержки, разработке чат-ботов или генерации значительного объема корпоративного текста. Вместе с тем применение зарубежных моделей несет ряд существенных рисков: утечка конфиденциальных данных, возможные технические сбои и зависимость от внешних факторов, таких как санкции или ограничения доступа. Поэтому компании, работающие в сфере финансов, промышленности или государственного управления, выбирают исключительно отечественные решения.

Проблему высокой стоимости российские разработчики пытаются решать через оптимизацию инфраструктуры и совершенствование моделей. Появляются облегченные версии LLM, которые быстрее работают и требуют меньше вычислительных ресурсов. Кроме того, важную роль играет интеграция: российские модели уже активно применяются внутри собственных экосистем. Так, GigaChat встроен в мобильные приложения и умные устройства Сбера, YandexGPT работает в Яндекс.Браузере, ТВ-приставках и умных колонках, а Gen-T используется в сервисах Т-Банка для автоматизации обработки документов и написания программного кода.

Экспортный потенциал

Отдельным направлением остается вопрос экспорта российских языковых моделей. Здесь перспективными считаются страны СНГ и постсоветского пространства, где востребованы решения, обученные на языках с ограниченными цифровыми ресурсами — казахском, узбекском и других.

Также российские LLM проходят тестирование на арабском и азиатских языках. Участие российских специалистов в международных коллаборациях — например, в проектах вроде Mistral Saba — показывает, что отечественная экспертиза в обработке языка востребована в мире.

Что нужно индустрии

Развитие больших языковых моделей — это сложный научно-технический процесс. Он требует вычислительных мощностей, современной облачной инфраструктуры и доступа к графическим процессорам (GPU). Критическую роль играют и подготовленные кадры: без сильных команд по машинному обучению, лингвистике, анализу данных невозможно создавать конкурентоспособные LLM, и в течение последних лет можно наблюдать активный рост количества профильных образовательных программ и инициатив в этом направлении.

Большое значение для дальнейшего развития отрасли имеют государственно-частные партнерства, участие вузов и исследовательских институтов, консолидация усилий бизнеса и науки. Сочетание экспертизы, ресурсов и образовательных программ позволит российской индустрии больших языковых моделей сохранять темп и расширять применение как внутри страны, так и на внешних рынках.

Отечественные компании продолжают уверенно осваивать рынок LLM. Учитывая потребность в собственных решениях для работы с языком, данными и знаниями, развитие российских нейросетевых моделей становится не только научной задачей, но и частью долгосрочной стратегии технологического суверенитета страны.

Источник:

ТАСС — Зачем стране свои большие языковые модели и как устроены отечественные конкуренты ChatGPT

Все новости

Зачем стране свои большие языковые модели и как устроены отечественные конкуренты ChatGPT

ИИ как элемент технологической независимости

Собственные и адаптированные модели

Преимущества и ограничения

Экспортный потенциал

Что нужно индустрии

Читайте также:

Жених не айти: россиянки рассказали, представителей каких профессий предпочитают в мужья

«Концепция законопроекта о языках народов России вызвала напряжение»

Эксперт Макаров: БРИКС стремится первым создать институты в новых сферах

«У России свой юмор». Как абсурдный мем с российским блогером озадачил весь мир?

Курсы событий: что ожидает рубль из-за новых пошлин Трампа