2025-07-13T08:15:27Z
В Казахстане объяснили усиление досмотра фур на границе
2025-07-13T08:14:19Z
На Украине заявили о ликвидации подозреваемых в убийстве полковника СБУ
2025-07-13T08:14:06Z
Российским спортсменам запретили публиковать флаг страны в соцсетях
2025-07-13T08:13:09Z
Водитель иномарки погиб при опрокидывании машины в Пермском крае
2025-07-13T08:13:00Z
SuperJob: Молодежь чаще всех выступает за отказ от пластиковой посуды
2025-07-13T08:10:00Z
Новый комплекс киностудии имени Горького откроют до конца 2025 года
2025-07-13T08:08:01Z
Сколько стоит содержать домашнего питомца в Москве
2025-07-13T08:08:00Z
В Подмосковье задержали мигранта, пырнувшего ножом мужчину в ходе конфликта
2025-07-13T08:07:38Z
Москвичам пообещали идеальное "бархатное" лето на выходных
2025-07-13T08:06:45Z
МЧС доставило в Курскую область 50 тонн мясных консервов
2025-07-13T08:03:02Z
Лавров: Россия будет действовать по направлениям, в которых заинтересована КНДР
2025-07-13T08:02:52Z
«Можете кидаться помидорами»: Боня рассказала, как худела на самом деле
2025-07-13T08:01:22Z
«Как только, так сразу»: Бородина рассказала о будущем ребёнке от Сердюкова
2025-07-13T08:01:00Z
В лесах Башкирии потерялись три человека
2025-07-13T08:00:24Z
Михаил Мишустин поздравил работников российской почты с профессиональным праздником
2025-07-01T04:15:00Z — Елена Тутубалина — о возможностях и вызовах развития российских нейросетей
В июне 2025 года председатель правительства России Михаил Мишустин провел в Сарове совещание по вопросам высокопроизводительных вычислений, искусственного интеллекта (ИИ) и обработки больших данных. Он подчеркнул, что развитие отечественных нейросетевых технологий, суперкомпьютеров и собственных компонентов — одно из ключевых условий достижения технологического суверенитета страны.
А на каком этапе сейчас в РФ находится этот процесс и чего ждать?
В последние годы тема ИИ стала одной из центральных в мировой повестке. Особенно активно развивается направление больших языковых моделей (LLM), на которых основаны такие решения, как ChatGPT от OpenAI, Gemini от Google, Claude от Anthropic или DeepSeek от High-Flyer. Эти системы умеют анализировать текст, отвечать на вопросы, писать статьи и программный код, вести диалог с человеком на естественном языке. Появление подобных технологий существенно меняет самые разные сферы — от образования до государственного управления. А также оно повышает производительность труда, что критически важно с учетом дефицита кадров, который к 2030 году может увеличиться до 2 млн человек.
Россия, как и ряд других стран, делает ставку на развитие собственных языковых моделей. Вопрос здесь не только в научных амбициях или экономических выгодах, но и в обеспечении технологического суверенитета. Теме уделяется внимание на самом высоком уровне. Например, в декабре 2024 года президент России Владимир Путин принял участие в Международной конференции AI Journey, посвященной искусственному интеллекту.
Развитие собственных решений важно в том числе потому, что зависимость от зарубежных продуктов, особенно в стратегически чувствительных сферах, несет в себе риски — как с точки зрения кибербезопасности, так и в аспектах контроля над данными и доступности сервисов с учетом международной обстановки.
Поэтому сегодня в России одновременно развиваются сразу несколько проектов в области больших языковых моделей. Среди них выделяются GigaChat от Сбера, YandexGPT от Яндекса, а также Gen-T от Т-Банка и Cotype от МТС. Они различаются подходами к обучению и степенью самостоятельности разработки.
Наиболее комплексный подход к разработке ИИ демонстрирует GigaChat от Сбера — эта модель полностью обучена внутри страны с нуля. Такой путь наиболее затратен: он требует масштабных вычислительных ресурсов, больших обучающих выборок на русском языке, сложных экспериментов по оптимизации архитектуры. Впрочем, именно подобный подход позволяет полнее учитывать специфику языка и национального контекста, что особенно важно при работе с официальными документами, юридическими и техническими текстами, а также при взаимодействии с государственными и корпоративными системами.
Часть других российских моделей базируется на глубокой адаптации уже существующих зарубежных разработок. Например, YandexGPT строится на основе китайской Qwen2.5 от Alibaba Group, но в процессе дообучения и модификации разработчики "Яндекса" переработали большую часть начальных параметров модели и наполнили ее обширными русскоязычными датасетами. Такой подход позволяет существенно сократить затраты на обучение, но требует глубокой экспертизы по интеграции и доработке исходных моделей под нужды русского языка и российских пользователей.
Сложнее всего адаптировать модели, если исходный датасет был преимущественно не русскоязычным. Здесь появляется риск ошибок из-за искажения смыслов ввиду "мировозрения" моделей — изложенные точки зрения на одни и те же события от российских, китайских и западных авторов могут различаться, что влияет на ход "рассуждения" нейросетей, — или недостаточной точности в узких профессиональных областях.
Именно поэтому участие в сборе и разметке собственных данных остается ключевым элементом развития российских LLM. В стране существует активное сообщество специалистов по обработке естественного языка (NLP), которое формирует качественные датасеты — такие как Saiga или GrandMaster Pro Max — с учетом национальной специфики.
Если говорить о качественных показателях, то на русском языке отечественные модели демонстрируют результаты, сопоставимые с зарубежными системами. Особенно заметен прогресс в области технических и юридических текстов, где национальные модели обладают более релевантными знаниями. Также российские LLM лучше справляются с малыми языками народов России, что имеет значение при работе с локальными образовательными и административными системами.
Пока сохраняется тенденция, согласно которой стоимость использования отечественных LLM может быть выше, чем зарубежных аналогов. Это обстоятельство становится критичным при масштабировании решений, связанных с использованием больших языковых моделей — например, в системах клиентской поддержки, разработке чат-ботов или генерации значительного объема корпоративного текста. Вместе с тем применение зарубежных моделей несет ряд существенных рисков: утечка конфиденциальных данных, возможные технические сбои и зависимость от внешних факторов, таких как санкции или ограничения доступа. Поэтому компании, работающие в сфере финансов, промышленности или государственного управления, выбирают исключительно отечественные решения.
Проблему высокой стоимости российские разработчики пытаются решать через оптимизацию инфраструктуры и совершенствование моделей. Появляются облегченные версии LLM, которые быстрее работают и требуют меньше вычислительных ресурсов. Кроме того, важную роль играет интеграция: российские модели уже активно применяются внутри собственных экосистем. Так, GigaChat встроен в мобильные приложения и умные устройства Сбера, YandexGPT работает в Яндекс.Браузере, ТВ-приставках и умных колонках, а Gen-T используется в сервисах Т-Банка для автоматизации обработки документов и написания программного кода.
Отдельным направлением остается вопрос экспорта российских языковых моделей. Здесь перспективными считаются страны СНГ и постсоветского пространства, где востребованы решения, обученные на языках с ограниченными цифровыми ресурсами — казахском, узбекском и других.
Также российские LLM проходят тестирование на арабском и азиатских языках. Участие российских специалистов в международных коллаборациях — например, в проектах вроде Mistral Saba — показывает, что отечественная экспертиза в обработке языка востребована в мире.
Развитие больших языковых моделей — это сложный научно-технический процесс. Он требует вычислительных мощностей, современной облачной инфраструктуры и доступа к графическим процессорам (GPU). Критическую роль играют и подготовленные кадры: без сильных команд по машинному обучению, лингвистике, анализу данных невозможно создавать конкурентоспособные LLM, и в течение последних лет можно наблюдать активный рост количества профильных образовательных программ и инициатив в этом направлении.
Большое значение для дальнейшего развития отрасли имеют государственно-частные партнерства, участие вузов и исследовательских институтов, консолидация усилий бизнеса и науки. Сочетание экспертизы, ресурсов и образовательных программ позволит российской индустрии больших языковых моделей сохранять темп и расширять применение как внутри страны, так и на внешних рынках.
Отечественные компании продолжают уверенно осваивать рынок LLM. Учитывая потребность в собственных решениях для работы с языком, данными и знаниями, развитие российских нейросетевых моделей становится не только научной задачей, но и частью долгосрочной стратегии технологического суверенитета страны.
Источник:
2025-07-12T21:02:00Z
Врачи и бизнесмены сместили компьютерных гениев с пьедестала
2025-06-26T04:25:00Z
Глава ФАДН рассказал в Госдуме, кто и как пытается «разогреть» в стране национальный вопрос
2025-07-08T19:17:45Z
Заведующий научно-учебной лабораторией экономики изменения климата НИУ ВШЭ привел в пример ИИ
2025-07-10T21:01:14Z
2025-07-08T21:01:00Z
Почему администрация США снова отложила введение мер и как это отразится на валютном рынке