VK опубликовала нейросеть для обработки разговорного русского языка

Все новости — Наука и технологии

2025-07-26T12:56:33Z

ООН одобрила резолюцию об искусственном интеллекте по инициативе Таджикистана

2025-07-26T12:48:47Z

СМИ: Японские ученые впервые удалили лишнюю хромосому у людей с синдромом Дауна

2025-07-26T12:05:12Z

Премьер госсовета КНР Цян призвал создать международную организацию в области ИИ

2025-07-26T11:55:34Z

Космонавт рассказал о мозге и сердце российского сегмента МКС

2025-07-26T11:42:58Z

«Крёстный отец ИИ» призвал помешать нейросетям сгубить человечество

2025-07-26T10:51:09Z

Минпросвещения: платформа "Сферум" интегрируется в национальный мессенджер МАХ

2025-07-26T10:51:00Z

20-ядерный процессор Nvidia N1x для настольных ПК протестировали в бенчмарке: ядер CUDA больше, чем у GeForce RTX 5070 Ti, а графическая производительность — на уровне GeForce RTX 2050 Laptop

2025-07-26T10:07:00Z

У китайцев появилась по-настоящему современная и производительная видеокарта собственной разработки. Lisuan Tech 7G106 справляется с Black Myth: Wukong

2025-07-26T08:58:00Z

Мошенники обманули профессора МГУ, открывшего более 20 минералов

2025-07-26T08:02:34Z

Суперкомпьютер предсказал тревожное будущее Земли

2025-07-26T08:00:34Z

Почему человек не помнит первые годы своей жизни

2025-07-26T07:10:00Z

Учёные находят в пещере Кентукки останки неизвестной акулы

2025-07-26T06:59:26Z

Крестный отец ИИ призвал предотвратить уничтожение человечества машинами

2025-07-26T06:57:00Z

Китай предложил создать глобальную организацию по сотрудничеству в сфере ИИ

2025-07-26T06:49:00Z

Grok обновился по-крупному: теперь чат-бот сам решает, сколько времени он будет думать над вашим вопросом

VK опубликовала нейросеть для обработки разговорного русского языка

2025-07-24T08:13:00Z


Компания VK (бывшая Mail.ru Group) выложила в открытый доступ модель RuModernBERT для обработки естественного русского языка. Как отмечают разработчики, она понимает длинные тексты целиком, без разбиения на фрагменты и работает локально, без внешних API, что снижает нагрузку на инфраструктуру.

В VK рассказали:

Инженеры могут использовать ее для задач в области обработки текста, в том числе для извлечения информации, анализа тональности, поиска и ранжирования в приложениях и сервисах. Модель может понять сложный или длинный запрос пользователя, например, в поисковой строке и найдет наиболее релевантную информацию, видео, товары или документы.

RuModernBERT была обучена на 2 триллионах токенов данных на русском, английском языках и коде с максимальной длиной контекста до 8,192 токенов. Для всех этапов обучения были использованы разные источники данных, в том числе книги, статьи, посты и комментарии в социальных сетях, что позволяет адаптировать ее для работы с современным текстом и учитывать разговорную речь.

RuModernBERT доступна в нескольких версиях: на 150 миллионов параметров и облегченная модель на 35 миллионов параметров. Также обновлены две дополнительные версии модели: USER и USER2. Они помогают инженерам лучше группировать и находить похожую информацию. В версии USER2 есть специальная технология, которая позволяет сократить объем данных почти без потери точности. Найти все версии модели можно на Hugging Face.

Читайте также:

2025-07-24T18:23:00Z

VK выложила в открытый доступ нейросеть для анализа разговорной речи

VK выложила в открытый доступ нейросеть RuModernBERT для анализа разговорного русского языка. Об этом 24 июля сообщила пресс-служба компании. Новая разработка способна анализировать длинные запросы целиком без разделения на части и работает автономно без подключения к внешним сервисам, что уменьшает...

2025-07-22T11:28:43Z

В России стала доступна модель распознавания речи на русском языке

2025-06-28T06:50:00Z

Большинство текстов от нейросетей проходят проверку на уникальность

Исследователи из МГУ им. Ломоносова проанализировали сгенерированные чат-ботами тексты и установили, что в 80% случаев тексты ИИ проходят проверку на уникальность. Результат составляет 75% и выше. Об этом сообщает ТАСС со ссылкой на пресс-службу вуза. В рамках исследования четыре популярных сервиса должны были дать ответы на письменные задания из пособий по изучению английского языка. Ответы… Сообщение МГУ: проверку на уникальность проходят 80% сгенерированных текстов появились сначала на Общественная служба новостей.

2025-07-17T09:04:00Z

В сервисах Mail обновили нейросети

2025-06-30T16:20:36Z

VK представила ИИ-редактор рекламных текстов

В сервисе «VK Реклама» появился ИИ-редактор рекламных текстов, который указывает рекламодателям на грамматические ошибки и несоответствие правилам модерации, а также подсказывает, как их исправить, сохранив смысл сообщения. Об этом 30 июня сообщила пресс-служба VK. ИИ-редактор подсвечивает найденные...