Учёные нашли «момент озарения» в нейросетях — словно переключение от зубрёжки к пониманию смысла

Все новости — Наука и технологии

2025-07-15T17:22:00Z

«Джеймс Уэбб» обнаружил, возможно, первую чёрную дыру, рождённую без звезды

2025-07-15T16:59:24Z

В Москве появился первый сканер для авокадо

2025-07-15T16:34:06Z

Ракова: Юные москвичи займутся благоустройством мемориала на мысе Челюскин

2025-07-15T16:30:00Z

Техпрогресс Усика — нанял 10 видеоаналитиков, использует капу с датчиками, тренирует оперативную память

2025-07-15T16:17:06Z

Нейросеть Google отказалась играть в шахматы с Atari из-за страха поражения

2025-07-15T16:13:44Z

Как развиваются технологии и ИИ в Freedom Finance

2025-07-15T16:02:00Z

Стартап Amogy привлёк $80 миллионов на технологию преобразования аммиака

2025-07-15T16:00:31Z

Маск добавил в нейросеть Grok образ аниме-девушки с режимом 18+

2025-07-15T14:48:00Z

Калифорнийский стартап Auriga Space обещает запускать спутники как Uber – всего за несколько минут благодаря электромагнитному ускорителю

2025-07-15T14:39:00Z

Воробьев: важная задача — поддержать науку и создать достойные условия ученым

2025-07-15T14:28:00Z

Жителей Подмосковья пригласили на просветительский конкурс «Знание. Премия»

2025-07-15T14:22:00Z

Гравитация и тени помогли обнаружить гигантскую экзопланету Kepler-139f, которая скрывалась десятилетиями

2025-07-15T14:18:23Z

Складной iPhone и телефон из стекла: Когда ждать прорыва от Apple

2025-07-15T14:06:00Z

«Хаббл» обнаружил «космическую капсулу времени»: телескоп заглянул на 160 000 световых лет и обнаружил в шаровом скоплении NGC 1786 звёзды разных поколений

2025-07-15T14:02:15Z

Научная экспертиза РАН позволила в 2024 году сэкономить бюджету миллиарды рублей

Учёные нашли «момент озарения» в нейросетях — словно переключение от зубрёжки к пониманию смысла

2025-07-15T09:40:00Z


Сегодняшние языковые модели, такие как ChatGPT и Gemini, умеют вести беседу с поразительной беглостью — почти как человек. Но внутренние механизмы, обеспечивающие эту беглость, по-прежнему остаются во многом загадкой. Новое исследование проливает свет на то, как нейросети учатся понимать язык — и обнаруживает в этом процессе неожиданный скачок, схожий с фазовым переходом в физике.

Учёные рассмотрели упрощённую модель ключевого элемента современных языковых моделей — механизма внимания, лежащего в основе архитектуры трансформеров. Эти модели анализируют текст как последовательность символов и слов, оценивая важность каждого слова относительно других. Именно трансформеры используются в большинстве популярных ИИ — от ChatGPT до Gemini.

Оказалось, что на ранних этапах обучения нейросеть выстраивает понимание предложений на основе положения слов. Например, в английском языке порядок «подлежащее — глагол — дополнение» часто сохраняется, и нейросеть это улавливает. Но по мере накопления обучающих данных модель неожиданно меняет стратегию: она начинает опираться на смысл слов, а не их порядок.

Это переключение происходит резко и без промежуточных состояний. Исследователи описывают его как фазовый переход — в духе того, как вода при определённой температуре мгновенно превращается в пар. Ниже критического объёма данных модель полагается только на позиции, выше — исключительно на значение слов.

«Мы хотели просто изучить, какие стратегии выбирает сеть, — рассказывает Хуго Цуй, постдок из Гарварда и главный автор статьи. — Но результат оказался неожиданным: модель в один момент полностью отказывается от одной стратегии и переходит к другой».

Подобные резкие переходы хорошо известны в статистической физике, где сложные системы из миллионов частиц описываются коллективным поведением. Нейросеть — тоже система из множества взаимосвязанных узлов (нейронов), чьё «интеллектуальное» поведение возникает из взаимодействия этих элементарных компонентов. Поэтому, считают авторы, подходы из физики можно применить и к пониманию работы ИИ.

Понимание того, при каких условиях модель «переключается» между стратегиями, может в будущем помочь сделать нейросети более предсказуемыми, эффективными и безопасными.

Читайте также:

2025-06-30T11:12:28Z

Новая работа учёных раскрывает механизм цифровой предвзятости мышления

Масштабное исследование с участием 10 тысяч человек показало, что даже нейтральные поисковые запросы неосознанно искажаются нашими убеждениями, а традиционные алгоритмы только усиливают этот эффект

2025-06-28T21:01:00Z

Искусственный интеллект научился программировать сам себя: новый алгоритм Дарвина-Гёделя позволяет кодирующим агентам самосовершенствоваться

2025-07-07T11:52:00Z

Вскрыта масштабная схема манипулирования результатами рецензирования научных статей с помощью искусственного интеллекта

2025-06-28T20:35:00Z

Учёные нашли способ резко повысить шансы на инсайт

2025-07-07T15:00:00Z

Что произошло в мире науки. Вечерний дайджест

Третий потенциальный межзвездный объект, создание ощущения эмпатии с помощью эмодзи, а также возможный межвидовой альтруизм косаток