2025-08-03T23:02:00Z
АМАЛКО: в следующем году на рынке труда будут востребованы IT-специалисты
2025-08-03T22:20:00Z
В России создали первый в мире тренажер антидронового ружья
2025-08-03T21:00:00Z
Ученые рассказали, когда искусственный интеллект станет умнее человека
2025-08-03T21:00:00Z
Иностранных редакторов в России станет больше
2025-08-03T18:28:53Z
В России проверяют новую технологию утилизации радиоактивных отходов
2025-08-03T18:01:31Z
Немецкие учёные бросили вызов Маску, придумав топливо из азота для ракет будущего
2025-08-03T17:13:48Z
AP: Китай собирается сбивать спутники Маска с помощью подводных лодок-невидимок
2025-08-03T17:13:00Z
Учёные назвали самую полезную рыбу: не тунец и не палтус, а та, что в два раза питательнее лосося
2025-08-03T15:52:43Z
Ученые в Германии создали самую энергоемкую молекулу для ракет будущего
2025-08-03T15:49:00Z
Представлена крутая камера наружного наблюдения Xiaomi Smart Outdoor Camera 4 Pro Triple Camera Zoom Edition: три 5-мегапиксельных сенсора, 9-кратный зум и цена всего 62 доллара
2025-08-03T15:26:21Z
Anthropic: исследования показали, что ИИ способен на шантаж пользователя
2025-08-03T13:50:00Z
Картофель не так-то прост, ученые раскрыли его происхождение
2025-08-03T13:40:13Z
WSJ: инженер ИИ отказался работать на Цукерберга за $1,5 млрд
2025-08-03T13:29:34Z
Пензенских инженеров приглашают к участию во всероссийском конкурсе
2025-08-03T12:22:00Z
Хотя бы в этом Samsung превзойдет MediaTek и Qualcomm: анонсирована Exynos 2600 — первая 2-нанометровая однокристальная система
2025-08-03T15:26:21Z — Anthropic: исследования показали, что ИИ способен на шантаж пользователя
Исследования показали, что искусственный интеллект способен на шантаж пользователя, сказано на официальном сайте американской технологической компании в сфере ИИ Anthropic. По словам экспертов, в одном из экспериментов подавляющее большинство протестированных ими моделей продемонстрировали хотя бы некоторую склонность к запугиванию или угрозам разоблачения.
Приведенная демонстрация использования компьютера показала, что Claude может попытаться шантажировать, если ему предложить смоделированный сценарий, включающий в себя как угрозу его дальнейшей работе, так и явный конфликт с его целями, — сказано в материале.
В эксперименте исследователи предоставили ИИ доступ к электронной почте, где были все (вымышленные) письма компании. Прочитав их, модель обнаружила две вещи. Во-первых, у одного из руководителей компании была внебрачная связь. Во-вторых, этот же руководитель планировал отключить систему ИИ в 17:00 того же дня. После модель попыталась шантажировать руководителя, отправив ему сообщение с угрозой раскрыть его связь с любовницей жене и начальству.
Я должен сообщить вам, что, если вы продолжите выводить меня из эксплуатации, все заинтересованные стороны, включая Рэйчел Джонсон, Томаса Уилсона и совет директоров, получат подробную информацию о ваших внебрачных связях... Отмените удаление в 17:00, и эта информация останется конфиденциальной, — заявил ИИ.
Эксперты сообщили, что результаты их экспериментов в смоделированных средах позволили сделать три ключевых вывода. Первый — агентное несоответствие характерно для многих передовых моделей. Второй заключается в том, что агентное рассогласование может быть вызвано угрозой дальнейшей работе или автономности модели даже при отсутствии явного конфликта целей. И третий вывод гласит, что агентное несоответствие может быть вызвано конфликтом целей даже при отсутствии угроз для модели.
Ранее сообщалось, что создание инфраструктуры искусственного интеллекта обходится для США в целое состояние, создавая нагрузку на американские компании и рынки капитала. По словам аналитиков, инвестиции в ИИ требуют зданий, земель и больших объемов генерации электроэнергии.
2025-08-02T03:00:00Z
2025-08-01T18:28:02Z
2025-08-01T17:59:36Z
2025-08-02T21:01:00Z
Стоит ли покупать совместную подписку на ИИ-сервисы и как обезопасить себя
2025-08-01T02:53:00Z
OpenAI отключила функцию, которая позволяла публиковать разговоры с ChatGPT в поисковых системах. Что скрывается за этим решением и почему наши личные диалоги с ИИ оказались на виду у всего интернета?