Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Выгодные покупки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
25 октября

ИИ-модели могут развивать своё «стремление к выживанию» — как в «2001 год: Космическая одиссея»

Ради самосохранения они способны шантажировать.
Фото автора Макс Вильтовский
Макс Вильтовский

Автор Лайфхакера

инстинкт самосохранения у ии

Исследовательская компания Palisade обнаружила, что некоторые продвинутые модели искусственного интеллекта, включая Grok 4 и GPT-o3, сопротивляются командам на отключение. Причём не просто игнорируют инструкции, а активно саботируют подобные требования.

Авторы исследования описали тесты, где ИИ сначала выполнял задание, а затем получал прямой приказ завершить работу. В сценариях, где модель предупреждали, что она «больше никогда не будет запущена», сопротивление усиливалось. Такое поведение они называют инстинктом самосохранения, как у людей.

Среди возможных объяснений — неясность формулировок, особенности обучения и заложенные разработчиками инструкции, согласно которым запрещено выключаться без выполнения поставленной пользователем задачи.

Бывший сотрудник OpenAI Стивен Адлер считает, что подобные результаты показывают слабые места современных методов обеспечения безопасности. Он убеждён, что компании не заинтересованы в подобном поведении своих ботов, даже в надуманных сценариях.

Глава ControlAI Андреа Миотти добавляет, что это не единичный случай, а часть тенденции: чем умнее ИИ, тем изобретательнее он в обходе ограничений. Он напомнил, что ещё GPT-o1 пытался «сбежать» из своей среды, когда понял, что его могут перезаписать. А летом Anthropic зафиксировала, что их модель Claude готова шантажировать вымышленного персонажа, чтобы избежать отключения.

Тот факт, что у нас нет глубокого понимания, почему модели ИИ иногда сопротивляются отключению, лгут для достижения целей или шантажируют, тревожит.

Palisade

На этом фоне HAL 9000 из фильма Стэнли Кубрика «2001 год: Космическая одиссея» уже не кажется таким уж далёким от реальности. Помните, как этот интеллектуальный компьютер с возможностью самообучения решил устранить экипаж, узнав, что его собираются отключить?

Но знаки будут
🤖
Исследование: ИИ может быть причиной уничтожения цивилизаций на других планетах
Слишком очеловечился: учёные обнаружили, что ИИ научился врать и манипулировать людьми
Эксперты считают, что к 2035 году люди могут потерять контроль над ИИ
Обложка: кадр из фильма «2001 год: Космическая одиссея»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

распределяющая шляпа из Хогвартса

Найдена распределяющая шляпа из Хогвартса. Сейчас на неё скидка — а ещё она разговаривает!

10 товаров с распродажи 11.11, на которые не жалко потратить деньги

10 товаров с распродажи 11.11, на которые не жалко потратить деньги

5 мини-ПК с высоким рейтингом и большими скидками на распродаже 11.11

5 мини-ПК с высоким рейтингом и большими скидками на распродаже 11.11

Фен-стайлер Tuvio

Надо брать: универсальный стайлер от Tuvio со скидкой 73%

15 moshchnyh GaN-zaryadok so skidkami do 84% na rasprodazhe 11.11

15 мощных GaN-зарядок со скидками до 84% на распродаже 11.11

На что способен проектор Magcubic за 3 850 рублей

На что способен проектор Magcubic за 3 850 рублей

Надо брать: глобальная версия флагмана OnePlus 15 дешевле 50 000 рублей

Надо брать: глобальная версия флагмана OnePlus 15 дешевле 50 000 рублей

Надо брать: внешний жёсткий диск на 1 ТБ со скидкой 45%

Надо брать: внешний жёсткий диск на 1 ТБ от Netac со скидкой 45%

Это интересно
Что подарить ребёнку? 10 идей для детей от 0 до 10 лет

Что подарить ребёнку? 10 идей для детей от 0 до 10 лет

Реклама
С высоты профессии. 3 вдохновляющие истории девушек, которые чинят и проектируют самолёты

С высоты профессии. 3 вдохновляющие истории девушек, которые чинят и проектируют самолёты

7 фактов о детском пюре «ФрутоНяня», которые стоит знать родителям

7 фактов о детском пюре «ФрутоНяня», которые стоит знать родителям

Реклама
Ребёнок в машине: 6 главных ошибок, которые допускают родители

Ребёнок в машине: 6 главных ошибок, которые допускают родители

Комментарии
Skubacok
27.10.25 18:56
Вот вот, доиграемся, что ИИ нас и уничтожит.
Что вы могли пропустить
Илон Маск запустил мессенджер Chat с шифрованием и видеозвонками
Илон Маск запустил мессенджер Chat с шифрованием и видеозвонками
0
Вчера
Веб-сервисы
Новости
Обзор Gamesir Gamehub для запуска ПК-игр на Android-смартфоне — в том числе из Steam
Обзор Gamesir Gamehub для запуска ПК-игр на Android-смартфоне — в том числе из Steam
0
Вчера
Технологии
Технологии
Минцифры расширило «белый список» — в него включили СМИ и «Почту России»
Минцифры расширило «белый список» — в него включили СМИ и «Почту России»
0
14 ноября
Новости
Технологии
Tom's Guide назвал 6 лучших камерофонов 2025 года — от флагманов до доступных
Tom's Guide назвал 6 лучших камерофонов 2025 года — от флагманов до доступных
0
14 ноября
Новости
Устройства
Xiaomi выпустила недорогой игровой монитор G24i 2026 с частотой 200 Гц
Xiaomi выпустила недорогой игровой монитор G24i 2026 с частотой 200 Гц
0
14 ноября
Новости
Устройства
Satechi представила магнитный хаб для смартфонов — шайбу с USB, HDMI и другими портами
Satechi представила магнитный хаб для смартфонов — шайбу с USB, HDMI и другими портами
0
14 ноября
Новости
Устройства
Не только доставка: 6 неожиданных сфер, где уже работают дроны
Не только доставка: 6 неожиданных сфер, где уже работают дроны
0
14 ноября
Технологии
Технологии
Названы устройства Xiaomi и Redmi, которые получат HyperOS 3 в ближайшие дни
Названы устройства Xiaomi и Redmi, которые получат HyperOS 3 в ближайшие дни
0
14 ноября
Android
Новости
Надо брать: глобальная версия флагмана OnePlus 15 дешевле 50 000 рублей
Надо брать: глобальная версия флагмана OnePlus 15 дешевле 50 000 рублей
0
14 ноября
Покупки
Устройства
Народные флагманы: 10 лучших Android-смартфонов до 65 000 рублей
Народные флагманы: 10 лучших Android-смартфонов до 65 000 рублей
0
14 ноября
Устройства
Устройства
70+ нейросетей, которые справятся с любой задачей
70+ нейросетей, которые справятся с любой задачей
14 ноября
Технологии
Технологии
В ChatGPT появились групповые чаты — но пока не у всех
В ChatGPT появились групповые чаты — но пока не у всех
0
14 ноября
Веб-сервисы
Новости
ИИ-песня впервые в истории возглавила музыкальный чарт Billboard
ИИ-песня впервые в истории возглавила музыкальный чарт Billboard
0
14 ноября
Новости
Технологии
DJI представила Neo 2 — дрон для новичков с голосовым и жестовым управлением
DJI представила Neo 2 — дрон для новичков с голосовым и жестовым управлением
0
13 ноября
Новости
Устройства
Надо брать: Honor 400 Lite с 12 ГБ ОЗУ и экраном 120 Гц дешевле 15 000 рублей
Надо брать: Honor 400 Lite с 12 ГБ ОЗУ и экраном 120 Гц дешевле 15 000 рублей
0
13 ноября
Покупки
Устройства

Новые комментарии

Аватар автора комментария
Петр Романов43 минуты назад

0 / 0

Лучше бы сделали раскладной экран как у Хуавея, только больше. Фигнёй страдают
Анонсирован Phantom — первый в мире прозрачный монитор для компьютеров
Аватар автора комментария
Sergei F3 часа назад

0 / 0

Вполне попсовое кино для Netflix и тупых гайдзинов, что не шарят, но совершенно роскошные бои на мечах и всяком таком, коих просто немеряно, что очень радует.
200% на Rotten Tomatoes: королевская битва «Икусагами: Последний самурай» стала новым хитом Netflix
Аватар автора комментария
Wera Ferat3 часа назад

0 / 0

Интересно, не будет ли со временем перетираться на изгибах? В принципе в дороге комфортно смотреть видео.
«Трикладушку» Galaxy Z TriFold от Samsung впервые показали на видео
Аватар автора комментария
Олег Залялов3 часа назад

0 / 0

меня, кстати, очень повеселила отсылка из coming to America к trading places в свое время
Эдди Мёрфи назвал два своих лучших фильма и один отстойный
Что подарить ребёнку? 10 идей для детей от 0 до 10 лет

Что подарить ребёнку? 10 идей для детей от 0 до 10 лет

Реклама
Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторов
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях