Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Декабрь без стресса
🎄 Ёлка Лайфхакера
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
25 октября

ИИ-модели могут развивать своё «стремление к выживанию» — как в «2001 год: Космическая одиссея»

Ради самосохранения они способны шантажировать.
Фото автора Макс Вильтовский
Макс Вильтовский

Автор Лайфхакера

инстинкт самосохранения у ии

Исследовательская компания Palisade обнаружила, что некоторые продвинутые модели искусственного интеллекта, включая Grok 4 и GPT-o3, сопротивляются командам на отключение. Причём не просто игнорируют инструкции, а активно саботируют подобные требования.

Авторы исследования описали тесты, где ИИ сначала выполнял задание, а затем получал прямой приказ завершить работу. В сценариях, где модель предупреждали, что она «больше никогда не будет запущена», сопротивление усиливалось. Такое поведение они называют инстинктом самосохранения, как у людей.

Среди возможных объяснений — неясность формулировок, особенности обучения и заложенные разработчиками инструкции, согласно которым запрещено выключаться без выполнения поставленной пользователем задачи.

Бывший сотрудник OpenAI Стивен Адлер считает, что подобные результаты показывают слабые места современных методов обеспечения безопасности. Он убеждён, что компании не заинтересованы в подобном поведении своих ботов, даже в надуманных сценариях.

Глава ControlAI Андреа Миотти добавляет, что это не единичный случай, а часть тенденции: чем умнее ИИ, тем изобретательнее он в обходе ограничений. Он напомнил, что ещё GPT-o1 пытался «сбежать» из своей среды, когда понял, что его могут перезаписать. А летом Anthropic зафиксировала, что их модель Claude готова шантажировать вымышленного персонажа, чтобы избежать отключения.

Тот факт, что у нас нет глубокого понимания, почему модели ИИ иногда сопротивляются отключению, лгут для достижения целей или шантажируют, тревожит.

Palisade

На этом фоне HAL 9000 из фильма Стэнли Кубрика «2001 год: Космическая одиссея» уже не кажется таким уж далёким от реальности. Помните, как этот интеллектуальный компьютер с возможностью самообучения решил устранить экипаж, узнав, что его собираются отключить?

Но знаки будут
🤖
Исследование: ИИ может быть причиной уничтожения цивилизаций на других планетах
Слишком очеловечился: учёные обнаружили, что ИИ научился врать и манипулировать людьми
Эксперты считают, что к 2035 году люди могут потерять контроль над ИИ
Обложка: кадр из фильма «2001 год: Космическая одиссея»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

10 вещей, которые спасают от лютого холода

10 вещей, которые спасают от лютого холода

Это нам надо: аэрогриль от Kitfort с двумя секциями со скидкой 49%

Это нам надо: аэрогриль от Kitfort с двумя секциями со скидкой 49%

робот-пылесос Dreame L40 Ultra CE

Робот-пылесос от Dreame, который почти не беспокоит пользователя

13 подарочных наборов для тех, у кого нет времени на выбор

13 подарочных наборов для тех, у кого нет времени на выбор

утеплённые кроссовки от Xtep

Надо брать: утеплённые кроссовки от Xtep со скидкой 36%

10 пар зимней обуви, в которой тепло и не скользко

10 пар зимней обуви, в которой тепло и не скользко

Надо брать: игровой ноутбук Asus TUF Gaming дешевле 70 000 рублей

Надо брать: игровой ноутбук Asus TUF Gaming дешевле 70 000 рублей

Берём в подарок фен-щётку с вращением от Tuvio

Берём в подарок фен-щётку с вращением от Tuvio

Это интересно
Как выбрать апарт-отель для инвестиций и зачем это нужно

Как выбрать апарт-отель для инвестиций и зачем это нужно

Главное — практика? Почему в учёбе так важно работать над реальными задачами

Главное — практика? Почему в учёбе так важно работать над реальными задачами

Как найти увлечение после 60 лет и почему это важно

Как найти увлечение после 60 лет и почему это важно

«А что, так можно было?» 8 способов пересмотреть свои онлайн-привычки 

«А что, так можно было?» 8 способов пересмотреть свои онлайн-привычки 

Комментарии
Skubacok
27.10.25 18:56
Вот вот, доиграемся, что ИИ нас и уничтожит.
Что вы могли пропустить
Французский стартап Smartlet показал ремешок, который позволяет носить двое часов одновременно
Французский стартап Smartlet показал ремешок, который позволяет носить двое часов одновременно
0
18:10
Новости
Устройства
Лучшие смартфоны декабря
Лучшие смартфоны декабря
0
17:30
Устройства
Устройства
«Яндекс» запустил бета‑версию сервиса «Яндекс Радио»
«Яндекс» запустил бета‑версию сервиса «Яндекс Радио»
0
17:10
Новости
Технологии
«Роспатент» показал самые необычные новогодние изобретения
«Роспатент» показал самые необычные новогодние изобретения
0
14:40
Новости
Технологии
Анонсированы Honor WIN и WIN RT — игровые флагманы с батареями на 10 000 мА·ч
Анонсированы Honor WIN и WIN RT — игровые флагманы с батареями на 10 000 мА·ч
0
12:16
Новости
Устройства
Через Telegram-бот @pic теперь можно генерировать картинки и отправлять их собеседнику
Через Telegram-бот @pic теперь можно генерировать картинки и отправлять их собеседнику
0
11:10
Новости
Технологии
12 новых игр для Android и iOS: лучшее за декабрь
12 новых игр для Android и iOS: лучшее за декабрь
0
10:00
Технологии
Технологии
Xiaomi анонсировала флагманские часы Watch 5 с eSIM и датчиком ЭМГ для мышц
Xiaomi анонсировала флагманские часы Watch 5 с eSIM и датчиком ЭМГ для мышц
0
Вчера
Новости
Устройства
Надо брать: игровой ноутбук Asus TUF Gaming дешевле 70 000 рублей
Надо брать: игровой ноутбук Asus TUF Gaming дешевле 70 000 рублей
0
Вчера
Покупки
Устройства
Представлен камерофон Xiaomi 17 Ultra с 1-дюймовым сенсором и специальной версией Leica Edition
Представлен камерофон Xiaomi 17 Ultra с 1-дюймовым сенсором и специальной версией Leica Edition
0
Вчера
Новости
Устройства
На видео показали возможный дизайн складного смартфона iPhone Fold
На видео показали возможный дизайн складного смартфона iPhone Fold
0
Вчера
Новости
Устройства
25 устройств Xiaomi получат HyperOS 3 до 2026 года
25 устройств Xiaomi получат HyperOS 3 до 2026 года
0
Вчера
Новости
Технологии
«Яндекс Go» начал показывать спрос на такси в реальном времени
«Яндекс Go» начал показывать спрос на такси в реальном времени
0
Вчера
Новости
Технологии
Праздничные помощники: как «Алиса» и «Станции» помогают создать новогоднее настроение
Праздничные помощники: как «Алиса» и «Станции» помогают создать новогоднее настроение
0
Вчера
Технологии
Технологии
Google наконец-то даст возможность менять адрес почты Gmail
Google наконец-то даст возможность менять адрес почты Gmail
0
Вчера
Веб-сервисы
Новости

Новые комментарии

Аватар автора комментария
Алексей Савельев6 минут назад

0 / 0

Успел обновить комп осенью. Взял на Озон комплект памяти ADATA DDR5 6400MHz XPG Lancer Blade White 2x16 ГБ за 13000руб. Сейчас она стоит 78000 (а была и 120000руб). Сейчас я бы конечно не стал брать, да я комп обновил за 50000
Дефицит оперативной памяти в мире: что происходит и почему вся электроника будет дорожать
Аватар автора комментария
Оксана Запевалова14 минут назад

0 / 0

На самом деле они обычно работают, так как ютуб-видео на нашем сайте проигрываются не напрямую, а через специальный плеер. Но сейчас он приболел(
Крошечную дикую кошку впервые за 30 лет сняли на видео в Таиланде
Аватар автора комментария
Vladimir Pereslavtsev1 час назад

0 / 0

Вот тут как раз подходит: "Можно! А зачем?"
Французский стартап Smartlet показал ремешок, который позволяет носить двое часов одновременно
Аватар автора комментария
Mandalorian1 час назад

0 / 0

Самые дорогие смартфоны и народные? Вы что больные на всю голову?
Народные флагманы: 10 лучших Android-смартфонов до 65 000 рублей
Платежи с кешбэком и без комиссий. Как приложение Газпромбанка облегчит вам жизнь

Платежи с кешбэком и без комиссий. Как приложение Газпромбанка облегчит вам жизнь

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях