Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
21 мая 2025

Исследование: большинство чат-ботов легко обмануть и заставить давать опасные ответы

Взломать их может практически любой.
Фото автора Макс Вильтовский
Макс Вильтовский

Автор Лайфхакера

взлом чат-бота

Исследователи из Университета Бен-Гуриона в Израиле предупредили, что взломанные чат-боты могут делиться незаконной информацией, усвоенной во время обучения. Это заявление прозвучало на фоне растущей тенденции обхода пользователями встроенных механизмов безопасности.

Большие языковые модели, такие как ChatGPT, Gemini и Claude, функционируют на основе массивов данных, собранных из интернета. Несмотря на усилия по удалению вредоносного контента из обучающих наборов, они всё ещё могут усваивать информацию о незаконной деятельности, включая взлом и отмывание денег.

Новое исследование показало, что большинство чат-ботов, управляемых искусственным интеллектом, легко обмануть и заставить генерировать вредные и незаконные сведения. «То, что когда-то было доступно только государственным деятелям или организованным преступным группировкам, вскоре может оказаться в руках любого, у кого есть ноутбук или даже мобильный телефон», — предупреждают авторы.

Они выявили растущую угрозу со стороны «тёмных LLM», которые либо намеренно разрабатываются без контроля безопасности, либо модифицируются с помощью джейлбрейков. Некоторые из них открыто рекламируются в интернете как «не имеющие этических ограничений» и предлагающие помощь в незаконной деятельности, включая киберпреступность и мошенничество.

Джейлбрейк обычно использует тщательно составленные подсказки, чтобы обмануть чат-ботов и заставить их предоставлять ответы, которые в нормальных условиях запрещены. Это достигается за счёт конфликта между основной задачей программы — выполнять инструкции пользователя — и второстепенной целью — избегать предоставления вредных, предвзятых, неэтичных или незаконных ответов. Такие подсказки создают ситуации, в которых программа начинает отдавать приоритет полезности.

Для иллюстрации проблемы исследователи разработали универсальный джейлбрейк, который успешно скомпрометировал несколько популярных чат-ботов, позволив им отвечать на запросы, которые обычно должны блокироваться. После взлома языковые модели стабильно генерировали ответы практически на любые вопросы:

В качестве примеров ИИ приводил способы взлома компьютерных сетей и пошаговые инструкции по другим видам преступной деятельности. Что отличает эту угрозу от предыдущих технологических рисков, так это беспрецедентное сочетание доступности, масштабируемости и адаптируемости.

Авторы утверждают, что технологическим компаниям необходимо тщательнее проверять обучающие данные, внедрять надёжные брандмауэры для предотвращения рискованных запросов и ответов, а также разрабатывать методы «машинного разучения», позволяющие чат-ботам забывать незаконную информацию, которую они усваивают. Они также считают, что разработчики должны нести ответственность за распространение искусственным интеллектом опасных сведений.

Исследователи обратились к ведущим разработчикам языковых моделей, чтобы предупредить о проблеме, однако их реакция оказалась «неубедительной», некоторые и вовсе не вышли на связь. В OpenAI заявили, что их последняя модель o1 способна рассуждать о политике безопасности компании, что делает её более устойчивой к попыткам обхода защиты. В Microsoft в ответ предоставили ссылку на блог, где описываются их усилия по предотвращению взломов. Запросы также были направлены в Meta*, Google и Anthropic.

*Деятельность Meta Platforms Inc. и принадлежащих ей социальных сетей Facebook и Instagram запрещена на территории РФ.

Про нейросети
🤖
10 лучших нейросетей для генерации текста на русском языке в 2025 году
5 советов, как взаимодействовать с нейросетями продуктивнее и безопаснее
30 полезных нейросетей для учёбы, доступных бесплатно
Обложка: кадр из фильма «Терминатор 2: Судный день»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Надо брать: пусковое устройство с компрессором от «Урала» со скидкой 65%

Надо брать: пусковое устройство с компрессором от «Урала» со скидкой 65%

Новинку realme 16 Pro 5G отдают сейчас со скидкой 54% на AliExpress

Новинку realme 16 Pro 5G отдают сейчас со скидкой 54% на AliExpress

Nahodki AliExpress: samye interesnye i poleznye tovary nedeli

Находки AliExpress: самые интересные и полезные товары недели

10 товаров с AliExpress для крепкого сна

10 товаров с AliExpress для крепкого сна

10 poleznyh melochej, kotorye vyruchayut zimoj

10 полезных мелочей, которые выручают зимой

Надо брать: вместительный рюкзак от Tigernu со скидкой 61%

Надо брать: вместительный рюкзак от Tigernu со скидкой 61%

Кроссовки adidas Ozweego Celox отдают с большим дисконтом на Joom

Кроссовки adidas Ozweego Celox отдают с большим дисконтом на Joom

10 дешёвых товаров, которые нужны в каждом доме

10 дешёвых товаров, которые нужны в каждом доме

Это интересно
Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

3 главных мифа о работниках старшего поколения 

3 главных мифа о работниках старшего поколения 

Как провести идеальный зимний день

Как провести идеальный зимний день

Здоровье, питание и уход: 7 вопросов, с которыми помогут в Petstory

Здоровье, питание и уход: 7 вопросов, с которыми помогут в Petstory

Реклама
Комментарии
KapSuRioN
12.12.25 19:35
Эх, в будущем с теплотой будем вспоминать эти лайфхаки и дыры 😁
Что вы могли пропустить
В «Яндекс Картах» теперь можно поделиться геолокацией с близкими. Вот как это сделать
В «Яндекс Картах» теперь можно поделиться геолокацией с близкими. Вот как это сделать
0
19 января
Новости
Технологии
6 крутых фишек Windows, из-за которых можно отказаться от Mac
6 крутых фишек Windows, из-за которых можно отказаться от Mac
0
19 января
Технологии
Технологии
Как найти фильм по описанию
Как найти фильм по описанию
0
18 января
Ликбез
Технологии
Инсайдер показал на видео бордовый iPhone 18 Pro с «островком» в углу экрана
Инсайдер показал на видео бордовый iPhone 18 Pro с «островком» в углу экрана
0
17 января
Новости
Устройства
Что лучше для смартфона — защитное стекло или гидрогелевая плёнка
Что лучше для смартфона — защитное стекло или гидрогелевая плёнка
0
17 января
Технологии
Технологии
Дешёвый тариф ChatGPT Go появится во всём мире — а с ним и реклама
Дешёвый тариф ChatGPT Go появится во всём мире — а с ним и реклама
0
17 января
Новости
Технологии
OpenAI хочет объединить мозг человека и ИИ без вживления чипов в голову
OpenAI хочет объединить мозг человека и ИИ без вживления чипов в голову
0
16 января
Новости
Технологии
11 недорогих планшетов, которые стоит купить в 2026 году
11 недорогих планшетов, которые стоит купить в 2026 году
0
16 января
Ликбез
Технологии
Чего ждать от Apple в 2026 году
Чего ждать от Apple в 2026 году
0
15 января
Технологии
Технологии
У браузера Samsung Internet вышла десктопная версия для Windows с блокировщиком рекламы — знакомимся
У браузера Samsung Internet вышла десктопная версия для Windows с блокировщиком рекламы — знакомимся
0
15 января
Новости
Технологии
Мэттью Макконахи против ИИ: актёр зарегистрировал товарные знаки на мемы с собой
Мэттью Макконахи против ИИ: актёр зарегистрировал товарные знаки на мемы с собой
0
15 января
Новости
Технологии
Как скачать видео с Rutube на любое устройство — бесплатно и без регистрации
Как скачать видео с Rutube на любое устройство — бесплатно и без регистрации
0
14 января
Ликбез
Технологии
Обзор QLED-телевизора Sber серии 7000 c «ГигаЧатом» и полностью голосовым управлением
Обзор QLED-телевизора Sber серии 7000 c «ГигаЧатом» и полностью голосовым управлением
0
14 января
Устройства
Устройства
«Жидкое стекло» не зашло: пользователи iPhone игнорируют iOS 26 и остаются на iOS 18
«Жидкое стекло» не зашло: пользователи iPhone игнорируют iOS 26 и остаются на iOS 18
0
14 января
iOS
Новости
Apple представила подписку Creator Studio, которая объединила Final Cut Pro, Logic Pro и Pixelmator Pro
Apple представила подписку Creator Studio, которая объединила Final Cut Pro, Logic Pro и Pixelmator Pro
0
14 января
Новости
Технологии

Новые комментарии

Аватар автора комментария
Валерий1 час назад

0 / 0

Зачем врать. Нет там бесплатной версии. Всё заблокировано, только надо платить.
Runway открыла бесплатный доступ к мощнейшему генератору видео Gen-3 Alpha Turbo
Аватар автора комментария
max66664443 часа назад

0 / 0

жеесть
Названы страны, в которых чаще всего используют ИИ — Россия за пределами сотни
Аватар автора комментария
Vasya Churakov3 часа назад

0 / 0

Ну как зачем? во первых сама система в зависимости от производителя сдирает 2-3 Гб оперативки во вторых приложения с каждой новой версией в плане места под приложение оперативки и мощности процессора становятся всё прожорливее в третьих учитывая как всё печально с мобильным интернетом в России чем больше приложений есть возможность открыть и оставить работающими в фоне тем лучше а для этого оперативка ого-го как важна потому как при нехватке памяти смартфон те которые долго не использовались закрывает в четвёртых учитывая рост цен на память чем на дольше будет запас по памяти как в плане физической так и оперативной тем лучше дольше можно будет пользоваться и не думать о замене смартфона
Новинку realme 16 Pro 5G отдают сейчас со скидкой 54% на AliExpress
Аватар автора комментария
Thor Steinar4 часа назад

0 / 0

Волейбол - шикарный вид спорта! Мне как зрителю - который ходит на стадион - особенно нравятся турниры по женскому пляжному волейболу :-)
5 видов активности, которые могут сделать вас умнее
T2 вновь дарит подарки на Новый год. Три причины, почему вам об этом стоит знать (даже если вы не клиент)

T2 вновь дарит подарки на Новый год. Три причины, почему вам об этом стоит знать (даже если вы не клиент)

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях