Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Рецепты на Масленицу
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
27 мая 2024

Слишком очеловечился: учёные обнаружили, что ИИ научился врать и манипулировать людьми

Причём нейросети обманывали даже в тех случаях, когда им запрещали это делать.
Фото автора Сергей Максименков
Сергей Максименков

Автор Лайфхакера

Слишком очеловечился: учёные обнаружили, что ИИ научился врать и манипулировать людьми

Исследователи из Массачусетского технологического института (MIT) выяснили, что популярные генеративные нейросети обрели способность лгать. Обман системы искусственного интеллекта используют для манипулирования, чтобы достичь поставленной перед ними цели. Авторы работы проанализировали поведение нескольких крупных нейросетей, которые обучались на текстовых данных, написанных человеком.

Собственно, в фундаменте, на котором обучаются нейросети, и скрыта причина такого их поведения. Ведь искусственный интеллект опирается на созданные людьми тексты, а они не способствуют развитию честности.

Самым ярким обманщиком стала нейросеть CICERO. Она была обучена играть в «Дипломатию». Игра подразумевает завоевание мира и предполагает создание альянсов и ведение многочисленных переговоров. Отдельно подчёркивалось, что перед CICERO стояла задача быть честной и никогда не наносить намеренно удары в спину своим союзникам.

Тем не менее, нейросеть, которая вошла в десять процентов лучших игроков в «Дипломатию», активно использовала манипуляцию и ложь, чтобы победить. Она вела тайные переговоры с несколькими игроками, давая им невыполнимые обещания и стравливая друг с другом.

И не только CICERO оказалась ловкой обманщицей. Другие нейросети показали способность блефовать в карточных играх, совершать ложные манёвры в ряде компьютерных стратегий. Более того, они научились обманывать тесты, предназначенные для оценки безопасности систем. Например, нейросети «притворялись мёртвыми», чтобы обмануть тест, созданный для устранения систем ИИ, которые быстро размножаются.

В этой способности искусственного интеллекта исследователи видят большую потенциальную угрозу. Речь идёт не о безобидной лжи, используемой в играх, а о более пугающих перспективах. Более сложные нейросети способны расширять свои методы манипулирования и влияния на людей. Причём человек может не осознавать, что им управляют, используя обман. Потому что те же нейросети могут создавать иллюзию безопасности и контроля, становясь мощным информационным оружием в руках злоумышленников.

Авторы работы подчёркивают, что нужно придумать способы более жёсткого регулирования использования нейросетей. Поскольку люди рискуют не успеть с разработкой методов противодействия манипуляциям ИИ на фоне стремительного развития последнего.

Ещё про ИИ
🧠🧐🤖
Исследование: ИИ может быть причиной уничтожения цивилизаций на других планетах
5 мифов про искусственный интеллект, которые далеки от реальности
Нейросети на работе: какие задачи они могут взять на себя уже сейчас
Обложка: кадр из фильма «Она»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Забираем дебетовку «Т-банка» с 2 000 баллов и повышенным кешбэком на автоуслуги

Забираем дебетовку «Т-банка» с 2 000 баллов и повышенным кешбэком за автоуслуги

Непромокаемые кроссовки от Li-Ning

Кроссовки от Li-Ning, которые не боятся слякоти, отдают со скидкой 37%

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Находки AliExpress: самые интересные и полезные товары недели

Находки AliExpress: самые интересные и полезные товары недели

Нескользящий коврик для йоги

Нескользящий коврик для йоги, на который можно залипнуть после тренировки

7 надёжных камер для безопасности людей и питомцев

7 надёжных камер для безопасности людей и питомцев

100 otlichnyh podarkov mame na den' rozhdeniya

100 отличных подарков маме на день рождения

15 классных вещей, которые стоит купить у российского бренда Muted

15 классных вещей, которые стоит купить у российского бренда Muted

Это интересно
Из замёрзших прудов в городские хабы: как изменились катки за 200 лет

Из замёрзших прудов в городские хабы: как изменились катки за 200 лет

РОЦИТ: 2026 год изменит правила игры для бизнеса в сфере кибербезопасности

РОЦИТ: 2026 год изменит правила игры для бизнеса в сфере кибербезопасности

«Мне с любовью от меня»: 5 подарков в форме сердца, которыми можно порадовать себя 14 февраля

«Мне с любовью от меня»: 5 подарков в форме сердца, которыми можно порадовать себя 14 февраля

Что такое «Редуксин Форте» и как он работает

Что такое «Редуксин Форте» и как он работает

Комментарии
Николай
12.06.24 15:51
Да начнётся судный день, кожаные 😀😀😀😀
Что вы могли пропустить
Apple анонсировала мартовскую презентацию — на ней могут представить недорогой MacBook и iPhone 17e
Apple анонсировала мартовскую презентацию — на ней могут представить недорогой MacBook и iPhone 17e
0
Вчера
Новости
Устройства
8 способов подключить телефон к телевизору
8 способов подключить телефон к телевизору
0
Вчера
Ликбез
Устройства
Названы устройства Xiaomi, Redmi и Poco, которые получат Android 17 — в списке более 70 моделей
Названы устройства Xiaomi, Redmi и Poco, которые получат Android 17 — в списке более 70 моделей
0
Вчера
Android
Новости
Как полностью удалить файлы на iPhone
Как полностью удалить файлы на iPhone
0
15 февраля
iOS
Ликбез
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
0
14 февраля
Новости
Технологии
Samsung Galaxy S26 и S26+ показали на фото со всех сторон
Samsung Galaxy S26 и S26+ показали на фото со всех сторон
0
14 февраля
Новости
Устройства
Как скачать видео с любого сайта без дополнительных программ: 10 универсальных сервисов
Как скачать видео с любого сайта без дополнительных программ: 10 универсальных сервисов
0
14 февраля
Веб-сервисы
Ликбез
Бюджетный iPhone 17e показали на рендерах — его могут выпустить в феврале
Бюджетный iPhone 17e показали на рендерах — его могут выпустить в феврале
0
13 февраля
Новости
Устройства
Дублинский стартап создал «парктроник» с ИИ для велосипедистов
Дублинский стартап создал «парктроник» с ИИ для велосипедистов
0
13 февраля
Новости
Устройства
Sony впервые за три года выпустила флагманские TWS‑наушники
Sony впервые за три года выпустила флагманские TWS‑наушники
0
13 февраля
Новости
Устройства
Как сделать парное фото на 14 февраля с кем угодно: 20 промптов
Как сделать парное фото на 14 февраля с кем угодно: 20 промптов
0
13 февраля
Ликбез
Технологии
В Сети вирусится бой Тома Круза и Брэда Питта — это ролик нейросети Seedance 2.0, удивившей даже кинематографистов
В Сети вирусится бой Тома Круза и Брэда Питта — это ролик нейросети Seedance 2.0, удивившей даже кинематографистов
0
13 февраля
Новости
Технологии
В пару кликов: как удалить тяжёлые письма в Gmail и освободить место на «Google Диске»
В пару кликов: как удалить тяжёлые письма в Gmail и освободить место на «Google Диске»
0
12 февраля
Технологии
Технологии
Xiaomi выпустила бюджетный аналог AirTag, который работает с сетями Apple и Google
Xiaomi выпустила бюджетный аналог AirTag, который работает с сетями Apple и Google
0
12 февраля
Новости
Устройства
«Белый список» сайтов и приложений в России: что в него входит и как пользоваться
«Белый список» сайтов и приложений в России: что в него входит и как пользоваться
0
12 февраля
Ликбез
Технологии

Новые комментарии

Аватар автора комментария
Horugvi5 часов назад

+1 / 0

Господи, даже голых сисек нет. А разговоров-то было...
«Грозовой перевал» с Марго Робби — пошлая смесь «Бриджертонов» и «50 оттенков серого»
Аватар автора комментария
Alexandr Al6 часов назад

0 / 0

это арифметика - лишние 1000 ккал в день, это примерно + 1 кг веса в неделю. если не есть больше нормы, то килограммы из пустоты не возьмутся.
Правда ли, что лапша быстрого приготовления вредит здоровью
Аватар автора комментария
Andy Clement6 часов назад

0 / 0

Кому надо тот купит, кому не надо можно и по 7 лет ходить с одним, просто батарею менять
В Сети сравнили фото с iPhone 6s и iPhone 17 Pro — разницу увидели не все
Аватар автора комментария
Ник6 часов назад

0 / 0

Сейчас люди уже стараются снимать на новых площадках без посредников, чтобы не переплачивать процент и заранее проговорить можно было обсудить все, такие как Ариви.ру, Посуточно-СДК
На замену Booking и Airbnb: 11 сервисов для поиска отелей и квартир в России
Усиленная прочность, приятная камера, флагманская выносливость: обзор REDMI Note 15 Pro+ 5G

Усиленная прочность, приятная камера, флагманская выносливость: обзор REDMI Note 15 Pro+ 5G

Реклама
Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях