27 мая 2024

Слишком очеловечился: учёные обнаружили, что ИИ научился врать и манипулировать людьми

Причём нейросети обманывали даже в тех случаях, когда им запрещали это делать.

Автор Лайфхакера

Слишком очеловечился: учёные обнаружили, что ИИ научился врать и манипулировать людьми

Исследователи из Массачусетского технологического института (MIT) выяснили, что популярные генеративные нейросети обрели способность лгать. Обман системы искусственного интеллекта используют для манипулирования, чтобы достичь поставленной перед ними цели. Авторы работы проанализировали поведение нескольких крупных нейросетей, которые обучались на текстовых данных, написанных человеком.

Собственно, в фундаменте, на котором обучаются нейросети, и скрыта причина такого их поведения. Ведь искусственный интеллект опирается на созданные людьми тексты, а они не способствуют развитию честности.

Самым ярким обманщиком стала нейросеть CICERO. Она была обучена играть в «Дипломатию». Игра подразумевает завоевание мира и предполагает создание альянсов и ведение многочисленных переговоров. Отдельно подчёркивалось, что перед CICERO стояла задача быть честной и никогда не наносить намеренно удары в спину своим союзникам.

Тем не менее, нейросеть, которая вошла в десять процентов лучших игроков в «Дипломатию», активно использовала манипуляцию и ложь, чтобы победить. Она вела тайные переговоры с несколькими игроками, давая им невыполнимые обещания и стравливая друг с другом.

И не только CICERO оказалась ловкой обманщицей. Другие нейросети показали способность блефовать в карточных играх, совершать ложные манёвры в ряде компьютерных стратегий. Более того, они научились обманывать тесты, предназначенные для оценки безопасности систем. Например, нейросети «притворялись мёртвыми», чтобы обмануть тест, созданный для устранения систем ИИ, которые быстро размножаются.

В этой способности искусственного интеллекта исследователи видят большую потенциальную угрозу. Речь идёт не о безобидной лжи, используемой в играх, а о более пугающих перспективах. Более сложные нейросети способны расширять свои методы манипулирования и влияния на людей. Причём человек может не осознавать, что им управляют, используя обман. Потому что те же нейросети могут создавать иллюзию безопасности и контроля, становясь мощным информационным оружием в руках злоумышленников.

Авторы работы подчёркивают, что нужно придумать способы более жёсткого регулирования использования нейросетей. Поскольку люди рискуют не успеть с разработкой методов противодействия манипуляциям ИИ на фоне стремительного развития последнего.

Исследование: ИИ может быть причиной уничтожения цивилизаций на других планетах

5 мифов про искусственный интеллект, которые далеки от реальности

Нейросети на работе: какие задачи они могут взять на себя уже сейчас

Лучшие предложения

10 хороших кроссовок для тех, кому не терпится выйти на пробежку

Экономим до 50% на «Яндекс Маркете» с бесплатной картой от ВТБ

Саундбар для телевизора от Ultimea отдают со скидкой 57% на AliExpress

Надо брать: рюкзак с вакуумным отсеком со скидкой 63%

Nahodki AliExpress: samye interesnye i poleznye tovary marta

Находки AliExpress: самые интересные и полезные товары марта

Популярную DDR4-оперативку на 16 ГБ отдают со скидкой 67% на AliExpress

Магазины, которые продлили скидки после большой распродажи на AliExpress

10 предметов для небольших, но заметных изменений в интерьере

Это интересно

Что такое «Тирзетта» и как она работает

Как найти покупателей без помощи социальных сетей

Как поддержать подростка с избыточным весом? Чек-лист для родителей

Почему после похудения килограммы возвращаются и как этого избежать

Комментарии

Николай

12.06.24 15:51

Да начнётся судный день, кожаные 😀😀😀😀

Что вы могли пропустить

Представлен Vivo X300 Ultra — кандидат на звание лучшего камерофона в мире

31 марта

Новости

Устройства

Как сохранить фото и файлы iCloud после отключения оплаты в России

31 марта

Технологии

12 крутых домашних проекторов, которые стоит купить в 2026 году

31 марта

Ликбез

Устройства

Какой стороной вставлять вилку в розетку и есть ли вообще разница

30 марта

Технологии

Российские операторы собираются отключить оплату с мобильного счёта на iPhone

30 марта

Новости

Технологии

Лучшие смартфоны марта

29 марта

Устройства

10 новых приложений для Android: лучшее за март

29 марта

Android

Чем заменить Telegram: 10 мессенджеров для общения с близкими и коллегами

28 марта

Технологии

Android оказался почти на 50% быстрее iOS при работе в браузере

28 марта

Android

Новости

8 новых игр для Android и iOS: лучшее за март

27 марта

Технологии

В Японии создали приложение, которое переводит плач младенцев на понятный язык

27 марта

Новости

Технологии

Sony повысит цены на PlayStation 5 и PlayStation Portal по всему миру

27 марта

Новости

Устройства

Windows против macOS: в Omnissa сравнили скорость, сбои и срок службы двух ОС

27 марта

Windows

Новости

В пару кликов: как включить общий буфер обмена между Windows 11 и Android

27 марта

Технологии

12 лучших аэрогрилей для дома в 2026 году

27 марта

Ликбез

Технологии

Новые комментарии

Сергей Викторович Курочкин3 минуты назад

0 / 0

Расследование просто очень легким было - у кого попа слиплась, тот и похититель!

Кража 12 тонн батончиков KitKat стала новым мемом в стиле «мы тут ни при чём»

Skubacok9 минут назад

0 / 0

Прям в точку👍

Как сохранить фото и файлы iCloud после отключения оплаты в России

Skubacok10 минут назад

0 / 0

Прикольно. Уже бы просто выпустили отличный фотоаппарат

Представлен Vivo X300 Ultra — кандидат на звание лучшего камерофона в мире

Skubacok17 минут назад

0 / 0

Правильно делают. "Куй железо, пока горячо"

По «Властелину колец» разрабатывается масштабная игра с открытым миром