Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

7 надёжных камер для безопасности людей и питомцев

7 надёжных камер для безопасности людей и питомцев

100 otlichnyh podarkov mame na den' rozhdeniya

100 отличных подарков маме на день рождения

15 классных вещей, которые стоит купить у российского бренда Muted

15 классных вещей, которые стоит купить у российского бренда Muted

Этот неубиваемый смартфон Honor X9d работает два дня без подзарядки

Этот неубиваемый смартфон Honor X9d работает два дня без подзарядки

11 вещей с AliExpress, которые порадовали нас на этой неделе

11 вещей с AliExpress, которые порадовали нас на этой неделе

Wi-Fi-роутер Xiaomi AX3000

Надо брать: топовый Wi-Fi-роутер от Xiaomi со скидкой 37%

Эти 15 товаров со скидками до 82% достойны внимания на AliExpress

Эти 15 товаров со скидками до 82% достойны внимания на AliExpress

Надо брать: мужские ботинки от Golden Camel со скидкой 56%

Надо брать: мужские ботинки от Golden Camel со скидкой 56%

Это интересно
Культурный челлендж: 6 способов получить новые впечатления в этом году

Культурный челлендж: 6 способов получить новые впечатления в этом году

Молодёжные центры: почему это удобно и что о них нужно знать

Молодёжные центры: почему это удобно и что о них нужно знать

Планирование беременности: какие обследования нужно пройти 

Планирование беременности: какие обследования нужно пройти 

С 1 февраля в России проиндексировано более 40 видов социальных выплат

С 1 февраля в России проиндексировано более 40 видов социальных выплат

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
0
15:16
Новости
Технологии
Samsung Galaxy S26 и S26+ показали на фото со всех сторон
Samsung Galaxy S26 и S26+ показали на фото со всех сторон
0
13:10
Новости
Устройства
Как скачать видео с любого сайта без дополнительных программ: 10 универсальных сервисов
Как скачать видео с любого сайта без дополнительных программ: 10 универсальных сервисов
0
11:00
Веб-сервисы
Ликбез
Бюджетный iPhone 17e показали на рендерах — его могут выпустить в феврале
Бюджетный iPhone 17e показали на рендерах — его могут выпустить в феврале
0
Вчера
Новости
Устройства
Дублинский стартап создал «парктроник» с ИИ для велосипедистов
Дублинский стартап создал «парктроник» с ИИ для велосипедистов
0
Вчера
Новости
Устройства
Sony впервые за три года выпустила флагманские TWS‑наушники
Sony впервые за три года выпустила флагманские TWS‑наушники
0
Вчера
Новости
Устройства
Как сделать парное фото на 14 февраля с кем угодно: 20 промптов
Как сделать парное фото на 14 февраля с кем угодно: 20 промптов
0
Вчера
Ликбез
Технологии
В Сети вирусится бой Тома Круза и Брэда Питта — это ролик нейросети Seedance 2.0, удивившей даже кинематографистов
В Сети вирусится бой Тома Круза и Брэда Питта — это ролик нейросети Seedance 2.0, удивившей даже кинематографистов
0
Вчера
Новости
Технологии
В пару кликов: как удалить тяжёлые письма в Gmail и освободить место на «Google Диске»
В пару кликов: как удалить тяжёлые письма в Gmail и освободить место на «Google Диске»
0
12 февраля
Технологии
Технологии
Xiaomi выпустила бюджетный аналог AirTag, который работает с сетями Apple и Google
Xiaomi выпустила бюджетный аналог AirTag, который работает с сетями Apple и Google
0
12 февраля
Новости
Устройства
«Белый список» сайтов и приложений в России: что в него входит и как пользоваться
«Белый список» сайтов и приложений в России: что в него входит и как пользоваться
0
12 февраля
Ликбез
Технологии
Чем заменить Telegram: 9 мессенджеров для общения с близкими и коллегами
Чем заменить Telegram: 9 мессенджеров для общения с близкими и коллегами
0
11 февраля
Технологии
Технологии
Нужно ли благодарить нейросети за ответы
Нужно ли благодарить нейросети за ответы
0
11 февраля
Технологии
Технологии
Роскомнадзор начал ограничение работы Telegram в России
Роскомнадзор начал ограничение работы Telegram в России
0
10 февраля
Новости
Технологии
Как настроить роутер без помощи специалиста
Как настроить роутер без помощи специалиста
0
10 февраля
Ликбез
Устройства

Новые комментарии

Аватар автора комментария
Eugene M.1 час назад

0 / 0

Пару раз в неделю нормально!
Что будет, если мастурбировать каждый день 
Аватар автора комментария
BVGf1 час назад

0 / 0

Получается что ИИ может так же заменить весь ТОП-менеджмент компаний, всяких директоров, и даже депутатов? Или это уже другое?
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
Аватар автора комментария
Эдуард2 часа назад

0 / 0

Прекрасный магазин инструментов и инвентаря для сада и огорода. Доставка и самовывоз, работа с клиентом на его условиях, весь спектр услуг. Нам очень помогли с выбором хорошего триммера для дачного участка. https://mi-opt.ru/
Что я поняла, когда стала проводить лето на даче
Аватар автора комментария
Horugvi2 часа назад

0 / 0

Чтобы взять кредит на свадьбу?
Что делать, если жизнь катится к чертям
T2 вновь дарит подарки на Новый год. Три причины, почему вам об этом стоит знать (даже если вы не клиент)

T2 вновь дарит подарки на Новый год. Три причины, почему вам об этом стоит знать (даже если вы не клиент)

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях