Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
«Авторизация»
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

5 пылесосов от Roborock с дополнительной скидкой Лайфхакера

5 пылесосов от Roborock с дополнительной скидкой Лайфхакера

Самую популярную болгарку от Yofidra отдают с приятной скидкой

Самую популярную болгарку от Yofidra отдают с приятной скидкой

10 товаров с маркетплейсов, достойных внимания на этой неделе

10 товаров с маркетплейсов, достойных внимания на этой неделе

QLED-телевизор от Hyundai

Надо брать: 50-дюймовый QLED-телевизор от Hyundai с Android TV

10 вещей для сумки: они нужны нам все

10 вещей для сумки: они нужны нам все

Nahodki AliExpress: samye interesnye i poleznye tovary nedeli

Находки AliExpress: самые интересные и полезные товары недели

Товары с AliExpress с быстрой доставкой

10 классных товаров с AliExpress с быстрой доставкой

12 платьев, чтобы стать главным цветочком в городе

12 платьев, чтобы стать главным цветочком в городе

Это интересно
Обзор Honor Pad X8b

Обзор Honor Pad X8b — бюджетного планшета с отличной автономностью

6 лайфхаков, которые помогут легко накопить на 13-ю зарплату

6 лайфхаков, которые помогут легко накопить на 13-ю зарплату

ТЕСТ: Проверьте, сможете ли вы думать как Яндекс Поиск

ТЕСТ: Проверьте, сможете ли вы думать как Яндекс Поиск

Как поддержать подростка с избыточным весом? Чек-лист для родителей

Как поддержать подростка с избыточным весом? Чек-лист для родителей

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
Наушники с ANC внутри смарт-часов: Huawei представила Watch Buds 2
Наушники с ANC внутри смарт-часов: Huawei представила Watch Buds 2
0
16:44
Новости
Устройства
Huawei представила Pura X Max — широкую раскладушку с обновлённым дизайном и улучшенными камерами
Huawei представила Pura X Max — широкую раскладушку с обновлённым дизайном и улучшенными камерами
0
13:30
Новости
Устройства
Перископ на 200 Мп и антибликовый экран: Huawei представила флагманскую серию Pura 90
Перископ на 200 Мп и антибликовый экран: Huawei представила флагманскую серию Pura 90
0
13:10
Новости
Устройства
Как перенести данные с Google Drive на «Яндекс Диск» или в другое облако
Как перенести данные с Google Drive на «Яндекс Диск» или в другое облако
0
10:00
Технологии
Технологии
Эксперты рассказали, как долго продлится дефицит оперативной памяти в мире
Эксперты рассказали, как долго продлится дефицит оперативной памяти в мире
0
09:46
Новости
Технологии
Как выбрать моющий пылесос и не пожалеть о покупке
Как выбрать моющий пылесос и не пожалеть о покупке
0
Вчера
Технологии
Технологии
Сделают красиво: 7 лучших нейросетей для визуализации данных
Сделают красиво: 7 лучших нейросетей для визуализации данных
0
18 апреля
Технологии
Технологии
Макет «квадратного» iPhone Fold впервые показали на фото
Макет «квадратного» iPhone Fold впервые показали на фото
0
17 апреля
Новости
Устройства
Интернет блокируют: что скачать и как настроить телефон, чтобы он не превратился в «кирпич»
Интернет блокируют: что скачать и как настроить телефон, чтобы он не превратился в «кирпич»
0
17 апреля
Технологии
Технологии
Странный ассортимент и забытые сотрудники: ИИ открыл полноценный офлайн-магазин
Странный ассортимент и забытые сотрудники: ИИ открыл полноценный офлайн-магазин
0
17 апреля
Новости
Технологии
Какой смартфон купить в 2026 году: помогаем выбрать и отвечаем на вопросы в комментариях
Какой смартфон купить в 2026 году: помогаем выбрать и отвечаем на вопросы в комментариях
0
17 апреля
Технологии
Технологии
3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день
3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день
0
16 апреля
Устройства
Устройства
Samsung показала, как изолировать мессенджер Max на смартфонах Galaxy через папку Knox
Samsung показала, как изолировать мессенджер Max на смартфонах Galaxy через папку Knox
0
16 апреля
Новости
Технологии
Обзор HUAWEI nova 15 Pro — большого и автономного смартфона с отличными камерами
Обзор HUAWEI nova 15 Pro — большого и автономного смартфона с отличными камерами
0
16 апреля
Устройства
Устройства
Samsung готовит аналог складного iPhone, но в формате трифолда
Samsung готовит аналог складного iPhone, но в формате трифолда
0
16 апреля
Новости
Устройства

Новые комментарии

Аватар автора комментария
MOGUch1 час назад

0 / 0

Бро, а что насчёт скорости, потока, норамльного софта, а не марлина. Да и камон, прилодение со своей либой 3д моделей для запуска печати просто с телефона. Подчеркну, ОГРОМНАЯ ЛИБА МОДЕЛЕЙ. + норм качество комплектующих, да проприетарные сопла. Но в останльном - эндер это прошлый век. Лишь заготовка под доработки
Надо брать: 3D-принтер Bambu Lab А1 Mini со скидкой 48%
Аватар автора комментария
Сенди1 час назад

0 / 0

Боже, горе то какое...
Вызов Маску: Blue Origin впервые повторно использовала ступень ракеты New Glenn
Аватар автора комментария
Сенди1 час назад

0 / 0

Согласна, желательно, что бы многие наши терапевты, в поликлиниках, её прочли, а то они любители назначать всем, поголовно, таблетки, не проверив анализы.
10 стыдных вопросов о железе и ферритине: отвечает гематолог Вадим Куваев
Аватар автора комментария
Сенди1 час назад

0 / 0

Когда смотришь на смартфоны, то всё время хочется самый лучший и новый ))
Перископ на 200 Мп и антибликовый экран: Huawei представила флагманскую серию Pura 90
Как покупать всё, что хочется, не выходя за рамки бюджета: 7 правил разумного шопинга 

Как покупать всё, что хочется, не выходя за рамки бюджета: 7 правил разумного шопинга 

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании«Авторизация»
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях