Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
🎄 Ёлка Лайфхакера
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

OnePlus 15R

Надо брать: новый субфлагман OnePlus 15R дешевле 39 000 рублей на AliExpress

42 отличных товара, которые часто покупают на AliExpress

36 отличных товаров, которые часто покупают на AliExpress

5 samyh populyarnyh vneshnih akkumulyatorov s AliExpress

5 самых популярных внешних аккумуляторов с AliExpress

Кроссовки от Golden Camel

Надо брать: качественные зимние кроссовки от Golden Camel за полцены

10 muzhskih zimnih kurtok so skidkami do 64%

10 мужских зимних курток со скидками до 64%

У этого шуруповёрта тысячи восторженных отзывов на маркетплейсах

У этого шуруповёрта тысячи восторженных отзывов на маркетплейсах

Находки AliExpress: самые интересные и полезные товары 2025 года

Находки AliExpress: самые интересные и полезные товары 2025 года

Апельсиновая Альфа-карта

Забираем дебетовую карту с кешбэком 7% и 5 000 баллов в «Пятёрочке»

Это интересно
проигрыватели на разный бюджет

Проигрыватель в подарок: 3 варианта на разный бюджет

3 вида киберугроз, которые могут серьёзно навредить бизнесу

3 вида киберугроз, которые могут серьёзно навредить бизнесу

3 главных мифа о работниках старшего поколения 

3 главных мифа о работниках старшего поколения 

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
Надо брать: новый субфлагман OnePlus 15R дешевле 39 000 рублей на AliExpress
Надо брать: новый субфлагман OnePlus 15R дешевле 39 000 рублей на AliExpress
0
9 января
Покупки
Технологии
9 приложений-шагомеров для Android, которые помогут стать активнее
9 приложений-шагомеров для Android, которые помогут стать активнее
0
9 января
Технологии
Технологии
Dreame представила умные кольца с вибрацией, ЭКГ и NFC
Dreame представила умные кольца с вибрацией, ЭКГ и NFC
0
8 января
Новости
Устройства
В ChatGPT появится раздел для консультаций по вопросам здоровья
В ChatGPT появится раздел для консультаций по вопросам здоровья
0
8 января
Новости
Технологии
Как оплачивать покупки в App Store в России
Как оплачивать покупки в App Store в России
0
8 января
iOS
iOS
Бюджетный iPhone 17e сменит «чёлку» на Dynamic Island и будет заметно мощнее
Бюджетный iPhone 17e сменит «чёлку» на Dynamic Island и будет заметно мощнее
0
7 января
Новости
Устройства
Сервисы и приложения, которые помогут вам достичь своих целей в новом году
Сервисы и приложения, которые помогут вам достичь своих целей в новом году
0
6 января
Технологии
Технологии
Представлен Honor Power2 — смартфон с батареей 10 080 мА·ч и дизайном iPhone 17 Pro
Представлен Honor Power2 — смартфон с батареей 10 080 мА·ч и дизайном iPhone 17 Pro
0
6 января
Новости
Устройства
Lego представила Smart Brick — деталь-компьютер, которая оживляет целые наборы
Lego представила Smart Brick — деталь-компьютер, которая оживляет целые наборы
0
6 января
Новости
Устройства
Названы 19 устройств Xiaomi, поддержка которых завершится в 2026 году
Названы 19 устройств Xiaomi, поддержка которых завершится в 2026 году
0
5 января
Новости
Устройства
Представлены умные очки Xreal 1S с функцией 3D-конвертации любого контента
Представлены умные очки Xreal 1S с функцией 3D-конвертации любого контента
0
5 января
Новости
Устройства
На CES 2026 показали настольную ИИ-лампу Obboto в виде сферы из Лас-Вегаса
На CES 2026 показали настольную ИИ-лампу Obboto в виде сферы из Лас-Вегаса
0
5 января
Новости
Устройства
Как установить «СберБанк Онлайн», «Т-Банк», «Альфа-Банк» и не только на iPhone
Как установить «СберБанк Онлайн», «Т-Банк», «Альфа-Банк» и не только на iPhone
0
5 января
Ликбез
Технологии
Представлен ретро-смартфон Clicks Communicator с QWERTY‑клавиатурой
Представлен ретро-смартфон Clicks Communicator с QWERTY‑клавиатурой
0
4 января
Новости
Устройства
Pebble перезапустила свои самые тонкие часы с новой моделью Pebble Round 2
Pebble перезапустила свои самые тонкие часы с новой моделью Pebble Round 2
0
4 января
Новости
Устройства

Новые комментарии

Аватар автора комментария
Svetlana G1 час назад

0 / 0

А чем занимается ваша жена?
Что я поняла, когда после долгого перерыва начала жить одна
Аватар автора комментария
andrew babey1 час назад

0 / 0

копать снег
Как быстро скинуть то, что наели за новогодние каникулы
Аватар автора комментария
Vidmantas Siauciulis2 часа назад

0 / 0

Мне бы хотелось полностью доминировать над девушкой в жизни. Решать, какую одежду и какую прическу она должна носить. И хотелось, чтобы она полностью доминировала надо мной в сексе... Но без унижений и избиений. Чтобы подняла меня, прижала к себе, а я я целовал ее грудь и губы... Потом опустила меня на колени, сжала голову бедрами, и заставила делатть куни...
Что важно знать тем, кто хочет попробовать женское доминирование
Аватар автора комментария
Vidmantas Siauciulis2 часа назад

0 / 0

Мне бы хотелось полностью доминировать над девушкой в жизни... Решать, какую одежду и прическу она должна носить... И хотелось, чтобы она полностью доминировала надо мной в сексе... Но без избиений и унижений... Ну, чтобы она меня подняла, прижала к себе, я целовал ее грудь и губы... Потом поставила на колени, зажала голову ногами и заставила делать куни...
Что важно знать тем, кто хочет попробовать женское доминирование
Приоритетная задача! Чек-лист отдыха на праздниках

Приоритетная задача! Чек-лист отдыха на праздниках

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях