Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
«Авторизация»
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Самую популярную болгарку от Yofidra отдают с приятной скидкой

Самую популярную болгарку от Yofidra отдают с приятной скидкой

10 товаров с маркетплейсов, достойных внимания на этой неделе

10 товаров с маркетплейсов, достойных внимания на этой неделе

QLED-телевизор от Hyundai

Надо брать: 50-дюймовый QLED-телевизор от Hyundai с Android TV

10 вещей для сумки: они нужны нам все

10 вещей для сумки: они нужны нам все

Nahodki AliExpress: samye interesnye i poleznye tovary nedeli

Находки AliExpress: самые интересные и полезные товары недели

Товары с AliExpress с быстрой доставкой

10 классных товаров с AliExpress с быстрой доставкой

12 платьев, чтобы стать главным цветочком в городе

12 платьев, чтобы стать главным цветочком в городе

10 хороших рюкзаков-трансформеров с регулируемым объёмом

10 хороших рюкзаков-трансформеров с регулируемым объёмом

Это интересно
Что нужно знать о кислородном пятновыводителе «Елизар»: 3 главных вопроса

Что нужно знать о кислородном пятновыводителе «Елизар»: 3 главных вопроса

5 причин купить моющий пылесос для мягкой мебели и ковров Tefal Clean It IZ5020F0

5 причин купить моющий пылесос для мягкой мебели и ковров Tefal Clean It IZ5020F0

Реклама
Не только бюджет: 3 вопроса, которые стоит задать себе при выборе квартиры для жизни с партнёром

Не только бюджет: 3 вопроса, которые стоит задать себе при выборе квартиры для жизни с партнёром

Это наша БигДанность: как большие данные работают в повседневной жизни

Это наша БигДанность: как большие данные работают в повседневной жизни

Реклама
Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
Наушники с ANC внутри смарт-часов: Huawei представила Watch Buds 2
Наушники с ANC внутри смарт-часов: Huawei представила Watch Buds 2
0
16:44
Новости
Устройства
Huawei представила Pura X Max — широкую раскладушку с обновлённым дизайном и улучшенными камерами
Huawei представила Pura X Max — широкую раскладушку с обновлённым дизайном и улучшенными камерами
0
13:30
Новости
Устройства
Перископ на 200 Мп и антибликовый экран: Huawei представила флагманскую серию Pura 90
Перископ на 200 Мп и антибликовый экран: Huawei представила флагманскую серию Pura 90
0
13:10
Новости
Устройства
Как перенести данные с Google Drive на «Яндекс Диск» или в другое облако
Как перенести данные с Google Drive на «Яндекс Диск» или в другое облако
0
10:00
Технологии
Технологии
Эксперты рассказали, как долго продлится дефицит оперативной памяти в мире
Эксперты рассказали, как долго продлится дефицит оперативной памяти в мире
0
09:46
Новости
Технологии
Как выбрать моющий пылесос и не пожалеть о покупке
Как выбрать моющий пылесос и не пожалеть о покупке
0
Вчера
Технологии
Технологии
Сделают красиво: 7 лучших нейросетей для визуализации данных
Сделают красиво: 7 лучших нейросетей для визуализации данных
0
18 апреля
Технологии
Технологии
Макет «квадратного» iPhone Fold впервые показали на фото
Макет «квадратного» iPhone Fold впервые показали на фото
0
17 апреля
Новости
Устройства
Интернет блокируют: что скачать и как настроить телефон, чтобы он не превратился в «кирпич»
Интернет блокируют: что скачать и как настроить телефон, чтобы он не превратился в «кирпич»
0
17 апреля
Технологии
Технологии
Странный ассортимент и забытые сотрудники: ИИ открыл полноценный офлайн-магазин
Странный ассортимент и забытые сотрудники: ИИ открыл полноценный офлайн-магазин
0
17 апреля
Новости
Технологии
Какой смартфон купить в 2026 году: помогаем выбрать и отвечаем на вопросы в комментариях
Какой смартфон купить в 2026 году: помогаем выбрать и отвечаем на вопросы в комментариях
0
17 апреля
Технологии
Технологии
3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день
3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день
0
16 апреля
Устройства
Устройства
Samsung показала, как изолировать мессенджер Max на смартфонах Galaxy через папку Knox
Samsung показала, как изолировать мессенджер Max на смартфонах Galaxy через папку Knox
0
16 апреля
Новости
Технологии
Обзор HUAWEI nova 15 Pro — большого и автономного смартфона с отличными камерами
Обзор HUAWEI nova 15 Pro — большого и автономного смартфона с отличными камерами
0
16 апреля
Устройства
Устройства
Samsung готовит аналог складного iPhone, но в формате трифолда
Samsung готовит аналог складного iPhone, но в формате трифолда
0
16 апреля
Новости
Устройства

Новые комментарии

Аватар автора комментария
Андрей Андрей4 минуты назад

0 / 0

Там на OZONе уже первый отзыв есть китайской разблокированной версии телефона OnePlus 15t. И отзыв очень хороший
Какой смартфон купить в 2026 году: помогаем выбрать и отвечаем на вопросы в комментариях
Аватар автора комментария
Артём Козориз10 минут назад

0 / 0

Ну, тут как посмотреть. ЦА всего, что вы упомянули и так об этом знает. А эта статья рассчитана на обычных людей, которые не захотят возиться с настройками и консолью. Но за дополнение спасибо!
Как перенести данные с Google Drive на «Яндекс Диск» или в другое облако
Аватар автора комментария
Wow Wow11 минут назад

0 / 0

Боже, как же я обожаю, когда люди делятся искренней радостью. Они буквально светятся. Жизнь одна, так что радуетесь и смейтесь от души
Счастье не любит тишину — это нытики запрещают вам радоваться жизни
Аватар автора комментария
Радко Карамич49 минут назад

+1 / 0

Снова годноту кинул, П.И.У.
Сделают красиво: 7 лучших нейросетей для визуализации данных
3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день

3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании«Авторизация»
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях