Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Бежим с Лайфхакером
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Эти товары сделали нашу неделю ярче и теплее

Эти товары сделали нашу неделю ярче и теплее

Надо брать: лёгкий электросамокат от Segway Ninebot со скидкой 60%

Надо брать: лёгкий электросамокат от Segway Ninebot со скидкой 60%

Скидки до 90% на «Великой китайской распродаже» уже скоро

Скидки до 90% на «Великой китайской распродаже» уже скоро

Каркасный бассейн от Bestway

Долговечный каркасный бассейн от Bestway отдают со скидкой 68%

Эти 10 пар кроссовок одинаково хороши для спорта и прогулок

Эти 10 пар кроссовок одинаково хороши для спорта и для прогулок

Надо брать: бюджетный робот — мойщик окон от RutBot со скидкой 84%

Надо брать: бюджетный робот — мойщик окон от RutBot со скидкой 84%

В ожидании летней распродажи: 10 товаров из нашей корзины на AliExpress

В ожидании летней распродажи: 10 товаров из нашей корзины на AliExpress

Водонагреватель от Midea

Забираем простой в управлении водонагреватель от Midea со скидкой 33%

Это интересно
От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

Семейный туризм без перегруза: как организовать отдых и куда поехать с детьми в России

Семейный туризм без перегруза: как организовать отдых и куда поехать с детьми в России

ИГРА: Настоящие чемпионы. Найдите своего идеального союзника в мире еды

ИГРА: Настоящие чемпионы. Найдите своего идеального союзника в мире еды

3 факта о работе собак-поводырей, которые вы наверняка не знали

3 факта о работе собак-проводников, которые вы наверняка не знали

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
15 аксессуаров Baseus и Ugreen, которые подешевеют на большой распродаже AliExpress
15 аксессуаров Baseus и Ugreen, которые подешевеют на большой распродаже AliExpress
0
Вчера
Устройства
Устройства
Американец превратил ChatGPT в своего цифрового клона с помощью данных из Reddit и Google
Американец превратил ChatGPT в своего цифрового клона с помощью данных из Reddit и Google
0
Вчера
Новости
Технологии
Honor представила игровой смартфон Win Turbo с гигантской батареей на 10 000 мА⋅ч
Honor представила игровой смартфон Win Turbo с гигантской батареей на 10 000 мА⋅ч
0
29 мая
Новости
Устройства
В корзину: 15 смартфонов, которые подешевеют на грядущей распродаже AliExpress
В корзину: 15 смартфонов, которые подешевеют на грядущей распродаже AliExpress
0
29 мая
Устройства
Устройства
На замену Booking и Airbnb: 12 сервисов для поиска отелей и квартир в России
На замену Booking и Airbnb: 12 сервисов для поиска отелей и квартир в России
0
29 мая
Веб-сервисы
Как жить
10 лучших аккумуляторных триммеров для травы, чтобы косить в своё удовольствие
10 лучших аккумуляторных триммеров для травы, чтобы косить в своё удовольствие
0
29 мая
Технологии
Технологии
Представлены смартфоны Xiaomi 17T и 17T Pro — оба с 5‑кратным перископом
Представлены смартфоны Xiaomi 17T и 17T Pro — оба с 5‑кратным перископом
0
28 мая
Новости
Устройства
Обзор Huawei Watch Fit 5 Pro — теперь с сапфировым стеклом
Обзор Huawei Watch Fit 5 Pro — теперь с сапфировым стеклом
0
28 мая
Устройства
Устройства
Обзор Honor 600 — приятного смартфона с хорошим балансом характеристик
Обзор Honor 600 — приятного смартфона с хорошим балансом характеристик
0
28 мая
Устройства
Устройства
Музыка нас связала: Windows 11 теперь позволяет подключать две пары наушников одновременно
Музыка нас связала: Windows 11 теперь позволяет подключать две пары наушников одновременно
0
28 мая
Windows
Новости
Лучшие смартфоны мая
Лучшие смартфоны мая
0
28 мая
Устройства
Устройства
В Windows 11 появилась функция, сильно ускоряющая работу системы — вот как её включить
В Windows 11 появилась функция, сильно ускоряющая работу системы — вот как её включить
0
28 мая
Windows
Новости
Теперь не проведёшь: YouTube начал автоматически помечать реалистичные ИИ-видео
Теперь не проведёшь: YouTube начал автоматически помечать реалистичные ИИ-видео
0
27 мая
Новости
Технологии
Жизнь после смартфонов: какие гаджеты скоро могут сменить привычные мобильники
Жизнь после смартфонов: какие гаджеты скоро могут сменить привычные мобильники
0
27 мая
Технологии
Технологии
Xiaomi обновила электроотвёртку Mijia — теперь заряда хватает на 600 винтов
Xiaomi обновила электроотвёртку Mijia — теперь заряда хватает на 600 винтов
0
27 мая
Новости
Устройства

Новые комментарии

Аватар автора комментария
Alexanches31 минуту назад

0 / 0

Зачем менять Office365 на что-то, чтобы потом это что-то менять на Office365? И еще, в Teamly, чтобы пользоваться нормально функционалом таблиц, придется заплатить. Ограничение не только по кол-ву человек там. Ну и важно все же наличие мобильных приложений именно, а не просто веб-версий. Об этом в статье не нашел.
Чем заменить «Google Документы» и «Таблицы»: 7 бесплатных офисных веб-сервисов
Аватар автора комментария
Kristina Polyakova51 минуту назад

0 / 0

Регулярно обращаюсь в эту фирму за теплотехникой, газовыми котлами и колонками. Однозначно рекомендую данный сервис, так как он отличается высоким уровнем обслуживания. Это компания - https://www.teplospeccentr.ru/katalog_oborudovaniya/gazovyie_kolonki/.
Какой обогреватель выбрать, чтобы точно было тепло
Аватар автора комментария
Иван Иванов2 часа назад

0 / 0

1. Где брать деньги, как работать? 2. Ребенок, общение с другими детьми, больница, школа - это все как ложится на кочевую жизнь? Пока малыш маленький, но уже сейчас нужны другие дети. 3. Было ли реально страшно или опасно? Удачи, надеюсь вы найдете свое место, и пусть у вас будет все оооотлично.
Почему мы собрали вещи и стали путешествовать в автодоме: 5 личных причин
Аватар автора комментария
Andrey Parfenyev5 часов назад

0 / 0

Это такой древний навигационный прибор. Работает без интернета. И даже без электричества ;)
Как скачать офлайн-карты «Яндекса»: инструкция для Android и iPhone
ИГРА: Настоящие чемпионы. Найдите своего идеального союзника в мире еды

ИГРА: Настоящие чемпионы. Найдите своего идеального союзника в мире еды

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях