Лайфхакер
Лайфхакер
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Реши за меня
Добрые новости
Стыдные вопросы
Есть мнение
Норм или стрём
Личный опыт
Объясняем за минуту
Сервисы
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Это интересно
7 мифов об уколах для похудения

7 мифов об уколах для похудения

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

Построить карьеру просто: 5 классных возможностей для тех, кто начинает свой путь на рынке труда

Построить карьеру просто: 5 классных возможностей для тех, кто начинает свой путь на рынке труда

4 вещества в организме, дисбаланс которых может помешать сбросить вес

4 вещества в организме, дисбаланс которых может помешать сбросить вес

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
Страдания того стоят: почему я влюбилась в соулслайки и советую их всем
Страдания того стоят: почему я влюбилась в соулслайки и советую их всем
0
Вчера
Технологии
Технологии
Названы смартфоны основных брендов, которые получат Android 17
Названы смартфоны основных брендов, которые получат Android 17
0
Вчера
Android
Новости
Представлен смарт-браслет Amazfit Helio Strap Pro с двумя дополнительными трекерами
Представлен смарт-браслет Amazfit Helio Strap Pro с двумя дополнительными трекерами
0
Вчера
Новости
Устройства
«Крёстный отец ИИ» рассказал, почему индустрия скоро может рухнуть
«Крёстный отец ИИ» рассказал, почему индустрия скоро может рухнуть
0
19 июня
Новости
Технологии
«Дыра в реальности»: учёные создали автомобильную краску, поглощающую почти весь свет
«Дыра в реальности»: учёные создали автомобильную краску, поглощающую почти весь свет
0
19 июня
Новости
Технологии
Представлен «умный» защитный жилет для бега — с радаром, GPS и системой оповещения
Представлен «умный» защитный жилет для бега — с радаром, GPS и системой оповещения
0
19 июня
Новости
Устройства
В пару кликов: как выйти из семейной группы «Яндекса» или удалить другого пользователя
В пару кликов: как выйти из семейной группы «Яндекса» или удалить другого пользователя
0
19 июня
Технологии
Технологии
В DeepSeek появилось распознавание изображений — нейросеть не узнала своего создателя
В DeepSeek появилось распознавание изображений — нейросеть не узнала своего создателя
0
19 июня
Новости
Технологии
Смартфоны Samsung смогут проверять здоровье домашних животных по фотографии
Смартфоны Samsung смогут проверять здоровье домашних животных по фотографии
0
19 июня
Новости
Технологии
Xreal представила Aura — AR-очки на Android XR с отдельным вычислительным блоком
Xreal представила Aura — AR-очки на Android XR с отдельным вычислительным блоком
0
18 июня
Новости
Устройства
Представлены Jaye Band — миниатюрные умные часы только для самых важных уведомлений
Представлены Jaye Band — миниатюрные умные часы только для самых важных уведомлений
0
18 июня
Новости
Устройства
Google тестирует «капчу», для которой нужна камера — в Сети метод назвали сомнительным
Google тестирует «капчу», для которой нужна камера — в Сети метод назвали сомнительным
0
18 июня
Новости
Технологии
Авторитетный инсайдер полностью рассекретил складной iPhone Ultra
Авторитетный инсайдер полностью рассекретил складной iPhone Ultra
0
18 июня
Новости
Устройства
От нейрокартинок к прорыву в медицине: Midjourney показала ИИ-сканер тела, который может заменить МРТ
От нейрокартинок к прорыву в медицине: Midjourney показала ИИ-сканер тела, который может заменить МРТ
0
18 июня
Новости
Технологии
От подоконника до сада: 6 полезных приложений для ухода за растениями
От подоконника до сада: 6 полезных приложений для ухода за растениями
0
18 июня
Технологии
Технологии

Новые комментарии

Аватар автора комментария
Евгения Коваль28 минут назад

0 / 0

Спасибо за интересную информацию)
Как запоминать новую информацию: 8 простых способов
Аватар автора комментария
Евгения Коваль29 минут назад

0 / 0

Спасибо за интересную информацию)
Как запоминать новую информацию: 8 простых способов
Аватар автора комментария
Sergey Zhdanov4 часа назад

0 / 0

У моющего пылесоса Neatsvor хорошая уборка вдоль стен: он хорошо проходит по краям и вычищает грязь даже из щелей у плинтусов и в углах.
Как выбрать моющий пылесос и не пожалеть о покупке
Аватар автора комментария
Uttake Uttake5 часов назад

0 / 0

Я тоже)
ТЕСТ: Какой вы волшебный предмет из русских сказок?
Как начать карьеру в телекоме: 3 реальные истории от сотрудников Т2

Как начать карьеру в телекоме: 3 реальные истории от сотрудников Т2

Реклама
Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях