Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Декабрь без стресса
🎁 Подарки на Новый год
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Бытовая техника, которую не стыдно дарить на Новый год

Бытовая техника, которую не стыдно дарить на Новый год

Как работает распродажа на Ozon c точки зрения продавца и покупателя

Как работает распродажа на Ozon c точки зрения продавца и покупателя

вечерние платья на новогодний корпоратив

15 вечерних платьев со скидками до 90%, чтобы сиять как ёлочка

Берём в подарок смарт-часы Samsung Galaxy Watch 7 со скидкой 41%

Берём в подарок смарт-часы Samsung Galaxy Watch 7 со скидкой 41%

Пусковое устройство от Baseus, которое пригодится зимой. Сейчас на него скидка 48%

Пусковое устройство от Baseus, которое пригодится зимой. Сейчас на него скидка 48%

Chto podarit' mal'chiku na Novyj god: 15 klassnyh idej

Что подарить мальчику на Новый год: 15 классных идей

Берём в подарок планшет Huawei MatePad 11.5 с высоким рейтингом покупателей

Берём в подарок планшет Huawei MatePad 11.5 с высоким рейтингом покупателей

Надо брать: беспроводная зарядная станция Ugreen MagFlow со скидкой 43%

Надо брать: беспроводная зарядная станция Ugreen MagFlow со скидкой 43%

Это интересно
Подготовка к беременности: где бесплатно пройти обследования и получить поддержку

Подготовка к беременности: где бесплатно пройти обследования и получить поддержку

Как меняется «Битрикс24»: девять комментариев из интернета, которые давно не актуальны

Как меняется «Битрикс24»: девять комментариев из интернета, которые давно не актуальны

Реклама
Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Приоритетная задача! Чек-лист отдыха на праздниках

Приоритетная задача! Чек-лист отдыха на праздниках

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов
Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов
11:00
Технологии
Технологии
OpenAI представила флагманский генератор картинок GPT Image 1.5 — он похож на Nano Banana
OpenAI представила флагманский генератор картинок GPT Image 1.5 — он похож на Nano Banana
0
09:46
Новости
Технологии
20 отличных фитнес-трекеров и смарт-часов в 2026 году
20 отличных фитнес-трекеров и смарт-часов в 2026 году
0
Вчера
Ликбез
Устройства
10 бесплатных онлайн-сервисов, чтобы сделать гифку из видео
10 бесплатных онлайн-сервисов, чтобы сделать гифку из видео
0
15 декабря
Технологии
Технологии
Проигрыватель в подарок: 3 варианта на разный бюджет
Проигрыватель в подарок: 3 варианта на разный бюджет
0
15 декабря
Устройства
Устройства
Как выбрать кофемашину для дома и не разочароваться
Как выбрать кофемашину для дома и не разочароваться
0
14 декабря
Ликбез
Технологии
Telegram представил новые функции в приложении — и подколол мессенджер Max
Telegram представил новые функции в приложении — и подколол мессенджер Max
0
13 декабря
Новости
Технологии
Как посмотреть свои игровые итоги 2025 года на PlayStation в России
Как посмотреть свои игровые итоги 2025 года на PlayStation в России
0
13 декабря
Технологии
Технологии
Windows 11 позволит запускать Android‑приложения в полноэкранном режиме
Windows 11 позволит запускать Android‑приложения в полноэкранном режиме
0
13 декабря
Windows
Новости
Новая теория заговора: библиотекари скрывают книги, которые советует ChatGPT
Новая теория заговора: библиотекари скрывают книги, которые советует ChatGPT
0
12 декабря
Новости
Технологии
Рататуй в мире гаджетов: представлен ИИ-куб для оценки степени готовности блюд
Рататуй в мире гаджетов: представлен ИИ-куб для оценки степени готовности блюд
0
12 декабря
Новости
Устройства
«Сбер» запустил оплату картами «Мир» со смарт‑часов — без интернета и смартфона рядом
«Сбер» запустил оплату картами «Мир» со смарт‑часов — без интернета и смартфона рядом
0
12 декабря
Новости
Технологии
Что такое конвекция в духовке и зачем она нужна
Что такое конвекция в духовке и зачем она нужна
0
12 декабря
Ликбез
Технологии
WhatsApp заново изобрёл голосовую почту — теперь можно отправлять аудио- и видеоответы на пропущенные
WhatsApp заново изобрёл голосовую почту — теперь можно отправлять аудио- и видеоответы на пропущенные
0
12 декабря
Новости
Технологии
Google показала инновационный браузер Disco — он создаёт мини-приложения под задачу на лету
Google показала инновационный браузер Disco — он создаёт мини-приложения под задачу на лету
0
12 декабря
Браузеры
Новости

Новые комментарии

Аватар автора комментария
Vinera Don51 минуту назад

0 / 0

Мне тоже так кажется. Жду, когда все серии выйдут, что бы разом все посмотреть ))
Состоялась премьера второго сезона сериала Fallout — с 98% «свежести» на Rotten Tomatoes
Аватар автора комментария
Vinera Don52 минуты назад

0 / 0

О да... Фильм на года. Я в детстве его ещё видела, а сейчас уже ребенок мой смотрит
«Пятый элемент» снова покажут в России — впервые в 4K-реставрации
Аватар автора комментария
Полина Накрайникова53 минуты назад

0 / 0

мне кажется, вафельница такая крутая тема, и что важно, можно взять нормальную за не очень много денег. это мы заносим в идеи подарков
Бытовая техника, которую не стыдно дарить на Новый год
Аватар автора комментария
Vinera Don54 минуты назад

0 / 0

Ну как я поняла, что кинокритики посмотрели и высказали своё мнение.
Дорогущий «Аватар-3» может провалиться — он получил всего 68% на Rotten Tomatoes
Задача — дойти до школы самому: как подготовить ребёнка и убедиться, что всё будет в порядке 

Задача — дойти до школы самому: как подготовить ребёнка и убедиться, что всё будет в порядке  

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях