Лайфхакер
Лайфхакер
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Реши за меня
Добрые новости
Стыдные вопросы
Есть мнение
Норм или стрём
Личный опыт
Объясняем за минуту
Сервисы
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Это интересно
ИГРА: Каким покупателем вас видят магазины

ИГРА: Каким покупателем вас видят магазины

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

4 вещества в организме, дисбаланс которых может помешать сбросить вес

4 вещества в организме, дисбаланс которых может помешать сбросить вес

Безопасные покупки: как Ozon бережёт вас от мошенников

Безопасные покупки: как Ozon бережёт вас от мошенников

Реклама
Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
Страдания того стоят: почему я влюбилась в соулслайки и советую их всем
Страдания того стоят: почему я влюбилась в соулслайки и советую их всем
0
Вчера
Технологии
Технологии
Названы смартфоны основных брендов, которые получат Android 17
Названы смартфоны основных брендов, которые получат Android 17
0
Вчера
Android
Новости
Представлен смарт-браслет Amazfit Helio Strap Pro с двумя дополнительными трекерами
Представлен смарт-браслет Amazfit Helio Strap Pro с двумя дополнительными трекерами
0
Вчера
Новости
Устройства
«Крёстный отец ИИ» рассказал, почему индустрия скоро может рухнуть
«Крёстный отец ИИ» рассказал, почему индустрия скоро может рухнуть
0
19 июня
Новости
Технологии
«Дыра в реальности»: учёные создали автомобильную краску, поглощающую почти весь свет
«Дыра в реальности»: учёные создали автомобильную краску, поглощающую почти весь свет
0
19 июня
Новости
Технологии
Представлен «умный» защитный жилет для бега — с радаром, GPS и системой оповещения
Представлен «умный» защитный жилет для бега — с радаром, GPS и системой оповещения
0
19 июня
Новости
Устройства
В пару кликов: как выйти из семейной группы «Яндекса» или удалить другого пользователя
В пару кликов: как выйти из семейной группы «Яндекса» или удалить другого пользователя
0
19 июня
Технологии
Технологии
В DeepSeek появилось распознавание изображений — нейросеть не узнала своего создателя
В DeepSeek появилось распознавание изображений — нейросеть не узнала своего создателя
0
19 июня
Новости
Технологии
Смартфоны Samsung смогут проверять здоровье домашних животных по фотографии
Смартфоны Samsung смогут проверять здоровье домашних животных по фотографии
0
19 июня
Новости
Технологии
Xreal представила Aura — AR-очки на Android XR с отдельным вычислительным блоком
Xreal представила Aura — AR-очки на Android XR с отдельным вычислительным блоком
0
18 июня
Новости
Устройства
Представлены Jaye Band — миниатюрные умные часы только для самых важных уведомлений
Представлены Jaye Band — миниатюрные умные часы только для самых важных уведомлений
0
18 июня
Новости
Устройства
Google тестирует «капчу», для которой нужна камера — в Сети метод назвали сомнительным
Google тестирует «капчу», для которой нужна камера — в Сети метод назвали сомнительным
0
18 июня
Новости
Технологии
Авторитетный инсайдер полностью рассекретил складной iPhone Ultra
Авторитетный инсайдер полностью рассекретил складной iPhone Ultra
0
18 июня
Новости
Устройства
От нейрокартинок к прорыву в медицине: Midjourney показала ИИ-сканер тела, который может заменить МРТ
От нейрокартинок к прорыву в медицине: Midjourney показала ИИ-сканер тела, который может заменить МРТ
0
18 июня
Новости
Технологии
От подоконника до сада: 6 полезных приложений для ухода за растениями
От подоконника до сада: 6 полезных приложений для ухода за растениями
0
18 июня
Технологии
Технологии

Новые комментарии

Аватар автора комментария
Sergey Zhdanov3 часа назад

0 / 0

У моющего пылесоса Neatsvor хорошая уборка вдоль стен: он хорошо проходит по краям и вычищает грязь даже из щелей у плинтусов и в углах.
Как выбрать моющий пылесос и не пожалеть о покупке
Аватар автора комментария
Uttake Uttake3 часа назад

0 / 0

Я тоже)
ТЕСТ: Какой вы волшебный предмет из русских сказок?
Аватар автора комментария
Алексей Седов4 часа назад

0 / 0

Про цеолит ни слова! Уголь это прошлый век.... статья больше воды чем по делу
Кому и зачем действительно стоит принимать сорбенты
Аватар автора комментария
Дарья Громова6 часов назад

0 / 0

С квестами и лором тяжело, да. Возможно, дело отчасти в любви японцев выпускать гайды ко всему (и ожиданиям, что игрок купит книжечку и разберется с ней во всем, что не смог найти сам). Мне в целом это скорее нравится, потому что дает какую-то связь с комьюнити + позволяет после прохождения ещё какое-то время находить новый контент, чтобы закрыть тоску от того, что история закончилась За рекомендации спасибо! Из этого 1000xRESIST и Disco Elysium уже в бэклоге, The Longest Journey добавила (ну и FF XVI, раз уж её в подписку добавили как раз). Про остальное слышала, не особо заинтересовало Я бы сказала, что Таро настолько хорош в истории, что ему прощаются проколы во всём остальном, но тут уж на вкус и цвет
Страдания того стоят: почему я влюбилась в соулслайки и советую их всем
3 крутых функции в приложении Т2, о которых вы должны знать

3 крутых функции в приложении Т2, о которых вы должны знать

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях