Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
НовостиТехнологии
20 июля 2023

Учёные Стэнфорда выяснили: GPT‑4 со временем тупеет

Точность платной версии ChatGPT оказалась ниже, чем у бесплатного чат-бота.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

chatgpt

Новое исследование от учёных Стэнфордского университета подтвердило то, на что пользователи Сети жалуются уже несколько недель: ChatGPT Plus на базе GPT‑4 действительно стала глупее — в отличие от GPT‑3.5, на которой работает бесплатная версия чат-бота.

В своём исследовании авторы сравнивали ответы на разные запросы от чат-бота на базе GPT‑4 и GPT‑3.5. Они обнаружили, что поведение чат-бота и точность ответов на некоторые запросы в новой версии значительно ухудшились.

Авторы сравнивали языковые модели GPT‑4 и GPT‑3.5, выпущенные в марте и январе. Они обнаружили, что за это время точность GPT‑4 заметно упала, тогда как у GPT‑3.5, напротив, выросла.

Например, точность ответа на вопрос, является ли 17077 простым числом, упала на 95,2% — тогда как у GPT‑3.5, напротив, повысилась с 7,4% до 86,8%. Также шанс успешного выполнения написанного нейросетью кода понизилась в актуальных версиях обеих моделей.

Ранее вице-президент OpenAI Питер Велиндер уже отвечал на обвинения пользователей ChatGPT Plus:

Нет, мы не сделали GPT‑4 тупее. Всё с точностью до наоборот: мы делаем каждую новую версию умнее предыдущей.

Сейчас у нас такая гипотеза: когда вы используете что-то более активно, вы начинаете замечать проблемы, которых не видели ранее.

Питер Велиндер

вице-президент по продукту в OpenAI

В одном из ответов на этот твит Велиндер попросил предоставить доказательство, что чат-бот стал работать хуже. Исследование от стэнфордских учёных появилось через 5 дней после этого — и ответа от OpenAI пока не последовало.

Это уже не первый раз, когда GPT‑4 обвиняют в предоставлении недостоверной информации. В марте аналитики NewsGuard обнаружили, что ChatGPT на базе GPT‑4 проще заставить говорить неправду — тогда как сама OpenAI говорит об увеличении точности ответов на 40% по сравнению с GPT‑3.5. В частности, в тестах NewsGuard новая версия нейросети реже опровергала недостоверные сведения — включая неправдивые данные о современных событиях и теории заговоров.

Читайте также
🧐
Джеймс Кэмерон об опасности ИИ: «Я предупреждал вас ещё в 1984-м, но вы не слушали»
8 мифов об искусственном интеллекте, в которые верят даже программисты
7 аналогов ChatGPT
Обложка: кадр из мультсериала «Футурама»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Лучшая цена на полноразмерные наушники от Edifier сейчас на AliExpress

Лучшая цена на полноразмерные наушники от Edifier сейчас на AliExpress

Автоматическая кофемашина от DeLonghi 

Надо брать: автоматическая кофемашина от DeLonghi со скидкой 23%

Nahodki AliExpress: samye interesnye i poleznye tovary nedeli

Находки AliExpress: самые интересные и полезные товары недели

15 товаров с AliExpress для тех, кому надоел интерьер дома

15 товаров с AliExpress для тех, кому надоел интерьер дома

Надо брать: демисезонные кроссовки от Baasploa со скидкой 69%

Надо брать: демисезонные кроссовки от Baasploa со скидкой 69%

Вещи для радости

10 вещей с маркетплейсов, которые порадовали нас на этой неделе

Робот-пылесос Roborock Qrevo C Pro

Флагманский робот-пылесос от Roborock отдают со скидкой 56% на AliExpress

10 популярных товаров с приличными скидками на AliExpress

10 популярных товаров с приличными скидками на AliExpress

Это интересно
3 настолки, которые можно подарить на любой праздник

3 настолки, которые можно подарить на любой праздник

Российский Красный Крест открывает набор на профессиональные курсы с возможностью бесплатного обучения

Российский Красный Крест открывает набор на профессиональные курсы с возможностью бесплатного обучения

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Как найти покупателей без помощи социальных сетей

Как найти покупателей без помощи социальных сетей

Комментарии
Виктор Подволоцкий
20.07.23 22:10
Во всём на человека похож, ну ты посмотри на него!
Чорний Михайло
21.07.23 00:45
Я думал учёные стэндофа
Что вы могли пропустить
В ChatGPT появился Shazam: бот теперь умеет определять и находить песни
В ChatGPT появился Shazam: бот теперь умеет определять и находить песни
0
20:21
Новости
Технологии
11 программ для диагностики компьютера, которые должны быть под рукой
11 программ для диагностики компьютера, которые должны быть под рукой
0
18:00
Технологии
Технологии
От ChatGPT до GigaChat: названы 100 лучших ИИ-сервисов в мире
От ChatGPT до GigaChat: названы 100 лучших ИИ-сервисов в мире
0
15:40
Новости
Технологии
Технология красоты: 3 продвинутых гаджета Dreame для ухода за собой, которые по-настоящему удивят
Технология красоты: 3 продвинутых гаджета Dreame для ухода за собой, которые по-настоящему удивят
15:00
Устройства
Устройства
18 бесплатных видеоредакторов для компьютера и смартфона
18 бесплатных видеоредакторов для компьютера и смартфона
0
13:00
Ликбез
Технологии
«Матрица для мухи»: учёные воссоздали мозг дрозофилы и подключили к виртуальному телу в симуляции
«Матрица для мухи»: учёные воссоздали мозг дрозофилы и подключили к виртуальному телу в симуляции
0
12:43
Новости
Технологии
iPhone Ultra и не только: Apple готовит линейку устройств сверхпремиального уровня
iPhone Ultra и не только: Apple готовит линейку устройств сверхпремиального уровня
0
10:10
Новости
Устройства
Технолайфхак: как прочитать удалённое собеседником сообщение в месенджерах на Android 
Технолайфхак: как прочитать удалённое собеседником сообщение в месенджерах на Android 
0
8 марта
Технологии
Технологии
Личный опыт: 4 месяца с iPhone 17 — лучшим и скучнейшим айфоном 2026 года
Личный опыт: 4 месяца с iPhone 17 — лучшим и скучнейшим айфоном 2026 года
0
7 марта
Устройства
Устройства
Есть тревожные звоночки: в масштабном исследовании оценили влияние ИИ на рынок труда
Есть тревожные звоночки: в масштабном исследовании оценили влияние ИИ на рынок труда
0
6 марта
Новости
Технологии
AnTuTu обновил рейтинг Android-смартфонов с лучшим соотношением цены и производительности
AnTuTu обновил рейтинг Android-смартфонов с лучшим соотношением цены и производительности
0
6 марта
Новости
Устройства
Появились первые результаты тестов производительности MacBook Neo
Появились первые результаты тестов производительности MacBook Neo
0
6 марта
Новости
Устройства
Как пользоваться нейросетью Nano Banana в 2026 году
Как пользоваться нейросетью Nano Banana в 2026 году
0
6 марта
Ликбез
Технологии
Deveillance представила Spectre I — гаджет, который не даёт другим устройствам вас прослушивать
Deveillance представила Spectre I — гаджет, который не даёт другим устройствам вас прослушивать
0
6 марта
Новости
Устройства
Google начала наказывать Android‑приложения за быстрый расход батареи
Google начала наказывать Android‑приложения за быстрый расход батареи
0
6 марта
Android
Новости

Новые комментарии

Аватар автора комментария
Алексей Хромов21 минуту назад

0 / 0

Ого, у людей бывают разные мнения
5 причин посмотреть «Сентиментальную ценность» — номинанта на «Оскар-2026»
Аватар автора комментария
Horugvi48 минут назад

0 / 0

долин сказал говно
5 причин посмотреть «Сентиментальную ценность» — номинанта на «Оскар-2026»
Аватар автора комментария
Рустам Гайфиев1 час назад

0 / 0

А нахуя домохозяйке сопрягать две базы !?
«Все будут писать код»: создатель Claude Code заявил, что 2026 год может стать последним для профессии разработчика
Аватар автора комментария
Александр1 час назад

0 / 0

Все верно большой фаллос ОЧЕНЬ ЧАСТО проблема!!!!!мой размер за 20 см, и супруга прри вагинальном сексе изначально чувствовала дискомфорт,поэтому стали использовать ограничительные кольца!!!!!но со временем она стала фанатской анального секса и даже испытывает периодически дикий анальный оргазм!!!!!так что это нас и спасло уже много лет только оральный и анальный секс!!!!!!
Как заниматься сексом, если у партнёра слишком большой член
Как найти покупателей без помощи социальных сетей

Как найти покупателей без помощи социальных сетей

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях