OpenAI выпустила o1 — свою первую модель со способностью рассуждать

Она сама может проверять факты и исправлять ошибки.

OpenAI выпустила свою новейшую генеративную модель под названием o1. Это первая ласточка в запланированной серии «рассуждающих» нейросетей, обученных отвечать на сложные вопросы быстрее людей. Её представили вместе с o1-mini — меньшей и более дешёвой версией. Судя по всему, это и есть разрекламированный проект Strawberry, который, как сообщалось, был засекречен даже внутри компании.

⚡️Новости из мира гаджетов, обзоры, гайды и не только — в телеграм-канале «Технологии | Лайфхакер».

Изображение: OpenAI

Это очередной шаг создателей ChatGPT к своей ключевой цели — созданию искусственного интеллекта, сравнимого с человеческим разумом. Если говорить о практических новшествах, то новинка лучше справляется с написанием кода и решением многошаговых задач по сравнению с предшественниками. Но она также дороже и медленнее. Поэтому для повседневных дел лучше использовать старые инструменты. 

Модель также способна самостоятельно исправлять ошибки, используя технику обучение с подкреплением (Reinforcement Learning, RL) — систему поощрений и штрафов. Ещё она умеет запускать «цепочку мыслей» для обработки запросов, подобно тому, как люди справляются с трудностями — шаг за шагом. Другими словами, она сама может проверять себя и делать определённые выводы на будущее, сохраняя их в своей памяти. При всём этом полностью избавиться от галлюцинаций ещё не удалось, признались разработчики. Проблема остаётся, но уже в гораздо меньшей степени. 

Зато в математике она уже почти как рыба в воде. Для сравнения: GPT-4o правильно решила только 13% задач из программы Международной математической олимпиады, а o1 набрала 83%.

Она определённо лучше справляется с тестом по математике AP, чем я, а я изучал математику в колледже.

Боб МакГрю

Главный научный сотрудник OpenAI

Обучение, лежащее в основе o1, принципиально отличается от предыдущих методов, рассказал руководитель исследований в компании Джерри Творек. С ней использовали другие алгоритмы и новый набор данных. Компания называет релиз «предварительным просмотром», чтобы подчеркнуть, что она ещё молода.

Пользователи ChatGPT Plus и Team получают o1 и o1-mini уже сегодня. Клиенты Enterprise и Edu смогут начать испытывать их в начале следующей недели. Позже OpenAI обещает сделать «мини» общедоступной.

Это упрощённая версия страницы.

Читать полную версию
Обложка: OpenAI
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter