OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

OpenAI обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.
Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.
















Лучшие предложения
Забираем за полцены пусковое устройство с кучей полезных функций
Экономим на пальчиковых батарейках с аккумуляторным вариантом от imuto
10 наборов ручных инструментов, которые должны быть у каждого
Надо брать: надёжная дрель-шуруповёрт от Kolner со скидкой 70%
10 пар тёплой обуви от популярных брендов с приятными ценами
Надо брать: микроволновка от Tuvio со скидкой 58% и тысячами довольных отзывов
9 очень разных, но одинаково удобных пар джинсов с высокой посадкой
Свежий смартфон POCO M8 Pro отдают со скидкой 56% на AliExpress
Самый большой или самый длинный? 7 главных катков России
Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть
Правда ли, что диабет молодеет? Разбираемся с эндокринологом
Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов