OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

OpenAI обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.
Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.
















Лучшие предложения
Сейчас со скидкой: 15 отличных товаров на AliExpress
Вы давно этого хотели: 5 новогодних подарков от Dreame, которые пора уже себе купить
15 вещей из новогоднего вишлиста команды Лайфхакера
Берём в подарок беспроводные наушники от JBL
Надо брать: робот-пылесос Roborock Qrevo S со скидкой 55%
Что подарить девушке на Новый год
Тратим последнее на тот самый Kinder Joy с персонажами из «Очень странных дел»
Берём в подарок 3D-принтер от Creality со скидкой 62%
«А что, так можно было?» 8 способов пересмотреть свои онлайн-привычки
3 фактора, которые влияют на качество вашего сна
Как выбрать апарт-отель для инвестиций и зачем это нужно
Платежи с кешбэком и без комиссий. Как приложение Газпромбанка облегчит вам жизнь