OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

OpenAI обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.
Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.
















Лучшие предложения
Как максимально сэкономить на AliExpress в мае
Надо брать: кроссовки для долгих прогулок от Golden Camel со скидкой 55%
10 товаров с маркетплейсов, которые подарят радость на этой неделе
Двухканальный регистратор 70mai A810S отдают со скидкой 55% на AliExpress
10 футболок с принтами, которые говорят за нас
Находки AliExpress: самые интересные и полезные товары недели
15 классных товаров с майской распродажи на AliExpress
Надо брать: портативная колонка от Tribit с чистым звучанием
Как поддержать подростка с избыточным весом? Чек-лист для родителей
Мас-рестлинг, хуреш и ещё 5 необычных национальных видов спорта России
Весеннее обострение мошенников: уловки, о которых важно знать, чтобы провести майские без проблем
3 причины, почему не стоит бояться поменять интернет-провайдера