OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

OpenAI обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.
Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.
















Лучшие предложения
10 покупок с AliExpress, за которые люди благодарят себя
Надо брать: 3D-принтер Bambu Lab А1 Mini со скидкой 48%
«Дни выгоды» на AliExpress: экономим до 86% на важных покупках
Надо брать: массивные кроссовки от Xtep со скидкой 53%
10 товаров с маркетплейсов, на которые стоит обратить внимание на этой неделе
Со скидкой 54% отдают новинку realme 16 на AliExpress
Находки AliExpress: самые интересные и полезные товары недели
Надо брать: автомобильный пылесос Baseus A5 со скидкой 38%
Что такое «Тирзетта» и как она работает
Лайфхакер и TRENDY BOX выпустили унисекс-бьюти-бокс — смотрите, что внутри
Что нужно знать о кислородном пятновыводителе «Елизар»: 3 главных вопроса
Это наша БигДанность: как большие данные работают в повседневной жизни
Реклама