OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

OpenAI обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.
Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.
















Лучшие предложения
5 пусковых устройств для автомобиля, которые можно выгодно купить на «чёрной пятнице»
Эта светодиодная лента создаёт волшебную атмосферу и стоит меньше двух тысяч рублей
Надо брать: машинка для стрижки от Xiaomi со скидкой 72%
Выбрасываем телевизор и забираем проектор Wanbo Mozart 1 Pro с хорошей скидкой
Баланс цены и мощности: 4 игровых ПК DigitalRazor Core до 142 000 рублей
25 очаровательных товаров для дома, которые можно купить со скидкой
15 достойных внимания товаров со скидками до 67% на «чёрной пятнице»
iPhone 17 Pro подешевеет до 99 990 рублей в «чёрную пятницу». Добавляйте в корзину сейчас!
Нейросети меняют рынок труда. Что нужно сделать сегодня, чтобы оставаться востребованным завтра
Как найти работу, где помогают расти и поддерживают на старте
3 фактора, которые влияют на качество вашего сна
Экология, инфраструктура и перспективы: 3 причины переехать на север Москвы