OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

OpenAI обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.
Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.
















Лучшие предложения
10 товаров для дачного сезона, которые нужно купить уже сегодня
Топ-10 смартфонов, которые стоит купить на Великой китайской распродаже от AliExpress
10 мелочей для кухни, которые решают много бытовых проблем
Удобный для новичков 3D-принтер Flashforge AD5X отдают со скидкой 41%
10 гаджетов, чтобы не упахиваться во время генеральной уборки
Надо брать: неубиваемый внешний аккумулятор от Nitecore
Новинка от Roborock: робот-пылесос для тщательной уборки со скидкой 53%
Со скидкой 59% можно купить наушники от Edifier сейчас на AliExpress
Как найти покупателей без помощи социальных сетей
Как сегодня в России создают новые лекарства и учатся «заживлять» трещины в металле
Как женщины-учёные выводят науку за пределы лабораторий: 3 идеи, которые двигают прогресс
Российский Красный Крест открывает набор на профессиональные курсы с возможностью бесплатного обучения