Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Сколько дней до лета
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
МакрадарТехнологии
23 сентября 2013

Машинный язык: откуда Siri берёт свой голос?

Фото автора Nata Ki
Nata Ki

Машинный язык: откуда Siri берёт свой голос?

Google, Apple, Microsoft и даже Amazon активно разрабатывают свои голосовые сервисы. На свежеиспечённой iOS 7 всё тот же Siri, только появились новые функции и… голоса. Вам интересно, как происходит этот процесс? Как компьютеры обучают речи? Это настоящее искусство.

Для каждого из голосов Siri — свой актер. После того, как он выполнит свою роль по озвучиванию, работа только начинается… Голос человека продолжает своё путешествие. История этого путешествия, от человека до робота — один из сложнейших технологических процессов, которые было невозможно осуществить лет десять назад.

Давайте познакомимся с директором по дизайну голоса и развитию в Nuance, одной из крупнейших независимых компаний в мире, занимающихся распознаванием речи и преобразованием текста в речь. Брэнт Уорд (J. Brant Ward) раньше был композитором, сочинявшим партии для струнных квартетов на синтезаторах, а теперь он компонует речь, используя синтетические голоса. Он работает в индустрии синтеза речи в Кремниевой долине уже более десяти лет.

Преобразование текста в речь — весьма конкурентоспособная индустрия, а работники её весьма скрытны. Хоть весь мир и верит в то, что Nuance создаёт голоса для Siri, Уорд и его коллега Дэвид Васкес (David Vazquez) уклоняются от прямого ответа. Тем не менее, они согласились объяснить, по крайней мере, в общих чертах, как происходит удивительный процесс создания машинных голосов.

Само собой разумеется, не нужно озвучивать и записывать каждое слово из словаря. Но когда речь идёт о приложении, которое должно прочитать любые новости в вашей рассылке, либо найти что-то для вас в Интернете, оно просто обязано произнести каждое слово в словаре.

Большинство предложений выбиралось по принципу «богатства фонетики» — то есть, они содержат много различных комбинаций фонем. «Дело в том, чем больше данных мы имеем, тем более реалистичным будет результат», — говорит Уорд.

После того как текст записан живым голосом актера (утомительный процесс, который может занять несколько месяцев), начинается очень тяжелая работа. Слова и предложения анализируются, разделяются по категориям и заносятся в большую базу данных. В эту сложную работу вовлечена команда преданных своему делу лингвистов, а также задействовано собственное лингвистическое программное обеспечение.

Когда всё это сделано, устройство Nuance по переводу текста в речь создаёт по битам слова и фразы, которые актер, возможно, никогда на самом деле не произносил, но это звучание очень похоже на речь актера, потому что технически это и есть голос актера.

Процесс говорения является бессознательным. Мы это делаем, не думая о том, как происходит этот процесс: в каком положении находится наш язык, какие отношения выстраиваются между фонемами, и так далее — чтобы легко и эффективно выразить сложные идеи и эмоции. Но для того, чтобы компьютер подобрал человеческое звучание голоса, все эти моменты должны быть учтены. Как сказал один профессор по лингвистике, это задача «титаническая».

Вы не должны думать: «Я говорю с компьютером». Вы вообще не должны об этом задумываться.

«Мои дети взаимодействуют с Siri, как будто это живое существо… Они не чувствуют разницы», — делится Уорд.

Так недалеко и до дружбы между человеком и роботами — такой, как у людей. Многим бы понравилось, если бы Siri могла распознавать эмоциональное состояние говорящего и как-то на это реагировать (например, включать режим успокаивающего голоса). Представляете — выговориться роботу, который морально погладит вас по голове. Может, Nuance уже подумывает об этом?..

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

15 товаров, чтобы с комфортом проводить время на даче

15 товаров, чтобы с комфортом проводить время на даче

Забираем очаровательные кеды из коллаборации SELA и «Союзмультфильма»

Забираем очаровательные кеды из коллаборации SELA и «Союзмультфильма»

Кроссовки Li-Ning Soft Go 3

Надо брать: кроссовки от Li-Ning для тех, кто проводит весь день на ногах

15 товаров с распродажи AliExpress для тех, кто хочет заскочить в последний вагон

15 товаров с распродажи AliExpress для тех, кто хочет заскочить в последний вагон

Автомобильный насос от Baseus

Многофункциональный насос от Baseus отдают за полцены на AliExpress

3D-принтеры на распродаже AliExpress: 10 вариантов с отличными отзывами

3D-принтеры на распродаже AliExpress: 10 вариантов с отличными отзывами

Видеорегистратор DDPAI Z60 Pro:

Забираем со скидкой 68% флагманский 4К-регистратор DDPAI Z60 Pro

Находки AliExpress: самые интересные и полезные товары недели

Находки AliExpress: самые интересные и полезные товары недели

Это интересно
Меньше места — больше возможностей: 5 причин купить посуду Tefal Ingenio со съёмной ручкой

Меньше места — больше возможностей: 5 причин купить посуду Tefal Ingenio со съёмной ручкой

Реклама
Где отдохнуть от городской суеты: 5 национальных парков России для весеннего отпуска

Где отдохнуть от городской суеты: 5 национальных парков России для весеннего отпуска

Как сегодня в России создают новые лекарства и учатся «заживлять» трещины в металле

Как сегодня в России создают новые лекарства и учатся «заживлять» трещины в металле

«Горящая изба» и TRENDY BOX выпустили бьюти-бокс «Сияй!» — и это очень красивый набор косметики

«Горящая изба» и TRENDY BOX выпустили бьюти-бокс «Сияй!» — и это очень красивый набор косметики

Комментарии

Станьте первым, кто оставит комментарий

Что вы могли пропустить
Heir размером с монету превращает обычные часы в умные
Heir размером с монету превращает обычные часы в умные
0
11:31
Новости
Устройства
Как запустить мессенджер Max в изолированной среде — без доступа к данным на смартфоне
Как запустить мессенджер Max в изолированной среде — без доступа к данным на смартфоне
0
10:00
Технологии
Технологии
Назад к BlackBerry: анонсирован смартфон Unihertz Titan 2 Elite с клавиатурой и большим экраном
Назад к BlackBerry: анонсирован смартфон Unihertz Titan 2 Elite с клавиатурой и большим экраном
0
Вчера
Новости
Устройства
Как пользоваться KakaoTalk — корейским мессенджером из топа App Store и Google Play
Как пользоваться KakaoTalk — корейским мессенджером из топа App Store и Google Play
0
Вчера
Ликбез
Технологии
OpenAI отказалась от генератора видео Sora — миллиардной сделки с Disney не будет
OpenAI отказалась от генератора видео Sora — миллиардной сделки с Disney не будет
0
Вчера
Новости
Технологии
Всё в шести кнопках: представлена клавиатура MiraBox K1W с клавишами‑экранами
Всё в шести кнопках: представлена клавиатура MiraBox K1W с клавишами‑экранами
0
24 марта
Новости
Устройства
Анонсирован компактный флагман OnePlus 15T с батареей на 7 500 мА·ч и улучшенной защитой
Анонсирован компактный флагман OnePlus 15T с батареей на 7 500 мА·ч и улучшенной защитой
0
24 марта
Новости
Устройства
Обзор Honor Pad X8b — бюджетного планшета с отличной автономностью
Обзор Honor Pad X8b — бюджетного планшета с отличной автономностью
0
24 марта
Устройства
Устройства
В Bloomberg раскрыли, когда выйдет полностью безрамочный iPhone — уже скоро
В Bloomberg раскрыли, когда выйдет полностью безрамочный iPhone — уже скоро
0
24 марта
Новости
Устройства
Как написать хороший текст с помощью ИИ, чтобы он выглядел живым
Как написать хороший текст с помощью ИИ, чтобы он выглядел живым
0
24 марта
Технологии
Технологии
Apple объявила даты конференции WWDC 2026 — на ней покажут iOS 27
Apple объявила даты конференции WWDC 2026 — на ней покажут iOS 27
0
24 марта
Новости
Технологии
10 вещей, которые нужно сделать перед использованием нового ноутбука на Windows
10 вещей, которые нужно сделать перед использованием нового ноутбука на Windows
0
23 марта
Windows
Windows
AirDrop появился на смартфонах Samsung — но пока не на всех
AirDrop появился на смартфонах Samsung — но пока не на всех
0
23 марта
Android
Новости
11 крутых нейросетей для обработки фото
11 крутых нейросетей для обработки фото
0
22 марта
Ликбез
Технологии
Сэм Альтман хочет превратить ИИ в коммунальную услугу подобно электричеству и воде
Сэм Альтман хочет превратить ИИ в коммунальную услугу подобно электричеству и воде
0
21 марта
Новости
Технологии

Новые комментарии

Аватар автора комментария
Ersten1 минуту назад

0 / 0

Зазорно? У меня для вас плохие новости
Heir размером с монету превращает обычные часы в умные
Аватар автора комментария
Burzumm Up2 минуты назад

0 / 0

хорошая попытка, товарищ Полковник :)
Как запустить мессенджер Max в изолированной среде — без доступа к данным на смартфоне
Аватар автора комментария
Horugvi3 минуты назад

0 / 0

нетъ
Heir размером с монету превращает обычные часы в умные
Аватар автора комментария
Horugvi5 минут назад

0 / 0

Боюсь, в вашу статистику не попадают те, кто после своего ремонта просто купят новое.
Почему умение ремонтировать технику самостоятельно — ценный навык и новое золото
От обучения к трудоустройству: 3 истории женщин, которые добились карьерных успехов в сфере новых технологий

От обучения к трудоустройству: 3 истории женщин, которые добились карьерных успехов в сфере новых технологий

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях