Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Выгодные покупки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
МакрадарТехнологии
23 сентября 2013

Машинный язык: откуда Siri берёт свой голос?

Фото автора Nata Ki
Nata Ki

Машинный язык: откуда Siri берёт свой голос?

Google, Apple, Microsoft и даже Amazon активно разрабатывают свои голосовые сервисы. На свежеиспечённой iOS 7 всё тот же Siri, только появились новые функции и… голоса. Вам интересно, как происходит этот процесс? Как компьютеры обучают речи? Это настоящее искусство.

Для каждого из голосов Siri — свой актер. После того, как он выполнит свою роль по озвучиванию, работа только начинается… Голос человека продолжает своё путешествие. История этого путешествия, от человека до робота — один из сложнейших технологических процессов, которые было невозможно осуществить лет десять назад.

Давайте познакомимся с директором по дизайну голоса и развитию в Nuance, одной из крупнейших независимых компаний в мире, занимающихся распознаванием речи и преобразованием текста в речь. Брэнт Уорд (J. Brant Ward) раньше был композитором, сочинявшим партии для струнных квартетов на синтезаторах, а теперь он компонует речь, используя синтетические голоса. Он работает в индустрии синтеза речи в Кремниевой долине уже более десяти лет.

Преобразование текста в речь — весьма конкурентоспособная индустрия, а работники её весьма скрытны. Хоть весь мир и верит в то, что Nuance создаёт голоса для Siri, Уорд и его коллега Дэвид Васкес (David Vazquez) уклоняются от прямого ответа. Тем не менее, они согласились объяснить, по крайней мере, в общих чертах, как происходит удивительный процесс создания машинных голосов.

Само собой разумеется, не нужно озвучивать и записывать каждое слово из словаря. Но когда речь идёт о приложении, которое должно прочитать любые новости в вашей рассылке, либо найти что-то для вас в Интернете, оно просто обязано произнести каждое слово в словаре.

Большинство предложений выбиралось по принципу «богатства фонетики» — то есть, они содержат много различных комбинаций фонем. «Дело в том, чем больше данных мы имеем, тем более реалистичным будет результат», — говорит Уорд.

После того как текст записан живым голосом актера (утомительный процесс, который может занять несколько месяцев), начинается очень тяжелая работа. Слова и предложения анализируются, разделяются по категориям и заносятся в большую базу данных. В эту сложную работу вовлечена команда преданных своему делу лингвистов, а также задействовано собственное лингвистическое программное обеспечение.

Когда всё это сделано, устройство Nuance по переводу текста в речь создаёт по битам слова и фразы, которые актер, возможно, никогда на самом деле не произносил, но это звучание очень похоже на речь актера, потому что технически это и есть голос актера.

Процесс говорения является бессознательным. Мы это делаем, не думая о том, как происходит этот процесс: в каком положении находится наш язык, какие отношения выстраиваются между фонемами, и так далее — чтобы легко и эффективно выразить сложные идеи и эмоции. Но для того, чтобы компьютер подобрал человеческое звучание голоса, все эти моменты должны быть учтены. Как сказал один профессор по лингвистике, это задача «титаническая».

Вы не должны думать: «Я говорю с компьютером». Вы вообще не должны об этом задумываться.

«Мои дети взаимодействуют с Siri, как будто это живое существо… Они не чувствуют разницы», — делится Уорд.

Так недалеко и до дружбы между человеком и роботами — такой, как у людей. Многим бы понравилось, если бы Siri могла распознавать эмоциональное состояние говорящего и как-то на это реагировать (например, включать режим успокаивающего голоса). Представляете — выговориться роботу, который морально погладит вас по голове. Может, Nuance уже подумывает об этом?..

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Находки AliExpress: самые интересные и полезные товары недели

Находки AliExpress: самые интересные и полезные товары недели

электронная книга от Onyx Boox с рейтингом 4,9 из 5

Это нам надо: электронная книга Onyx Boox с рейтингом 4,9 из 5

Распродажа 11.11 на AliExpress: скидки до 90% на всё, что мы любим

Распродажа 11.11 на AliExpress: скидки до 90% на всё, что мы любим

15 idej original'nyh podarkov na Novyj god

15 идей оригинальных подарков на Новый год

Realme 15 Pro

11 лучших скидок на смартфоны с распродажи 11.11 на AliExpress

Настолько хорошие куртки и плащи, что про них пишут в отзывах целые книги

Настолько хорошие куртки и плащи, что про них пишут в отзывах целые книги

Chto podarit' muzhchine na Novyj god: 120 interesnyh idej

Что подарить мужчине на Новый год: 120 интересных идей

Chto komanda Lajfhakera pokupaet na rasprodazhe 11.11

Что команда Лайфхакера покупает на распродаже 11.11

Это интересно
Как защитить ребёнка в интернете: 3 совета для дальновидных родителей

Как защитить ребёнка в интернете: 3 совета для дальновидных родителей

От традиций к инновациям: 8 перспективных профессий современного сельского хозяйства

От традиций к инновациям: 8 перспективных профессий современного сельского хозяйства

Как покупать продукты рационально: полезная инструкция

Как покупать продукты рационально: полезная инструкция

Реклама
Как найти работу, где помогают расти и поддерживают на старте

Как найти работу, где помогают расти и поддерживают на старте

Комментарии

Станьте первым, кто оставит комментарий

Что вы могли пропустить
Какой телевизор подойдёт для игр на PlayStation 5/5 Pro и Xbox Series X/S
Какой телевизор подойдёт для игр на PlayStation 5/5 Pro и Xbox Series X/S
0
Вчера
Ликбез
Устройства
Samsung Galaxy S27 Ultra может получить уникальную систему распознавания лиц
Samsung Galaxy S27 Ultra может получить уникальную систему распознавания лиц
0
8 ноября
Новости
Устройства
11 лучших скидок на смартфоны с распродажи 11.11 на AliExpress
11 лучших скидок на смартфоны с распродажи 11.11 на AliExpress
0
8 ноября
Покупки
Устройства
В WhatsApp появится «экстремальный режим аккаунта» для защиты от мошенников
В WhatsApp появится «экстремальный режим аккаунта» для защиты от мошенников
0
8 ноября
Новости
Технологии
Складной iPhone станет первым смартфоном с подэкранной камерой на 24 Мп
Складной iPhone станет первым смартфоном с подэкранной камерой на 24 Мп
0
7 ноября
Новости
Устройства
iPhone 18 Pro может получить прозрачную заднюю крышку, как у iMac конца 1990-х
iPhone 18 Pro может получить прозрачную заднюю крышку, как у iMac конца 1990-х
0
7 ноября
Новости
Устройства
12 смартфонов Xiaomi получат HyperOS 3 на базе прошлогодней Android 15 — список
12 смартфонов Xiaomi получат HyperOS 3 на базе прошлогодней Android 15 — список
0
7 ноября
Новости
Устройства
Альтернатива ноутбуку и планшету: представлен карманный ПК OmniOne 5.7 с сенсорным дисплеем
Альтернатива ноутбуку и планшету: представлен карманный ПК OmniOne 5.7 с сенсорным дисплеем
0
7 ноября
Новости
Устройства
Moonshot AI представила Kimi K2-Thinking — бесплатную ИИ-модель, которая превосходит GPT-5
Moonshot AI представила Kimi K2-Thinking — бесплатную ИИ-модель, которая превосходит GPT-5
0
7 ноября
Новости
Технологии
Black Shark выпустила игровые полноразмерные наушники Fengming S1 — 155 часов на одной зарядке
Black Shark выпустила игровые полноразмерные наушники Fengming S1 — 155 часов на одной зарядке
0
7 ноября
Новости
Устройства
ИИ не оправдал ожиданий: компании начали нанимать уволенных сотрудников обратно
ИИ не оправдал ожиданий: компании начали нанимать уволенных сотрудников обратно
0
7 ноября
Новости
Технологии
Россиянам будут блокировать мобильный интернет и СМС после роуминга — временно
Россиянам будут блокировать мобильный интернет и СМС после роуминга — временно
0
7 ноября
Новости
Технологии
Увлажнитель, мойка и очиститель воздуха: в чём разница и что выбрать
Увлажнитель, мойка и очиститель воздуха: в чём разница и что выбрать
0
7 ноября
Как выбрать
Устройства
Объясняем за минуту: можно ли заливать воду из-под крана в увлажнитель воздуха
Объясняем за минуту: можно ли заливать воду из-под крана в увлажнитель воздуха
0
6 ноября
Ликбез
Технологии
Кнопку остановки будильника в iOS 26.1 заменили на слайдер — но её можно вернуть
Кнопку остановки будильника в iOS 26.1 заменили на слайдер — но её можно вернуть
0
6 ноября
iOS
Новости

Новые комментарии

Аватар автора комментария
Индира5 минут назад

0 / 0

Вот так вот, живем себе живем, а на дне Океана находим новых существ. Как же наш мир ещё не изучен.
«Шар смерти» и «зомби-черви»: в водах Антарктиды обнаружили 30 новых существ
Аватар автора комментария
Индира10 минут назад

0 / 0

Интересные товары. Гидропонная система для выращивания зелени- отличный подарок для моей невестки.
Находки AliExpress: самые интересные и полезные товары недели
Аватар автора комментария
Индира12 минут назад

0 / 0

Конечно, опытные HR-специалисты сразу определят ложь. Лично я никогда не приукрашиваю свои навыки, так как не хочу, что бы люди на меня надеялись, а в итоге я их разочарую. Говорю, все по факту.
Нормально ли врать в резюме и как это делать, чтобы избежать проблем
Аватар автора комментария
Артём Козориз14 минут назад

0 / 0

Конкретика в статье.
11 лучших смарт-приставок и медиаплееров для ТВ в 2025 году
Как защитить ребёнка в интернете: 3 совета для дальновидных родителей

Как защитить ребёнка в интернете: 3 совета для дальновидных родителей

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторов
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях