Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Сколько дней до лета
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
МакрадарТехнологии
23 сентября 2013

Машинный язык: откуда Siri берёт свой голос?

Фото автора Nata Ki
Nata Ki

Машинный язык: откуда Siri берёт свой голос?

Google, Apple, Microsoft и даже Amazon активно разрабатывают свои голосовые сервисы. На свежеиспечённой iOS 7 всё тот же Siri, только появились новые функции и… голоса. Вам интересно, как происходит этот процесс? Как компьютеры обучают речи? Это настоящее искусство.

Для каждого из голосов Siri — свой актер. После того, как он выполнит свою роль по озвучиванию, работа только начинается… Голос человека продолжает своё путешествие. История этого путешествия, от человека до робота — один из сложнейших технологических процессов, которые было невозможно осуществить лет десять назад.

Давайте познакомимся с директором по дизайну голоса и развитию в Nuance, одной из крупнейших независимых компаний в мире, занимающихся распознаванием речи и преобразованием текста в речь. Брэнт Уорд (J. Brant Ward) раньше был композитором, сочинявшим партии для струнных квартетов на синтезаторах, а теперь он компонует речь, используя синтетические голоса. Он работает в индустрии синтеза речи в Кремниевой долине уже более десяти лет.

Преобразование текста в речь — весьма конкурентоспособная индустрия, а работники её весьма скрытны. Хоть весь мир и верит в то, что Nuance создаёт голоса для Siri, Уорд и его коллега Дэвид Васкес (David Vazquez) уклоняются от прямого ответа. Тем не менее, они согласились объяснить, по крайней мере, в общих чертах, как происходит удивительный процесс создания машинных голосов.

Само собой разумеется, не нужно озвучивать и записывать каждое слово из словаря. Но когда речь идёт о приложении, которое должно прочитать любые новости в вашей рассылке, либо найти что-то для вас в Интернете, оно просто обязано произнести каждое слово в словаре.

Большинство предложений выбиралось по принципу «богатства фонетики» — то есть, они содержат много различных комбинаций фонем. «Дело в том, чем больше данных мы имеем, тем более реалистичным будет результат», — говорит Уорд.

После того как текст записан живым голосом актера (утомительный процесс, который может занять несколько месяцев), начинается очень тяжелая работа. Слова и предложения анализируются, разделяются по категориям и заносятся в большую базу данных. В эту сложную работу вовлечена команда преданных своему делу лингвистов, а также задействовано собственное лингвистическое программное обеспечение.

Когда всё это сделано, устройство Nuance по переводу текста в речь создаёт по битам слова и фразы, которые актер, возможно, никогда на самом деле не произносил, но это звучание очень похоже на речь актера, потому что технически это и есть голос актера.

Процесс говорения является бессознательным. Мы это делаем, не думая о том, как происходит этот процесс: в каком положении находится наш язык, какие отношения выстраиваются между фонемами, и так далее — чтобы легко и эффективно выразить сложные идеи и эмоции. Но для того, чтобы компьютер подобрал человеческое звучание голоса, все эти моменты должны быть учтены. Как сказал один профессор по лингвистике, это задача «титаническая».

Вы не должны думать: «Я говорю с компьютером». Вы вообще не должны об этом задумываться.

«Мои дети взаимодействуют с Siri, как будто это живое существо… Они не чувствуют разницы», — делится Уорд.

Так недалеко и до дружбы между человеком и роботами — такой, как у людей. Многим бы понравилось, если бы Siri могла распознавать эмоциональное состояние говорящего и как-то на это реагировать (например, включать режим успокаивающего голоса). Представляете — выговориться роботу, который морально погладит вас по голове. Может, Nuance уже подумывает об этом?..

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Электрическая газонокосилка от Worx

Надо брать: электрическая газонокосилка от Worx со скидкой 56%

10 товаров с маркетплейсов, которые подарят радость на этой неделе

10 товаров с маркетплейсов, которые подарят радость на этой неделе

Nahodki AliExpress: samye interesnye i poleznye tovary nedeli

Находки AliExpress: самые интересные и полезные товары недели

10 пар хороших кроссовок с AliExpress дешевле 5 000 рублей

10 пар хороших кроссовок с AliExpress дешевле 5 000 рублей

Надо брать: разборный мангал с усиленной конструкцией со скидкой 59%

Надо брать: разборный мангал с усиленной конструкцией со скидкой 59%

Велосипед Stern Energy 29"

Велосипед Stern Energy 29" отдают со скидкой 24% в «Спортмастере»

10 отличных MP3-плееров, чтобы слушать музыку где угодно

10 отличных MP3-плееров, чтобы слушать музыку где угодно

Надо брать: надёжный робот — мойщик окон от Polaris со скидкой 71%

Надо брать: надёжный робот — мойщик окон от Polaris со скидкой 71%

Это интересно
Как найти квартиру мечты с помощью ИИ: тестируем помощника от Яндекс Недвижимости

Как найти квартиру мечты с помощью ИИ: тестируем помощника от Яндекс Недвижимости

Полное руководство по прикорму ребёнка до одного года: от первой ложки до полноценного обеда

Полное руководство по прикорму ребёнка до одного года: от первой ложки до полноценного обеда

3 причины, почему не стоит бояться поменять интернет-провайдера

3 причины, почему не стоит бояться поменять интернет-провайдера

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

От доставки продуктов до тушения пожаров: как дроны помогают решать повседневные задачи

Комментарии

Станьте первым, кто оставит комментарий

Что вы могли пропустить
3 крутых функции в приложении Т2, о которых вы должны знать
3 крутых функции в приложении Т2, о которых вы должны знать
0
11:00
Технологии
Технологии
Объясняем за минуту: можно ли зарядить телефон от телефона
Объясняем за минуту: можно ли зарядить телефон от телефона
0
Вчера
Технологии
Технологии
«Ты не пройдёшь!»: 20 лучших стратегий в жанре Tower Defense на Android
«Ты не пройдёшь!»: 20 лучших стратегий в жанре Tower Defense на Android
0
10 мая
Android
Android
10 бесплатных аналогов «Google Фото»
10 бесплатных аналогов «Google Фото»
0
9 мая
Веб-сервисы
Веб-сервисы
Apple работает над «пространственным iPhone» с голографическим дисплеем
Apple работает над «пространственным iPhone» с голографическим дисплеем
0
8 мая
Новости
Устройства
Риелторам и не снилось: энтузиаст создал реалистичную 3D-копию своего дома — по ней можно гулять в браузере
Риелторам и не снилось: энтузиаст создал реалистичную 3D-копию своего дома — по ней можно гулять в браузере
0
8 мая
Новости
Технологии
10 самых автономных смартфонов в 2026 году: рейтинг экспертов
10 самых автономных смартфонов в 2026 году: рейтинг экспертов
0
8 мая
Устройства
Устройства
Google показала Fitbit Air — аналог фитнес-браслета Whoop без обязательной подписки
Google показала Fitbit Air — аналог фитнес-браслета Whoop без обязательной подписки
0
7 мая
Новости
Устройства
MacBook Neo может получить новые расцветки — и подорожать
MacBook Neo может получить новые расцветки — и подорожать
0
7 мая
Новости
Устройства
Соображать на троих: Apple Intelligence на iPhone позволит выбирать между ChatGPT, Gemini и Claude
Соображать на троих: Apple Intelligence на iPhone позволит выбирать между ChatGPT, Gemini и Claude
0
7 мая
iOS
Новости
Как я превратил ноутбук в стационарный ПК, чтобы работать с комфортом
Как я превратил ноутбук в стационарный ПК, чтобы работать с комфортом
0
7 мая
Технологии
Технологии
«Вы все сумасшедшие»: руководитель Google прокомментировал слухи о переводе Android на Liquid Glass
«Вы все сумасшедшие»: руководитель Google прокомментировал слухи о переводе Android на Liquid Glass
0
7 мая
Android
Новости
Samsung официально выпустила One UI 8.5 — вот какие устройства уже можно обновить
Samsung официально выпустила One UI 8.5 — вот какие устройства уже можно обновить
0
7 мая
Android
Новости
HBO, LG, «Яндекс» — 15 названий брендов, о значении которых вы вряд ли знали
HBO, LG, «Яндекс» — 15 названий брендов, о значении которых вы вряд ли знали
0
6 мая
Технологии
Технологии
Монохромный, но быстрый: Remarkable представила блокнот с электронными чернилами Paper Pure
Монохромный, но быстрый: Remarkable представила блокнот с электронными чернилами Paper Pure
0
6 мая
Новости
Устройства

Новые комментарии

Аватар автора комментария
BOR4IK3 минуты назад

0 / 0

Мой Poco F3 тоже имеет функцию реверсивной зарядки и у сына Poco X5 может заряжать. Так что не только F7 Ultra
Как работает реверсивная зарядка в смартфонах и как её включить
Аватар автора комментария
Kremlina Nova12 минут назад

0 / 0

А мне лишь первая часть понравилась.
Боромиру было бы стыдно: Collider назвал 8 худших фильмов, пытавшихся повторить триумф «Властелина колец»
Аватар автора комментария
Skubacok13 минут назад

0 / 0

Забавный фильм "Ослеплённый желаниями". Да и актер Брендан Фрейзер такой молодой.
10 фильмов про исполнение желаний, которые стоит посмотреть
Аватар автора комментария
Skubacok15 минут назад

0 / 0

Курицу мариную с луком и майонезом, соль и перец по вкусу.
Как приготовить шашлык из курицы: 13 отличных маринадов
3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день

3 причины, почему смартфон iQOO Z11x — классный помощник на каждый день

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях