Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Большая распродажа
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
МакрадарТехнологии
23 сентября 2013

Машинный язык: откуда Siri берёт свой голос?

Фото автора Nata Ki
Nata Ki

Машинный язык: откуда Siri берёт свой голос?

Google, Apple, Microsoft и даже Amazon активно разрабатывают свои голосовые сервисы. На свежеиспечённой iOS 7 всё тот же Siri, только появились новые функции и… голоса. Вам интересно, как происходит этот процесс? Как компьютеры обучают речи? Это настоящее искусство.

Для каждого из голосов Siri — свой актер. После того, как он выполнит свою роль по озвучиванию, работа только начинается… Голос человека продолжает своё путешествие. История этого путешествия, от человека до робота — один из сложнейших технологических процессов, которые было невозможно осуществить лет десять назад.

Давайте познакомимся с директором по дизайну голоса и развитию в Nuance, одной из крупнейших независимых компаний в мире, занимающихся распознаванием речи и преобразованием текста в речь. Брэнт Уорд (J. Brant Ward) раньше был композитором, сочинявшим партии для струнных квартетов на синтезаторах, а теперь он компонует речь, используя синтетические голоса. Он работает в индустрии синтеза речи в Кремниевой долине уже более десяти лет.

Преобразование текста в речь — весьма конкурентоспособная индустрия, а работники её весьма скрытны. Хоть весь мир и верит в то, что Nuance создаёт голоса для Siri, Уорд и его коллега Дэвид Васкес (David Vazquez) уклоняются от прямого ответа. Тем не менее, они согласились объяснить, по крайней мере, в общих чертах, как происходит удивительный процесс создания машинных голосов.

Само собой разумеется, не нужно озвучивать и записывать каждое слово из словаря. Но когда речь идёт о приложении, которое должно прочитать любые новости в вашей рассылке, либо найти что-то для вас в Интернете, оно просто обязано произнести каждое слово в словаре.

Большинство предложений выбиралось по принципу «богатства фонетики» — то есть, они содержат много различных комбинаций фонем. «Дело в том, чем больше данных мы имеем, тем более реалистичным будет результат», — говорит Уорд.

После того как текст записан живым голосом актера (утомительный процесс, который может занять несколько месяцев), начинается очень тяжелая работа. Слова и предложения анализируются, разделяются по категориям и заносятся в большую базу данных. В эту сложную работу вовлечена команда преданных своему делу лингвистов, а также задействовано собственное лингвистическое программное обеспечение.

Когда всё это сделано, устройство Nuance по переводу текста в речь создаёт по битам слова и фразы, которые актер, возможно, никогда на самом деле не произносил, но это звучание очень похоже на речь актера, потому что технически это и есть голос актера.

Процесс говорения является бессознательным. Мы это делаем, не думая о том, как происходит этот процесс: в каком положении находится наш язык, какие отношения выстраиваются между фонемами, и так далее — чтобы легко и эффективно выразить сложные идеи и эмоции. Но для того, чтобы компьютер подобрал человеческое звучание голоса, все эти моменты должны быть учтены. Как сказал один профессор по лингвистике, это задача «титаническая».

Вы не должны думать: «Я говорю с компьютером». Вы вообще не должны об этом задумываться.

«Мои дети взаимодействуют с Siri, как будто это живое существо… Они не чувствуют разницы», — делится Уорд.

Так недалеко и до дружбы между человеком и роботами — такой, как у людей. Многим бы понравилось, если бы Siri могла распознавать эмоциональное состояние говорящего и как-то на это реагировать (например, включать режим успокаивающего голоса). Представляете — выговориться роботу, который морально погладит вас по голове. Может, Nuance уже подумывает об этом?..

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

3D-принтеры на распродаже AliExpress: 10 вариантов с отличными отзывами

3D-принтеры на распродаже AliExpress: 10 вариантов с отличными отзывами

Видеорегистратор DDPAI Z60 Pro:

Забираем со скидкой 68% флагманский 4К-регистратор DDPAI Z60 Pro

Находки AliExpress: самые интересные и полезные товары недели

Находки AliExpress: самые интересные и полезные товары недели

Наушники Soundcore Liberty 5 подешевели на «Великой китайской распродаже»

Наушники Soundcore Liberty 5 подешевели на «Великой китайской распродаже»

Где отдохнуть летом в России

Где отдохнуть летом в России: 7 необычных мест

Надо брать: набор из 228 инструментов от Deko со скидкой 66%

Надо брать: набор из 228 предметов от Deko со скидкой 66%

10 товаров, чтобы сделать кухню лучшим местом в доме

10 товаров, чтобы сделать кухню лучшим местом в доме

Моющий пылесос Roborock F25 Ultra

Надо брать: моющий пылесос Roborock F25 Ultra со скидкой 45%

Это интересно
«Горящая изба» и TRENDY BOX выпустили бьюти-бокс «Сияй!» — и это очень красивый набор косметики

«Горящая изба» и TRENDY BOX выпустили бьюти-бокс «Сияй!» — и это очень красивый набор косметики

Где отдохнуть от городской суеты: 5 национальных парков России для весеннего отпуска

Где отдохнуть от городской суеты: 5 национальных парков России для весеннего отпуска

«Семальтара»: как работает семаглутид в таблетках и для чего его назначают

«Семальтара»: как работает семаглутид в таблетках и для чего его назначают

Как найти покупателей без помощи социальных сетей

Как найти покупателей без помощи социальных сетей

Комментарии

Станьте первым, кто оставит комментарий

Что вы могли пропустить
Apple объявила даты конференции WWDC 2026 — на ней покажут iOS 27
Apple объявила даты конференции WWDC 2026 — на ней покажут iOS 27
0
10:31
Новости
Технологии
10 вещей, которые нужно сделать перед использованием нового ноутбука на Windows
10 вещей, которые нужно сделать перед использованием нового ноутбука на Windows
0
Вчера
Windows
Windows
AirDrop появился на смартфонах Samsung — но пока не на всех
AirDrop появился на смартфонах Samsung — но пока не на всех
0
Вчера
Android
Новости
11 крутых нейросетей для обработки фото
11 крутых нейросетей для обработки фото
0
22 марта
Ликбез
Технологии
Сэм Альтман хочет превратить ИИ в коммунальную услугу подобно электричеству и воде
Сэм Альтман хочет превратить ИИ в коммунальную услугу подобно электричеству и воде
0
21 марта
Новости
Технологии
18 лучших RPG-игр на Android в 2026 году, доступных бесплатно
18 лучших RPG-игр на Android в 2026 году, доступных бесплатно
0
21 марта
Android
Android
Меньше ИИ и больше кастомизации: Microsoft раскрыла план по улучшению Windows 11 в 2026 году
Меньше ИИ и больше кастомизации: Microsoft раскрыла план по улучшению Windows 11 в 2026 году
0
21 марта
Windows
Новости
Кошмар зумера: экс-дизайнер Apple создал аналоговый будильник без стрелок
Кошмар зумера: экс-дизайнер Apple создал аналоговый будильник без стрелок
0
20 марта
Новости
Устройства
Три в одном: Xiaomi показала потолочный обогреватель с вытяжкой и лампой
Три в одном: Xiaomi показала потолочный обогреватель с вытяжкой и лампой
0
20 марта
Новости
Устройства
Мессенджер BiP: как пользоваться турецким аналогом Telegram и WhatsApp
Мессенджер BiP: как пользоваться турецким аналогом Telegram и WhatsApp
0
20 марта
Технологии
Технологии
Xiaomi выпустила часы Watch S5 с увеличенным экраном, eSIM и автономностью до 21 дня
Xiaomi выпустила часы Watch S5 с увеличенным экраном, eSIM и автономностью до 21 дня
0
19 марта
Новости
Устройства
Xiaomi представила тонкий и лёгкий премиум-ноутбук Book Pro 14
Xiaomi представила тонкий и лёгкий премиум-ноутбук Book Pro 14
0
19 марта
Новости
Устройства
Надо брать: мощная автомобильная зарядка от Ugreen со скидкой 48%
Надо брать: мощная автомобильная зарядка от Ugreen со скидкой 48%
0
19 марта
Покупки
Устройства
«Яндекс» научит писать курсовые и дипломы с помощью ИИ
«Яндекс» научит писать курсовые и дипломы с помощью ИИ
0
19 марта
Новости
Технологии
«30% выпускников не найдут работу»: глава ServiceNow спрогнозировал безработицу из-за ИИ
«30% выпускников не найдут работу»: глава ServiceNow спрогнозировал безработицу из-за ИИ
0
19 марта
Новости
Технологии

Новые комментарии

Аватар автора комментария
Владислав Панин6 минут назад

0 / 0

Интересно, каким образом можно сиквел сделать лучше первой части?
У сиквела «Тайны Коко» появилась дата выхода
Аватар автора комментария
Kremlina Nova11 минут назад

0 / 0

Эх. Бывают в жизни огорчения (((
Кто такие демисексуалы и почему они могут заниматься сексом только по любви
Аватар автора комментария
Kremlina Nova12 минут назад

0 / 0

Нет. У меня есть смартфон 😁
Нобелевский лауреат создал устройство, которое способно добывать воду из воздуха
Аватар автора комментария
Ersten13 минут назад

0 / 0

Жрите меньше, двигайтесь больше Диета - это навсегда Худеть нужно на дефиците колоний, держать вес на балансе
Почему после похудения килограммы возвращаются и как этого избежать
Как найти покупателей без помощи социальных сетей

Как найти покупателей без помощи социальных сетей

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях