podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Голосовые команды появились давным-давно, но так и не стали революцией, которая навсегда изменила наш мир, а когда-то казалось, что именно так и произойдет. Зачем нажимать на кнопки телефона, если можно произнести команду и он тут же выполнит ее? В те времена казалось, что голосовой интерфейс – это будущее, за которое стоит побороться, и в этой гонке участвовали многие компании. Но они быстро осознали, что сам по себе интерфейс не дает ровным счетом ничего, люди стесняются разговаривать со своими устройствами, им это кажется ненормальным. Голосовой набор стал чем-то привычным, но особо не используемым в повседневной жизни, пока не произошел повторный расцвет, в первую очередь за счет голосового поиска и распознавания на Android, во вторую очередь за счет Siri от Apple. Люди стали чаще использовать голосовой набор, команды для установки будильников и напоминаний, причем происходит это уже на естественном языке. Достаточно сказать фразу «OK, Google, поставь будильник на 7 утра», чтобы ваш смартфон это сделал. Такого рода команд огромное количество, и они позволяют обходиться без рук, с телефоном можно общаться голосом, и он сносно распознает все команды. Десять лет назад о таком можно было только мечтать, а сегодня это уже привычная деталь современных устройств, которая не вызывает никакого удивления, а воспринимается некой повседневной нормой. Постепенно непривычность этого интерфейса исчезает, все чаще мы задаем поисковые запросы голосом, так как это быстрее, чем набирать текст на сенсорной клавиатуре. Равно как и телефоны начинают нам отвечать голосом, а не просто показывать странички. Это очень удобно в машине, когда нет времени смотреть на экран, а узнать что-то необходимо, либо нужно внести заметки о встрече в свой календарь.

Первой компанией, что попыталась перенести эти наработки в домашнюю обстановку и преуспела в этом, стала компания Amazon. Пару лет назад они выпустили помощника – Amazon Echo, небольшую колонку, которая распознает голосовые команды и позволяет получать ответы на свои вопросы, добавлять информацию в свой календарь, ставить будильники, одним словом, делать все то, что вы можете сделать на смартфоне. Относительно недавно вышла вторая версия устройства – Echo Dot, она стала меньше, а голосовой помощник, которого зовут Alexa, стал чуточку умнее. Посмотрите ролик про Alexa, чтобы понять, что она умеет сегодня. Перевод не требуется, смысл рассказа понятен и так.

У Google есть аналогичное устройство, которое называется Google Home, и оно обладает примерно теми же возможностями, что и Echo. Отмечу, что в Google Home лучше работает распознавание голоса, можно говорить сложные фразы, а вот Echo примерно на уровне Siri, часто сложные вопросы ставят систему в тупик. Зато у Echo есть поддержка многих устройств умного дома, которые можно контролировать голосом, это преимущество того, что Echo появился несколько раньше. Часто эти системы сравнивают между собой по текущим возможностям и параметрам, что, на мой взгляд, несколько преждевременно.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Мы находимся в самом начале развития голосовых помощников и эволюции их интерфейсов, и говорить о том, что кто-то уже выиграл эту гонку, нельзя. Качество работы голосового помощника будет зависеть от нескольких моментов, попробую перечислить их в случайном порядке:

  • Качество распознавания речи;
  • Качество синтеза речи;
  • Возможность «понимания» как простых команд, так и сложных вопросов, заданных в произвольной форме.

Первые два пункта носят сугубо технический характер, пути решения для этих вопросов понятны, и ежегодно качество распознавания речи на разных языках возрастает. Более того, тот же Google уже научился распознавать вкрапления слов, сказанных на других языках, например, сказав «хочу послушать Deep Purple», вы увидите правильную расшифровку названия группы на английском языке. Система распознавания постепенно обучается тому, что не всегда люди в одной фразе пользуются исключительно своим родным языком, давая оригинальные имена явлениям, музыкальным группам, да много чему.

Сложнее ситуация с пониманием сложных предложений, например, задавать Alexa или Siri длинные вопросы не стоит, ответ скорее всего вас разочарует. А вот попробовать пообщаться с Google о том, почему Толстой выбрал таких героев для романа «Война и мир», можно попробовать. Коренное отличие подхода Google от того же Amazon или Apple заключается в том, что голосовой интерфейс не является для компании чем-то отдельным, он часть большей системы поискового гиганта. Фактически, имея постоянно улучшающийся поиск, в Google переносят его в голосовой интерфейс, что позволяет добиться намного лучших результатов, чем у конкурентов. В этой гонке выигрывает не тот, кто создает лучшую технологию распознавания голоса или синтеза речи, а тот, кто может создать систему, умеющую предугадывать желания пользователей и создавать для них дополнительный комфорт. Условно идеологию Google следующего десятилетия можно описать так: «отвечать на вопросы людей, которые они еще не успели задать». В то же время Amazon, Apple и другие компании планируют и создают системы, что напрочь лишены прогнозной части, а умеют лишь отвечать на четко поставленные вопросы. Типовой сценарий, например, прогноз погоды или маршрут до работы, считать сложным прогнозом нельзя, это банально и неинтересно. Хотя для кого-то, может, и создает видимость «интеллекта» машины.

Проблема успешного помощника заключается в необходимости доступа к большому объему информации, как к вашим личным данным, так и к различным сервисам. Приведу такой пример. Каждый год у меня есть традиционные поездки на выставки, в январе я отправляюсь на CES в Лас-Вегас, в феврале-марте – в Барселону на MWC, в сентябре еду в Берлин на IFA. Каждый год маршруты примерно одинаковы, равно как и та информация, которая мне нужна как до поездок, так и во время них. Как может определить мою поездку тот же Amazon или Siri? По факту писем, в которых содержатся билеты, бронь на гостиницу, или соответствующих поисков, которые сделаны через устройства этих компаний. В случае Google компания «видит» мою историю перемещений и может проанализировать ее, причем такой анализ может быть многоплановым – это история геометок, анализ фотографий и того, что на них изображено, почта с письмами и так далее. Не стоит недооценивать смартфоны на Android, так как они дают всеобъемлющую информацию о том, что мы делаем, когда и как. Анализируя эти данные, можно понять наши пристрастия в еде (сколько вы провели времени в ресторанах, какие вам нравятся больше, какие меньше, сколько времени вы скучали за столом и сидели в телефоне). Та же Alexa ничего этого не знает и никакой возможности узнать не имеет, она отрезана от мира и заточена в вашем доме. А значит, прогнозирование для нее – это тайна за семью печатями, обеспечить высокий уровень система не сможет. Уникальность положения Google заключается в том, что это одновременно поисковый гигант и производитель платформы, что установлена на большинстве мобильных устройств в мире. Тот же Apple в теории может попытаться собирать ровно те же данные, но их качество будет заметно ниже, у них просто нет аналогичных возможностей по обработке данных, что хорошо видно на примере карт от Apple: число POI, их качество и подробности оставляют желать лучшего. В теории они смогут улучшить эти параметры до уровня текущего Google за 4-5 лет, но за это время и Google уйдет вперед.

У Amazon еще меньше данных, чем у Apple, поэтому у них перспектив на этом рынке и того меньше. Из крупных игроков можно и нужно вспомнить Microsoft, которые страдают от отсутствия данных из полей, у них нет мобильных устройств на своей ОС. А есть еще Facebook, который максимально близок к Google по сбору информации о том, что делают его пользователи ежедневно, но также страдает из-за отсутствия поисковой информации в большом количестве. Любая компания, которая захочет стать сильным игроком на рынке голосовых помощников, будет вынуждена решать очень сложный вопрос: где взять поисковую информацию, которая сможет повысить точность прогнозов и сделать их полезными.

В моем примере это будет означать необходимость предоставить мне наилучшие билеты в другие города, подсказать на основании исторических данных, когда их лучше всего купить, а также посмотреть те гостиницы, в которых я уже останавливался, и предложить наилучшие цены. Возможно, в автоматическом режиме написать в гостиницу и запросить скидку для постоянного клиента. Фантастика? Поверьте, эта фантастика случится с нами намного быстрее, чем вам кажется, это дело ближайшего десятилетия. Автоматизация нашей жизни произойдет моментально, и нам она наверняка понравится, хотя не обойдется и без шишек во время становления технологии. Например, текущие голосовые помощники не идентифицируют своих владельцев по голосу, достаточно сказать команду, и они начинают работать. Доходит до смешного, люди смотрят на телевизоре или компьютере ролик про проблему Alexa с заказом кукол для детей без ведома владельцев, и их Alexa также распознает команду на покупку и отправляет такой заказ! Это забавная иллюстрация того, что в будущем идентификация хозяина по голосу станет необходимой частью таких систем, они пока в самом начале своего пути.

С коммерческой точки зрения лидер сегодняшнего рынка помощников для дома – это Amazon. В компании не стали держать Alexa только для себя, а лицензируют эту технологию всем желающим. На CES 2017 больше десятка компаний показали свои продукты со встроенным помощником Alexa, это как прямые копии домашнего помощника Echo от Amazon, так и интеграция Alexa в телевизоры, холодильники, стиральные машины и даже наушники.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Пожалуй, именно этот факт и заставляет многих думать, что наступает время Amazon на этом рынке, но у меня есть свое мнение об этом. Засилье Alexa в продуктах других компаний связано с тем, что в Google не дают своего ассистента вовне, так как не считают его готовым. Он еще проходит обкатку в разных продуктах компании, например, вы можете загрузить мессенджер Allo и пообщаться с помощником в нем, увидите довольно нетривиальные варианты взаимодействия (пока, увы и ах, только на английском языке).

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Как показывает история, в Google выпускают свои технологии на широкий рынок и не стремятся создавать самостоятельно железо, так случится и с условным Google Home, он будет доступен всем желающим, как только технологию сочтут готовой для массового рынка. Это значит, что у Alexa есть не так много времени, чтобы закрепиться на рынке. Тем более что работает Alexa поверх того же Android, то есть замена этого помощника на таковой от Google может происходить легко и просто. Скорее всего, мы увидим аналоги Google Home от разных компаний в конце 2017 - начале 2018 года.

В какой-то мере это пока очень узкая ниша, этакое устройство для управления умным домом и поиска, лишенное экрана на корпусе (смартфон – вот его удаленный экран) и с голосовым интерфейсом. Обратите внимание, что голосовых интерфейсов в нашей жизни незаслуженно мало, их почти нет. Я смог вспомнить лифты, которые отсчитывают этажи и говорят, куда они движутся, машину, которая сообщает важные новости голосом, и, пожалуй, все. Телефоны в расчет не беру, тут все понятно, интерфейс присутствует, и мы им пользуемся. Возможно, что эта тема станет модной на короткий промежуток времени. Возможно, что нет. Это не играет роли, так как голосовые интерфейсы станут стандартными для множества устройств, они выглядят естественно и позволяют избежать необходимости добавлять на корпус кучу клавиш и управляющих элементов, многие из которых излишни. Пример из другой области – это наушники The Dash от компании Bragi. В них есть голосовой помощник, который помогает их настроить и управлять наушниками в разных ситуациях. Нечто подобное есть у разных производителей, но именно в этих наушниках помощник стал не просто удобным, а приятным в использовании и выглядит естественно.

Голосовые интерфейсы вылезли из пеленок, технология стала взрослой. Но если у Google они присоединена ко всему, что делает компания в других областях, и будет использована для прогнозирования того, что вам нужно, то у других компаний все намного проще. В этом отличие, и поэтому я верю в то, что Google в конечном итоге будет очень популярен на этом рынке, повторит успех Android. Собственно голосовые помощники станут производным от Android для Google. Параллельно надо сказать, что получат развитие обычные голосовые интерфейсы для управления большим числом устройств, это будут простые или даже сложные команды. Например, вы сможете побеседовать со своим чайником и сказать, что-то этакое: «Вскипяти воду к вечерним новостям и напомни мне об этом свистком». Но это просто управление, а не прогнозирование, и не стоит путать эти две области. Чайник в Google Home, наоборот, вскипит за минуту до того, как вы решите прийти на кухню и включить его. Но это случится не завтра, а чуть позднее, когда такие системы получат широкое распространение. Мы уже движемся к этому семимильными шагами.

Ссылки по теме

Эльдар Муртазин (eldar@mobile-review.com)
Twitter    Instagram    Блог MrMurtazin.com

Опубликовано — 12 января 2017 г.

Мы в социальных сетях:

Есть, что добавить?! Пишите... eldar@mobile-review.com

 

Новости:
Hit

22.06.2017 Видео на канале: Обзор Samsung Galaxy J5 2017

22.06.2017 В России стартуют продажи смартфона ZTE Blade V8 mini

Hit

22.06.2017 BLUBOO выпустят первый безрамочный флагман с соотношением сторон 18: 9 на платформе от MTK

22.06.2017 Tele2 договорилась с Apple

22.06.2017 Клиенты Альфа-Банка первыми в мире смогут снимать и вносить деньги через банкоматы при помощи мобильных сервисов оплаты

22.06.2017 Samsung запустил в массовое производство процессор Exynos i T200 для Интернет вещей

22.06.2017 В «Яндекс.Такси» очередной сбой – клиентам увеличивают стоимость поездки

Hit

21.06.2017 Видео на канале: Обзор Samsung Galaxy J7 2017

21.06.2017 IDC: продажи шлемов виртуальной и дополненной реальности вырастут в 10 раз

21.06.2017 WhatsApp уточнили сроки прекращения поддержки устройств со старыми ОС

21.06.2017 В Японии планируют использовать роботизированные экзоскелеты для демонтажа АЭС

21.06.2017 ESET: мошенники воспользовались популярностью Uber

21.06.2017 Компания Тимати Black Star запустит собственного виртуального оператора

21.06.2017 ZTE и SoftBank объявили о запуске пилотной зоны 5G в Токио

21.06.2017 ARCHOS выпустит планшеты KODAK в Европе

21.06.2017 Смартфон OnePlus 5 представлен официально

20.06.2017 Samsung Galaxy Note 8 может быть представлен 26 августа в Нью-Йорке

20.06.2017 "Возрожденная" Nokia представила умные весы и цифровой тонометр

20.06.2017 Появились пресс-фото нового планшета Asus ZenPad Z8 2017

20.06.2017 ФАС подозревает операторов в сговоре по отмене тарифов с безлимитным интернетом

20.06.2017 Искусственный интеллект Facebook случайно создал новый язык

20.06.2017 В Skype произошел глобальный сбой

20.06.2017 Samsung Pay и Сбербанк первыми в России запустили подключение карт через мобильное банковское приложение

20.06.2017 В России открыт предзаказ на новый противоударный смартфон LG X venture

20.06.2017 Руководитель Роскомнадзора пообещал лично потребовать у Дурова сведения о Telegram

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.