podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2

Версия для печати Блоггерам

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Голосовые команды появились давным-давно, но так и не стали революцией, которая навсегда изменила наш мир, а когда-то казалось, что именно так и произойдет. Зачем нажимать на кнопки телефона, если можно произнести команду и он тут же выполнит ее? В те времена казалось, что голосовой интерфейс – это будущее, за которое стоит побороться, и в этой гонке участвовали многие компании. Но они быстро осознали, что сам по себе интерфейс не дает ровным счетом ничего, люди стесняются разговаривать со своими устройствами, им это кажется ненормальным. Голосовой набор стал чем-то привычным, но особо не используемым в повседневной жизни, пока не произошел повторный расцвет, в первую очередь за счет голосового поиска и распознавания на Android, во вторую очередь за счет Siri от Apple. Люди стали чаще использовать голосовой набор, команды для установки будильников и напоминаний, причем происходит это уже на естественном языке. Достаточно сказать фразу «OK, Google, поставь будильник на 7 утра», чтобы ваш смартфон это сделал. Такого рода команд огромное количество, и они позволяют обходиться без рук, с телефоном можно общаться голосом, и он сносно распознает все команды. Десять лет назад о таком можно было только мечтать, а сегодня это уже привычная деталь современных устройств, которая не вызывает никакого удивления, а воспринимается некой повседневной нормой. Постепенно непривычность этого интерфейса исчезает, все чаще мы задаем поисковые запросы голосом, так как это быстрее, чем набирать текст на сенсорной клавиатуре. Равно как и телефоны начинают нам отвечать голосом, а не просто показывать странички. Это очень удобно в машине, когда нет времени смотреть на экран, а узнать что-то необходимо, либо нужно внести заметки о встрече в свой календарь.

Первой компанией, что попыталась перенести эти наработки в домашнюю обстановку и преуспела в этом, стала компания Amazon. Пару лет назад они выпустили помощника – Amazon Echo, небольшую колонку, которая распознает голосовые команды и позволяет получать ответы на свои вопросы, добавлять информацию в свой календарь, ставить будильники, одним словом, делать все то, что вы можете сделать на смартфоне. Относительно недавно вышла вторая версия устройства – Echo Dot, она стала меньше, а голосовой помощник, которого зовут Alexa, стал чуточку умнее. Посмотрите ролик про Alexa, чтобы понять, что она умеет сегодня. Перевод не требуется, смысл рассказа понятен и так.

У Google есть аналогичное устройство, которое называется Google Home, и оно обладает примерно теми же возможностями, что и Echo. Отмечу, что в Google Home лучше работает распознавание голоса, можно говорить сложные фразы, а вот Echo примерно на уровне Siri, часто сложные вопросы ставят систему в тупик. Зато у Echo есть поддержка многих устройств умного дома, которые можно контролировать голосом, это преимущество того, что Echo появился несколько раньше. Часто эти системы сравнивают между собой по текущим возможностям и параметрам, что, на мой взгляд, несколько преждевременно.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Мы находимся в самом начале развития голосовых помощников и эволюции их интерфейсов, и говорить о том, что кто-то уже выиграл эту гонку, нельзя. Качество работы голосового помощника будет зависеть от нескольких моментов, попробую перечислить их в случайном порядке:

  • Качество распознавания речи;
  • Качество синтеза речи;
  • Возможность «понимания» как простых команд, так и сложных вопросов, заданных в произвольной форме.

Первые два пункта носят сугубо технический характер, пути решения для этих вопросов понятны, и ежегодно качество распознавания речи на разных языках возрастает. Более того, тот же Google уже научился распознавать вкрапления слов, сказанных на других языках, например, сказав «хочу послушать Deep Purple», вы увидите правильную расшифровку названия группы на английском языке. Система распознавания постепенно обучается тому, что не всегда люди в одной фразе пользуются исключительно своим родным языком, давая оригинальные имена явлениям, музыкальным группам, да много чему.

Сложнее ситуация с пониманием сложных предложений, например, задавать Alexa или Siri длинные вопросы не стоит, ответ скорее всего вас разочарует. А вот попробовать пообщаться с Google о том, почему Толстой выбрал таких героев для романа «Война и мир», можно попробовать. Коренное отличие подхода Google от того же Amazon или Apple заключается в том, что голосовой интерфейс не является для компании чем-то отдельным, он часть большей системы поискового гиганта. Фактически, имея постоянно улучшающийся поиск, в Google переносят его в голосовой интерфейс, что позволяет добиться намного лучших результатов, чем у конкурентов. В этой гонке выигрывает не тот, кто создает лучшую технологию распознавания голоса или синтеза речи, а тот, кто может создать систему, умеющую предугадывать желания пользователей и создавать для них дополнительный комфорт. Условно идеологию Google следующего десятилетия можно описать так: «отвечать на вопросы людей, которые они еще не успели задать». В то же время Amazon, Apple и другие компании планируют и создают системы, что напрочь лишены прогнозной части, а умеют лишь отвечать на четко поставленные вопросы. Типовой сценарий, например, прогноз погоды или маршрут до работы, считать сложным прогнозом нельзя, это банально и неинтересно. Хотя для кого-то, может, и создает видимость «интеллекта» машины.

Проблема успешного помощника заключается в необходимости доступа к большому объему информации, как к вашим личным данным, так и к различным сервисам. Приведу такой пример. Каждый год у меня есть традиционные поездки на выставки, в январе я отправляюсь на CES в Лас-Вегас, в феврале-марте – в Барселону на MWC, в сентябре еду в Берлин на IFA. Каждый год маршруты примерно одинаковы, равно как и та информация, которая мне нужна как до поездок, так и во время них. Как может определить мою поездку тот же Amazon или Siri? По факту писем, в которых содержатся билеты, бронь на гостиницу, или соответствующих поисков, которые сделаны через устройства этих компаний. В случае Google компания «видит» мою историю перемещений и может проанализировать ее, причем такой анализ может быть многоплановым – это история геометок, анализ фотографий и того, что на них изображено, почта с письмами и так далее. Не стоит недооценивать смартфоны на Android, так как они дают всеобъемлющую информацию о том, что мы делаем, когда и как. Анализируя эти данные, можно понять наши пристрастия в еде (сколько вы провели времени в ресторанах, какие вам нравятся больше, какие меньше, сколько времени вы скучали за столом и сидели в телефоне). Та же Alexa ничего этого не знает и никакой возможности узнать не имеет, она отрезана от мира и заточена в вашем доме. А значит, прогнозирование для нее – это тайна за семью печатями, обеспечить высокий уровень система не сможет. Уникальность положения Google заключается в том, что это одновременно поисковый гигант и производитель платформы, что установлена на большинстве мобильных устройств в мире. Тот же Apple в теории может попытаться собирать ровно те же данные, но их качество будет заметно ниже, у них просто нет аналогичных возможностей по обработке данных, что хорошо видно на примере карт от Apple: число POI, их качество и подробности оставляют желать лучшего. В теории они смогут улучшить эти параметры до уровня текущего Google за 4-5 лет, но за это время и Google уйдет вперед.

У Amazon еще меньше данных, чем у Apple, поэтому у них перспектив на этом рынке и того меньше. Из крупных игроков можно и нужно вспомнить Microsoft, которые страдают от отсутствия данных из полей, у них нет мобильных устройств на своей ОС. А есть еще Facebook, который максимально близок к Google по сбору информации о том, что делают его пользователи ежедневно, но также страдает из-за отсутствия поисковой информации в большом количестве. Любая компания, которая захочет стать сильным игроком на рынке голосовых помощников, будет вынуждена решать очень сложный вопрос: где взять поисковую информацию, которая сможет повысить точность прогнозов и сделать их полезными.

В моем примере это будет означать необходимость предоставить мне наилучшие билеты в другие города, подсказать на основании исторических данных, когда их лучше всего купить, а также посмотреть те гостиницы, в которых я уже останавливался, и предложить наилучшие цены. Возможно, в автоматическом режиме написать в гостиницу и запросить скидку для постоянного клиента. Фантастика? Поверьте, эта фантастика случится с нами намного быстрее, чем вам кажется, это дело ближайшего десятилетия. Автоматизация нашей жизни произойдет моментально, и нам она наверняка понравится, хотя не обойдется и без шишек во время становления технологии. Например, текущие голосовые помощники не идентифицируют своих владельцев по голосу, достаточно сказать команду, и они начинают работать. Доходит до смешного, люди смотрят на телевизоре или компьютере ролик про проблему Alexa с заказом кукол для детей без ведома владельцев, и их Alexa также распознает команду на покупку и отправляет такой заказ! Это забавная иллюстрация того, что в будущем идентификация хозяина по голосу станет необходимой частью таких систем, они пока в самом начале своего пути.

С коммерческой точки зрения лидер сегодняшнего рынка помощников для дома – это Amazon. В компании не стали держать Alexa только для себя, а лицензируют эту технологию всем желающим. На CES 2017 больше десятка компаний показали свои продукты со встроенным помощником Alexa, это как прямые копии домашнего помощника Echo от Amazon, так и интеграция Alexa в телевизоры, холодильники, стиральные машины и даже наушники.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Пожалуй, именно этот факт и заставляет многих думать, что наступает время Amazon на этом рынке, но у меня есть свое мнение об этом. Засилье Alexa в продуктах других компаний связано с тем, что в Google не дают своего ассистента вовне, так как не считают его готовым. Он еще проходит обкатку в разных продуктах компании, например, вы можете загрузить мессенджер Allo и пообщаться с помощником в нем, увидите довольно нетривиальные варианты взаимодействия (пока, увы и ах, только на английском языке).

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Как показывает история, в Google выпускают свои технологии на широкий рынок и не стремятся создавать самостоятельно железо, так случится и с условным Google Home, он будет доступен всем желающим, как только технологию сочтут готовой для массового рынка. Это значит, что у Alexa есть не так много времени, чтобы закрепиться на рынке. Тем более что работает Alexa поверх того же Android, то есть замена этого помощника на таковой от Google может происходить легко и просто. Скорее всего, мы увидим аналоги Google Home от разных компаний в конце 2017 - начале 2018 года.

В какой-то мере это пока очень узкая ниша, этакое устройство для управления умным домом и поиска, лишенное экрана на корпусе (смартфон – вот его удаленный экран) и с голосовым интерфейсом. Обратите внимание, что голосовых интерфейсов в нашей жизни незаслуженно мало, их почти нет. Я смог вспомнить лифты, которые отсчитывают этажи и говорят, куда они движутся, машину, которая сообщает важные новости голосом, и, пожалуй, все. Телефоны в расчет не беру, тут все понятно, интерфейс присутствует, и мы им пользуемся. Возможно, что эта тема станет модной на короткий промежуток времени. Возможно, что нет. Это не играет роли, так как голосовые интерфейсы станут стандартными для множества устройств, они выглядят естественно и позволяют избежать необходимости добавлять на корпус кучу клавиш и управляющих элементов, многие из которых излишни. Пример из другой области – это наушники The Dash от компании Bragi. В них есть голосовой помощник, который помогает их настроить и управлять наушниками в разных ситуациях. Нечто подобное есть у разных производителей, но именно в этих наушниках помощник стал не просто удобным, а приятным в использовании и выглядит естественно.

Голосовые интерфейсы вылезли из пеленок, технология стала взрослой. Но если у Google они присоединена ко всему, что делает компания в других областях, и будет использована для прогнозирования того, что вам нужно, то у других компаний все намного проще. В этом отличие, и поэтому я верю в то, что Google в конечном итоге будет очень популярен на этом рынке, повторит успех Android. Собственно голосовые помощники станут производным от Android для Google. Параллельно надо сказать, что получат развитие обычные голосовые интерфейсы для управления большим числом устройств, это будут простые или даже сложные команды. Например, вы сможете побеседовать со своим чайником и сказать, что-то этакое: «Вскипяти воду к вечерним новостям и напомни мне об этом свистком». Но это просто управление, а не прогнозирование, и не стоит путать эти две области. Чайник в Google Home, наоборот, вскипит за минуту до того, как вы решите прийти на кухню и включить его. Но это случится не завтра, а чуть позднее, когда такие системы получат широкое распространение. Мы уже движемся к этому семимильными шагами.

Ссылки по теме

Эльдар Муртазин (eldar@mobile-review.com)
Twitter    Instagram    Блог MrMurtazin.com

Опубликовано — 12 января 2017 г.

Мы в социальных сетях:

blog comments powered by Disqus

Есть, что добавить?! Пишите... eldar@mobile-review.com

 

Новости:

24.03.2017 ZTE потерпела убытки в 4 квартале из-за штрафа в США

24.03.2017 Цены и варианты Xaiomi Mi 6 и Mi 6 Plus попали в сеть

24.03.2017 В сервисе Google Авиабилеты для России теперь можно планировать поездки и на поезде

24.03.2017 Samsung продемонстрировал концепты умных часов на базе Gear S3

24.03.2017 Meizu M621C-S прошел сертификацию TENAA

24.03.2017 EZVIZ представила на российском рынке полнофункциональную систему «умный дом»

24.03.2017 Флагман Nokia получит сдвоенную камеру с оптикой Carl Zeiss

Hit

24.03.2017 Видео на канале: Обзор смартфона 4Good R407

24.03.2017 В России представлены игровые ноутбуки Lenovo Legion Y520 и Legion Y720

24.03.2017 Google избавит Hangouts от поддержки SMS

24.03.2017 Panasonic сделает крупного испанского разработчика автомобильных систем своей дочерней компанией

23.03.2017 Fossil представила более 300 моделей умных часов

23.03.2017 Le XiubaleR получит Helio X20 и Android 7.1.2

23.03.2017 LG Pay будет запущен в Корее в июне

23.03.2017 Casio представила версию смарт-часов Pro Trek WSD F20 с сапфировым стеклом

23.03.2017 Два смартфона Meizu с быстрой зарядкой зарегистрированы в Китае

23.03.2017 Красный iPhone оказался аномально популярным в Китае

23.03.2017 Яндекс увидел угрозу для своих «Денег» в СП Сбербанка и Alibaba

23.03.2017 Apple запустила вебсайт «Бизнес» в России

Hit

23.03.2017 Видео на канале: Обзор Huawei P10

23.03.2017 «Связной» и «Евросеть» могут объединить

23.03.2017 Panasonic представил для тайваньского рынка новый смартфон – ELUGA PURE

23.03.2017 В Карты Google возвращается возможность делиться с друзьями своим местоположением

22.03.2017 ZTE представила обновление линейки Nubia в Китае

22.03.2017 Huawei представит смартфон линейки Honor 5 апреля

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.