podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2

Версия для печати Блоггерам

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Голосовые команды появились давным-давно, но так и не стали революцией, которая навсегда изменила наш мир, а когда-то казалось, что именно так и произойдет. Зачем нажимать на кнопки телефона, если можно произнести команду и он тут же выполнит ее? В те времена казалось, что голосовой интерфейс – это будущее, за которое стоит побороться, и в этой гонке участвовали многие компании. Но они быстро осознали, что сам по себе интерфейс не дает ровным счетом ничего, люди стесняются разговаривать со своими устройствами, им это кажется ненормальным. Голосовой набор стал чем-то привычным, но особо не используемым в повседневной жизни, пока не произошел повторный расцвет, в первую очередь за счет голосового поиска и распознавания на Android, во вторую очередь за счет Siri от Apple. Люди стали чаще использовать голосовой набор, команды для установки будильников и напоминаний, причем происходит это уже на естественном языке. Достаточно сказать фразу «OK, Google, поставь будильник на 7 утра», чтобы ваш смартфон это сделал. Такого рода команд огромное количество, и они позволяют обходиться без рук, с телефоном можно общаться голосом, и он сносно распознает все команды. Десять лет назад о таком можно было только мечтать, а сегодня это уже привычная деталь современных устройств, которая не вызывает никакого удивления, а воспринимается некой повседневной нормой. Постепенно непривычность этого интерфейса исчезает, все чаще мы задаем поисковые запросы голосом, так как это быстрее, чем набирать текст на сенсорной клавиатуре. Равно как и телефоны начинают нам отвечать голосом, а не просто показывать странички. Это очень удобно в машине, когда нет времени смотреть на экран, а узнать что-то необходимо, либо нужно внести заметки о встрече в свой календарь.

Первой компанией, что попыталась перенести эти наработки в домашнюю обстановку и преуспела в этом, стала компания Amazon. Пару лет назад они выпустили помощника – Amazon Echo, небольшую колонку, которая распознает голосовые команды и позволяет получать ответы на свои вопросы, добавлять информацию в свой календарь, ставить будильники, одним словом, делать все то, что вы можете сделать на смартфоне. Относительно недавно вышла вторая версия устройства – Echo Dot, она стала меньше, а голосовой помощник, которого зовут Alexa, стал чуточку умнее. Посмотрите ролик про Alexa, чтобы понять, что она умеет сегодня. Перевод не требуется, смысл рассказа понятен и так.

У Google есть аналогичное устройство, которое называется Google Home, и оно обладает примерно теми же возможностями, что и Echo. Отмечу, что в Google Home лучше работает распознавание голоса, можно говорить сложные фразы, а вот Echo примерно на уровне Siri, часто сложные вопросы ставят систему в тупик. Зато у Echo есть поддержка многих устройств умного дома, которые можно контролировать голосом, это преимущество того, что Echo появился несколько раньше. Часто эти системы сравнивают между собой по текущим возможностям и параметрам, что, на мой взгляд, несколько преждевременно.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Мы находимся в самом начале развития голосовых помощников и эволюции их интерфейсов, и говорить о том, что кто-то уже выиграл эту гонку, нельзя. Качество работы голосового помощника будет зависеть от нескольких моментов, попробую перечислить их в случайном порядке:

  • Качество распознавания речи;
  • Качество синтеза речи;
  • Возможность «понимания» как простых команд, так и сложных вопросов, заданных в произвольной форме.

Первые два пункта носят сугубо технический характер, пути решения для этих вопросов понятны, и ежегодно качество распознавания речи на разных языках возрастает. Более того, тот же Google уже научился распознавать вкрапления слов, сказанных на других языках, например, сказав «хочу послушать Deep Purple», вы увидите правильную расшифровку названия группы на английском языке. Система распознавания постепенно обучается тому, что не всегда люди в одной фразе пользуются исключительно своим родным языком, давая оригинальные имена явлениям, музыкальным группам, да много чему.

Сложнее ситуация с пониманием сложных предложений, например, задавать Alexa или Siri длинные вопросы не стоит, ответ скорее всего вас разочарует. А вот попробовать пообщаться с Google о том, почему Толстой выбрал таких героев для романа «Война и мир», можно попробовать. Коренное отличие подхода Google от того же Amazon или Apple заключается в том, что голосовой интерфейс не является для компании чем-то отдельным, он часть большей системы поискового гиганта. Фактически, имея постоянно улучшающийся поиск, в Google переносят его в голосовой интерфейс, что позволяет добиться намного лучших результатов, чем у конкурентов. В этой гонке выигрывает не тот, кто создает лучшую технологию распознавания голоса или синтеза речи, а тот, кто может создать систему, умеющую предугадывать желания пользователей и создавать для них дополнительный комфорт. Условно идеологию Google следующего десятилетия можно описать так: «отвечать на вопросы людей, которые они еще не успели задать». В то же время Amazon, Apple и другие компании планируют и создают системы, что напрочь лишены прогнозной части, а умеют лишь отвечать на четко поставленные вопросы. Типовой сценарий, например, прогноз погоды или маршрут до работы, считать сложным прогнозом нельзя, это банально и неинтересно. Хотя для кого-то, может, и создает видимость «интеллекта» машины.

Проблема успешного помощника заключается в необходимости доступа к большому объему информации, как к вашим личным данным, так и к различным сервисам. Приведу такой пример. Каждый год у меня есть традиционные поездки на выставки, в январе я отправляюсь на CES в Лас-Вегас, в феврале-марте – в Барселону на MWC, в сентябре еду в Берлин на IFA. Каждый год маршруты примерно одинаковы, равно как и та информация, которая мне нужна как до поездок, так и во время них. Как может определить мою поездку тот же Amazon или Siri? По факту писем, в которых содержатся билеты, бронь на гостиницу, или соответствующих поисков, которые сделаны через устройства этих компаний. В случае Google компания «видит» мою историю перемещений и может проанализировать ее, причем такой анализ может быть многоплановым – это история геометок, анализ фотографий и того, что на них изображено, почта с письмами и так далее. Не стоит недооценивать смартфоны на Android, так как они дают всеобъемлющую информацию о том, что мы делаем, когда и как. Анализируя эти данные, можно понять наши пристрастия в еде (сколько вы провели времени в ресторанах, какие вам нравятся больше, какие меньше, сколько времени вы скучали за столом и сидели в телефоне). Та же Alexa ничего этого не знает и никакой возможности узнать не имеет, она отрезана от мира и заточена в вашем доме. А значит, прогнозирование для нее – это тайна за семью печатями, обеспечить высокий уровень система не сможет. Уникальность положения Google заключается в том, что это одновременно поисковый гигант и производитель платформы, что установлена на большинстве мобильных устройств в мире. Тот же Apple в теории может попытаться собирать ровно те же данные, но их качество будет заметно ниже, у них просто нет аналогичных возможностей по обработке данных, что хорошо видно на примере карт от Apple: число POI, их качество и подробности оставляют желать лучшего. В теории они смогут улучшить эти параметры до уровня текущего Google за 4-5 лет, но за это время и Google уйдет вперед.

У Amazon еще меньше данных, чем у Apple, поэтому у них перспектив на этом рынке и того меньше. Из крупных игроков можно и нужно вспомнить Microsoft, которые страдают от отсутствия данных из полей, у них нет мобильных устройств на своей ОС. А есть еще Facebook, который максимально близок к Google по сбору информации о том, что делают его пользователи ежедневно, но также страдает из-за отсутствия поисковой информации в большом количестве. Любая компания, которая захочет стать сильным игроком на рынке голосовых помощников, будет вынуждена решать очень сложный вопрос: где взять поисковую информацию, которая сможет повысить точность прогнозов и сделать их полезными.

В моем примере это будет означать необходимость предоставить мне наилучшие билеты в другие города, подсказать на основании исторических данных, когда их лучше всего купить, а также посмотреть те гостиницы, в которых я уже останавливался, и предложить наилучшие цены. Возможно, в автоматическом режиме написать в гостиницу и запросить скидку для постоянного клиента. Фантастика? Поверьте, эта фантастика случится с нами намного быстрее, чем вам кажется, это дело ближайшего десятилетия. Автоматизация нашей жизни произойдет моментально, и нам она наверняка понравится, хотя не обойдется и без шишек во время становления технологии. Например, текущие голосовые помощники не идентифицируют своих владельцев по голосу, достаточно сказать команду, и они начинают работать. Доходит до смешного, люди смотрят на телевизоре или компьютере ролик про проблему Alexa с заказом кукол для детей без ведома владельцев, и их Alexa также распознает команду на покупку и отправляет такой заказ! Это забавная иллюстрация того, что в будущем идентификация хозяина по голосу станет необходимой частью таких систем, они пока в самом начале своего пути.

С коммерческой точки зрения лидер сегодняшнего рынка помощников для дома – это Amazon. В компании не стали держать Alexa только для себя, а лицензируют эту технологию всем желающим. На CES 2017 больше десятка компаний показали свои продукты со встроенным помощником Alexa, это как прямые копии домашнего помощника Echo от Amazon, так и интеграция Alexa в телевизоры, холодильники, стиральные машины и даже наушники.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Пожалуй, именно этот факт и заставляет многих думать, что наступает время Amazon на этом рынке, но у меня есть свое мнение об этом. Засилье Alexa в продуктах других компаний связано с тем, что в Google не дают своего ассистента вовне, так как не считают его готовым. Он еще проходит обкатку в разных продуктах компании, например, вы можете загрузить мессенджер Allo и пообщаться с помощником в нем, увидите довольно нетривиальные варианты взаимодействия (пока, увы и ах, только на английском языке).

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Как показывает история, в Google выпускают свои технологии на широкий рынок и не стремятся создавать самостоятельно железо, так случится и с условным Google Home, он будет доступен всем желающим, как только технологию сочтут готовой для массового рынка. Это значит, что у Alexa есть не так много времени, чтобы закрепиться на рынке. Тем более что работает Alexa поверх того же Android, то есть замена этого помощника на таковой от Google может происходить легко и просто. Скорее всего, мы увидим аналоги Google Home от разных компаний в конце 2017 - начале 2018 года.

В какой-то мере это пока очень узкая ниша, этакое устройство для управления умным домом и поиска, лишенное экрана на корпусе (смартфон – вот его удаленный экран) и с голосовым интерфейсом. Обратите внимание, что голосовых интерфейсов в нашей жизни незаслуженно мало, их почти нет. Я смог вспомнить лифты, которые отсчитывают этажи и говорят, куда они движутся, машину, которая сообщает важные новости голосом, и, пожалуй, все. Телефоны в расчет не беру, тут все понятно, интерфейс присутствует, и мы им пользуемся. Возможно, что эта тема станет модной на короткий промежуток времени. Возможно, что нет. Это не играет роли, так как голосовые интерфейсы станут стандартными для множества устройств, они выглядят естественно и позволяют избежать необходимости добавлять на корпус кучу клавиш и управляющих элементов, многие из которых излишни. Пример из другой области – это наушники The Dash от компании Bragi. В них есть голосовой помощник, который помогает их настроить и управлять наушниками в разных ситуациях. Нечто подобное есть у разных производителей, но именно в этих наушниках помощник стал не просто удобным, а приятным в использовании и выглядит естественно.

Голосовые интерфейсы вылезли из пеленок, технология стала взрослой. Но если у Google они присоединена ко всему, что делает компания в других областях, и будет использована для прогнозирования того, что вам нужно, то у других компаний все намного проще. В этом отличие, и поэтому я верю в то, что Google в конечном итоге будет очень популярен на этом рынке, повторит успех Android. Собственно голосовые помощники станут производным от Android для Google. Параллельно надо сказать, что получат развитие обычные голосовые интерфейсы для управления большим числом устройств, это будут простые или даже сложные команды. Например, вы сможете побеседовать со своим чайником и сказать, что-то этакое: «Вскипяти воду к вечерним новостям и напомни мне об этом свистком». Но это просто управление, а не прогнозирование, и не стоит путать эти две области. Чайник в Google Home, наоборот, вскипит за минуту до того, как вы решите прийти на кухню и включить его. Но это случится не завтра, а чуть позднее, когда такие системы получат широкое распространение. Мы уже движемся к этому семимильными шагами.

Ссылки по теме

Эльдар Муртазин (eldar@mobile-review.com)
Twitter    Instagram    Блог MrMurtazin.com

Опубликовано — 12 января 2017 г.

Мы в социальных сетях:

blog comments powered by Disqus

Есть, что добавить?! Пишите... eldar@mobile-review.com

 

Новости:

26.04.2017 OnePlus 5 появился на рендерах

26.04.2017 iPhone 8 может задержаться с выходом из-за поставщиков комплектующих

26.04.2017 В ближайшие два года Xiaomi выйдет на рынок США

Hit

26.04.2017 Видео на канале: Обзор Alcatel A3 enjoy now

26.04.2017 Lenovo может закрыть свой суббренд ZUK

26.04.2017 Skylink обновляет тарифную линейку

26.04.2017 ARCHOS Drone - первый квадрокоптер Archos доступный в России

26.04.2017 Российские операторы связи начали отказываться от СМС в пакетных тарифах

26.04.2017 ZTE MAX XL – недорогой 6-дюймовый фаблет для североамериканского рынка

26.04.2017 AliExpress вводит для России услугу однодневной доставки товара

26.04.2017 ESET: «всеядный» троян перехватывает пароли от мобильного банка, Facebook и Instagram

25.04.2017 Sega показала пневматическую копию «силового кулака» из Warhammer 40k

25.04.2017 Google Maps переведут все на язык пользователя автоматически

25.04.2017 Навигация от 2ГИС научилась строить пешие маршруты

25.04.2017 Платежные сервисы Samsung Pay и Apple Pay стали доступны держателям карт Visa Сбербанка

Hit

25.04.2017 Видео на канале: Сравнение Samsung Galaxy S8+ и S7 Edge

Hit

25.04.2017 Видео на канале: Сравнение Samsung Galaxy S8+ и LG G6

Hit

25.04.2017 Видео на канале: Обзор Samsung Galaxy S8+

Hit

25.04.2017 Видео на канале: Тест IP68 Samsung Galaxy A7 2017

25.04.2017 Яндекс запустил платформу для совместной работы и общения — «Коннект»

25.04.2017 Tele2 запустил услугу передачи голосового трафика в сети LTE

25.04.2017 Prestigio представил свой новый смартфон – Grace Z3

25.04.2017 Sony представила Xperia XZ Premium в цвете розовая бронза

25.04.2017 Новые беспроводные защищенные наушники Sony серии Walkman WS620

24.04.2017 Apple выполнила предписание ФАС по ремонту iPhone, включая замену экрана

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.