Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Голосовые команды появились давным-давно, но так и не стали революцией, которая навсегда изменила наш мир, а когда-то казалось, что именно так и произойдет. Зачем нажимать на кнопки телефона, если можно произнести команду и он тут же выполнит ее? В те времена казалось, что голосовой интерфейс – это будущее, за которое стоит побороться, и в этой гонке участвовали многие компании. Но они быстро осознали, что сам по себе интерфейс не дает ровным счетом ничего, люди стесняются разговаривать со своими устройствами, им это кажется ненормальным. Голосовой набор стал чем-то привычным, но особо не используемым в повседневной жизни, пока не произошел повторный расцвет, в первую очередь за счет голосового поиска и распознавания на Android, во вторую очередь за счет Siri от Apple. Люди стали чаще использовать голосовой набор, команды для установки будильников и напоминаний, причем происходит это уже на естественном языке. Достаточно сказать фразу «OK, Google, поставь будильник на 7 утра», чтобы ваш смартфон это сделал. Такого рода команд огромное количество, и они позволяют обходиться без рук, с телефоном можно общаться голосом, и он сносно распознает все команды. Десять лет назад о таком можно было только мечтать, а сегодня это уже привычная деталь современных устройств, которая не вызывает никакого удивления, а воспринимается некой повседневной нормой. Постепенно непривычность этого интерфейса исчезает, все чаще мы задаем поисковые запросы голосом, так как это быстрее, чем набирать текст на сенсорной клавиатуре. Равно как и телефоны начинают нам отвечать голосом, а не просто показывать странички. Это очень удобно в машине, когда нет времени смотреть на экран, а узнать что-то необходимо, либо нужно внести заметки о встрече в свой календарь.

Первой компанией, что попыталась перенести эти наработки в домашнюю обстановку и преуспела в этом, стала компания Amazon. Пару лет назад они выпустили помощника – Amazon Echo, небольшую колонку, которая распознает голосовые команды и позволяет получать ответы на свои вопросы, добавлять информацию в свой календарь, ставить будильники, одним словом, делать все то, что вы можете сделать на смартфоне. Относительно недавно вышла вторая версия устройства – Echo Dot, она стала меньше, а голосовой помощник, которого зовут Alexa, стал чуточку умнее. Посмотрите ролик про Alexa, чтобы понять, что она умеет сегодня. Перевод не требуется, смысл рассказа понятен и так.

У Google есть аналогичное устройство, которое называется Google Home, и оно обладает примерно теми же возможностями, что и Echo. Отмечу, что в Google Home лучше работает распознавание голоса, можно говорить сложные фразы, а вот Echo примерно на уровне Siri, часто сложные вопросы ставят систему в тупик. Зато у Echo есть поддержка многих устройств умного дома, которые можно контролировать голосом, это преимущество того, что Echo появился несколько раньше. Часто эти системы сравнивают между собой по текущим возможностям и параметрам, что, на мой взгляд, несколько преждевременно.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Мы находимся в самом начале развития голосовых помощников и эволюции их интерфейсов, и говорить о том, что кто-то уже выиграл эту гонку, нельзя. Качество работы голосового помощника будет зависеть от нескольких моментов, попробую перечислить их в случайном порядке:

  • Качество распознавания речи;
  • Качество синтеза речи;
  • Возможность «понимания» как простых команд, так и сложных вопросов, заданных в произвольной форме.

Первые два пункта носят сугубо технический характер, пути решения для этих вопросов понятны, и ежегодно качество распознавания речи на разных языках возрастает. Более того, тот же Google уже научился распознавать вкрапления слов, сказанных на других языках, например, сказав «хочу послушать Deep Purple», вы увидите правильную расшифровку названия группы на английском языке. Система распознавания постепенно обучается тому, что не всегда люди в одной фразе пользуются исключительно своим родным языком, давая оригинальные имена явлениям, музыкальным группам, да много чему.

Сложнее ситуация с пониманием сложных предложений, например, задавать Alexa или Siri длинные вопросы не стоит, ответ скорее всего вас разочарует. А вот попробовать пообщаться с Google о том, почему Толстой выбрал таких героев для романа «Война и мир», можно попробовать. Коренное отличие подхода Google от того же Amazon или Apple заключается в том, что голосовой интерфейс не является для компании чем-то отдельным, он часть большей системы поискового гиганта. Фактически, имея постоянно улучшающийся поиск, в Google переносят его в голосовой интерфейс, что позволяет добиться намного лучших результатов, чем у конкурентов. В этой гонке выигрывает не тот, кто создает лучшую технологию распознавания голоса или синтеза речи, а тот, кто может создать систему, умеющую предугадывать желания пользователей и создавать для них дополнительный комфорт. Условно идеологию Google следующего десятилетия можно описать так: «отвечать на вопросы людей, которые они еще не успели задать». В то же время Amazon, Apple и другие компании планируют и создают системы, что напрочь лишены прогнозной части, а умеют лишь отвечать на четко поставленные вопросы. Типовой сценарий, например, прогноз погоды или маршрут до работы, считать сложным прогнозом нельзя, это банально и неинтересно. Хотя для кого-то, может, и создает видимость «интеллекта» машины.

Проблема успешного помощника заключается в необходимости доступа к большому объему информации, как к вашим личным данным, так и к различным сервисам. Приведу такой пример. Каждый год у меня есть традиционные поездки на выставки, в январе я отправляюсь на CES в Лас-Вегас, в феврале-марте – в Барселону на MWC, в сентябре еду в Берлин на IFA. Каждый год маршруты примерно одинаковы, равно как и та информация, которая мне нужна как до поездок, так и во время них. Как может определить мою поездку тот же Amazon или Siri? По факту писем, в которых содержатся билеты, бронь на гостиницу, или соответствующих поисков, которые сделаны через устройства этих компаний. В случае Google компания «видит» мою историю перемещений и может проанализировать ее, причем такой анализ может быть многоплановым – это история геометок, анализ фотографий и того, что на них изображено, почта с письмами и так далее. Не стоит недооценивать смартфоны на Android, так как они дают всеобъемлющую информацию о том, что мы делаем, когда и как. Анализируя эти данные, можно понять наши пристрастия в еде (сколько вы провели времени в ресторанах, какие вам нравятся больше, какие меньше, сколько времени вы скучали за столом и сидели в телефоне). Та же Alexa ничего этого не знает и никакой возможности узнать не имеет, она отрезана от мира и заточена в вашем доме. А значит, прогнозирование для нее – это тайна за семью печатями, обеспечить высокий уровень система не сможет. Уникальность положения Google заключается в том, что это одновременно поисковый гигант и производитель платформы, что установлена на большинстве мобильных устройств в мире. Тот же Apple в теории может попытаться собирать ровно те же данные, но их качество будет заметно ниже, у них просто нет аналогичных возможностей по обработке данных, что хорошо видно на примере карт от Apple: число POI, их качество и подробности оставляют желать лучшего. В теории они смогут улучшить эти параметры до уровня текущего Google за 4-5 лет, но за это время и Google уйдет вперед.

У Amazon еще меньше данных, чем у Apple, поэтому у них перспектив на этом рынке и того меньше. Из крупных игроков можно и нужно вспомнить Microsoft, которые страдают от отсутствия данных из полей, у них нет мобильных устройств на своей ОС. А есть еще Facebook, который максимально близок к Google по сбору информации о том, что делают его пользователи ежедневно, но также страдает из-за отсутствия поисковой информации в большом количестве. Любая компания, которая захочет стать сильным игроком на рынке голосовых помощников, будет вынуждена решать очень сложный вопрос: где взять поисковую информацию, которая сможет повысить точность прогнозов и сделать их полезными.

В моем примере это будет означать необходимость предоставить мне наилучшие билеты в другие города, подсказать на основании исторических данных, когда их лучше всего купить, а также посмотреть те гостиницы, в которых я уже останавливался, и предложить наилучшие цены. Возможно, в автоматическом режиме написать в гостиницу и запросить скидку для постоянного клиента. Фантастика? Поверьте, эта фантастика случится с нами намного быстрее, чем вам кажется, это дело ближайшего десятилетия. Автоматизация нашей жизни произойдет моментально, и нам она наверняка понравится, хотя не обойдется и без шишек во время становления технологии. Например, текущие голосовые помощники не идентифицируют своих владельцев по голосу, достаточно сказать команду, и они начинают работать. Доходит до смешного, люди смотрят на телевизоре или компьютере ролик про проблему Alexa с заказом кукол для детей без ведома владельцев, и их Alexa также распознает команду на покупку и отправляет такой заказ! Это забавная иллюстрация того, что в будущем идентификация хозяина по голосу станет необходимой частью таких систем, они пока в самом начале своего пути.

С коммерческой точки зрения лидер сегодняшнего рынка помощников для дома – это Amazon. В компании не стали держать Alexa только для себя, а лицензируют эту технологию всем желающим. На CES 2017 больше десятка компаний показали свои продукты со встроенным помощником Alexa, это как прямые копии домашнего помощника Echo от Amazon, так и интеграция Alexa в телевизоры, холодильники, стиральные машины и даже наушники.

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Пожалуй, именно этот факт и заставляет многих думать, что наступает время Amazon на этом рынке, но у меня есть свое мнение об этом. Засилье Alexa в продуктах других компаний связано с тем, что в Google не дают своего ассистента вовне, так как не считают его готовым. Он еще проходит обкатку в разных продуктах компании, например, вы можете загрузить мессенджер Allo и пообщаться с помощником в нем, увидите довольно нетривиальные варианты взаимодействия (пока, увы и ах, только на английском языке).

Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon Голосовые сервисы и их будущее развитие на примере Alexa от Amazon

Как показывает история, в Google выпускают свои технологии на широкий рынок и не стремятся создавать самостоятельно железо, так случится и с условным Google Home, он будет доступен всем желающим, как только технологию сочтут готовой для массового рынка. Это значит, что у Alexa есть не так много времени, чтобы закрепиться на рынке. Тем более что работает Alexa поверх того же Android, то есть замена этого помощника на таковой от Google может происходить легко и просто. Скорее всего, мы увидим аналоги Google Home от разных компаний в конце 2017 - начале 2018 года.

В какой-то мере это пока очень узкая ниша, этакое устройство для управления умным домом и поиска, лишенное экрана на корпусе (смартфон – вот его удаленный экран) и с голосовым интерфейсом. Обратите внимание, что голосовых интерфейсов в нашей жизни незаслуженно мало, их почти нет. Я смог вспомнить лифты, которые отсчитывают этажи и говорят, куда они движутся, машину, которая сообщает важные новости голосом, и, пожалуй, все. Телефоны в расчет не беру, тут все понятно, интерфейс присутствует, и мы им пользуемся. Возможно, что эта тема станет модной на короткий промежуток времени. Возможно, что нет. Это не играет роли, так как голосовые интерфейсы станут стандартными для множества устройств, они выглядят естественно и позволяют избежать необходимости добавлять на корпус кучу клавиш и управляющих элементов, многие из которых излишни. Пример из другой области – это наушники The Dash от компании Bragi. В них есть голосовой помощник, который помогает их настроить и управлять наушниками в разных ситуациях. Нечто подобное есть у разных производителей, но именно в этих наушниках помощник стал не просто удобным, а приятным в использовании и выглядит естественно.

Голосовые интерфейсы вылезли из пеленок, технология стала взрослой. Но если у Google они присоединена ко всему, что делает компания в других областях, и будет использована для прогнозирования того, что вам нужно, то у других компаний все намного проще. В этом отличие, и поэтому я верю в то, что Google в конечном итоге будет очень популярен на этом рынке, повторит успех Android. Собственно голосовые помощники станут производным от Android для Google. Параллельно надо сказать, что получат развитие обычные голосовые интерфейсы для управления большим числом устройств, это будут простые или даже сложные команды. Например, вы сможете побеседовать со своим чайником и сказать, что-то этакое: «Вскипяти воду к вечерним новостям и напомни мне об этом свистком». Но это просто управление, а не прогнозирование, и не стоит путать эти две области. Чайник в Google Home, наоборот, вскипит за минуту до того, как вы решите прийти на кухню и включить его. Но это случится не завтра, а чуть позднее, когда такие системы получат широкое распространение. Мы уже движемся к этому семимильными шагами.

Ссылки по теме

Эльдар Муртазин ([email protected])

Опубликовано — 12 января 2017 г.

Поделиться

Мы в социальных сетях:

Новости:

13.05.2021 MediaTek представила предфлагманский чипсет Dimensity 900 5G

13.05.2021 Cайты, имеющие 500 тысяч пользователей из России, должны будут открыть местные филиалы

13.05.2021 Amazon представила обновления своих умных дисплеев Echo Show 8 и Echo Show 5

13.05.2021 МТС ввел удобный тариф без абонентской платы - «МТС Нон-стоп»

13.05.2021 Zenfone 8 Flip – вариант Galaxy A80 от ASUS

13.05.2021 Поставки мониторов в этом году достигнут 150 млн

13.05.2021 Состоялся анонс модной версии «умных» часов Samsung Galaxy Watch3 TOUS

13.05.2021 Tele2 выходит на Яндекс.Маркет

13.05.2021 OPPO представила чехол для смартфона, позволяющий управлять устройствами умного дома

13.05.2021 TWS-наушники с активным шумоподавлением Xiaomi FlipBuds Pro

13.05.2021 В России до конца следующего года появится госстандарт для искусственного интеллекта

13.05.2021 ASUS Zenfone 8 – компактный флагман на Snapdragon 888

12.05.2021 Компания Genesis представила внешность своего первого универсала G70 Shooting Brake

12.05.2021 В России разработан высокоточный гироскоп для беспилотников

12.05.2021 В Россию привезли новую версию смарт-часов HUAWEI WATCH FIT, Elegant Edition

12.05.2021 Раскрыты ключевые особенности смартфона POCO M3 Pro 5G

12.05.2021 Honor 50: стали известны дизайн и другие подробности о смартфоне

12.05.2021 Чипсет Exynos 2200 от Samsung будет устанавливаться и в смартфоны, и в ноутбуки

12.05.2021 МТС начала подключать многоквартирные дома к интернету вещей

12.05.2021 iPhone 13 будет толще и получит более крупные камеры по сравнению с iPhone 12

12.05.2021 Xiaomi договорилась с властями США об исключении из чёрного списка

12.05.2021 Xiaomi выпустила обновлённую версию умного пульта Agara Cube T1 Pro

Hit

12.05.2021 Игровые ноутбуки с NVIDIA GeForce RTX 3050 Ti уже в России!

12.05.2021 Индийский завод Foxconn сократил производство в два раза

12.05.2021 Lenovo отказалась от очного участия в предстоящем в июне Mobile World Congress

Подписка
 
© Mobile-review.com, 2002-2021. All rights reserved.