Ах, Алиса, как бы нам встретиться? Как поболтать обо всем?

Привет.

На днях услышал грустную историю о том, как мой приятель мучается в отсутствие умного дома от Google в наших широтах. В городской квартире и за городом он настроил Алису от “Яндекса”, все возможности умных колонок полностью его устраивают, за исключением одной “мелочи”: его младшую дочь зовут Алиса. Пятилетний ребенок с удовольствием говорит со своей тезкой, но для родителей это превратилось в нескончаемый кошмар, любое обращение к дочери пробуждает колонки. Смена фразы активации на “Яндекс” привнесла другие проблемы, теперь каждая колонка пробуждается и пытается что-то сделать. Дети смотрят в гостиной фильм, родители на кухне что-то обсуждают и просят “Яндекс” найти ответ на вопрос — мультики отрубаются, и нужно их включать снова. Невозможность выбора имени в настройках Алисы – функция, скопированная у Google, причем скопированная механически и без особых размышлений (если вам нравится, то можно сказать, что копировали Alexa от Amazon, разницы тут нет).

В идеальном мире каждая колонка должна уметь определять, что обращаются именно к ней, и соответственно реагировать. К сожалению, у продуктов от “Яндекса” такая опция есть, но работает она не слишком хорошо. Решением могла бы стать возможность называть каждую колонку своим именем, но такой опции в силу ряда причин нет. И это то, что унаследовано от той же Google как идея, которая потерялась или не была понята правильно.

Лидером рынка голосовых ассистентов в мире сегодня является Google, компания изначально выстроила систему так, чтобы при обращении вам нужно было произносить имя корпорации. Кто-то скажет, что это выдумка маркетологов, чтобы повышать привязку к бренду, но на самом деле это не совсем так. За выбором фразы активации стоит красивая идея о том, что голосовые помощники должны эволюционировать, от младенчества, в котором они находятся сегодня, переходить к первым шагам, затем дорасти до школы и так далее.

Хорошим примером может служить фильм “Она”, он вышел в 2013 году, но отлично описывает то будущее, что нас ждет. Небольшой компьютер в виде беспроводной гарнитуры становится спутником Теодора, главный герой обретает в нем друга, любимую женщину. В фильме есть интересный момент, когда Теодор настраивает голосового помощника, и “она” пролистывает книгу с детскими именами, чтобы выбрать имя собственное, называет себя Самантой. Если пропустили фильм, то посмотрите, он откровенно хорош и пытается исследовать грань между человеком и технологией.

Идея Google в области голосовых ассистентов заключается в том, что они могут получать имя собственное в момент, когда их AI-алгоритмы станут неотличимы от живого человека и такой ассистент пройдет тест Тьюринга. Конкуренты, не имеющие столь сложных технологий и перспектив, напротив, используют имена собственные, чтобы придать своим продуктам налет человечности. Мы видим использование таких имен, как Siri, Alexa, Алиса и других, это попытка добавить человечности продуктам, в которых нет на данный момент чего-то сложного. Одушевление нематериальной материи, программных кодов дает дополнительные очки, словно человек начнет относиться к продукту иначе, перенесет на него отношение к живому человеку. Но этого не происходит в силу того, что голосовые ассистенты не очень сложны, они не умеют поддерживать диалоги, могут отвечать только на прямо поставленные вопросы, причем многие из них неверно их понимают в разном контексте.

Будущее за решениями, в которых мы сможем самостоятельно выбирать имена для своих устройств, для каждого из них. Поставили колонку на кухне, придумали для нее имя. В гостиной у колонки другое имя и так далее. При этом следующий шаг, который необходим для развития умных колонок, это распознавание индивидуальных голосов тех, кто живет в доме. В “Яндексе” пока не умеют этого делать, что приводит к тому, что ребенок может заказать такси, просто играя с колонкой. Задача, безусловно, сложная и требующая недюжинных технологических трюков, но та же Google с ней справляется. В “Яндексе” над распознаванием разных голосов работают, но за последние два года прогресс в этой области отсутствует, если судить по тому, что происходит в коммерческих продуктах.

В 2017 году, когда в “Яндексе” выбирали имя Алиса, в компании рассуждали, что оно должно быть уникальным и не самым распространенным. Выбирая между именами Майя и Алиса, предпочтение отдали второму, так как перепутать его с другими словами сложно. А вот Майя легко бы отзывалась на словосочетание “Девятое мая”.

Мне стало интересно посмотреть, как выбор имени “Яндексом” повлиял на то, как называют девочек в нашей стране. Пока такое влияние есть в больших городах, на примере Москвы видно, что имя Алиса постепенно становится все менее популярным, и это только начало пути.

Думаю, что родители не хотят называть девочек именем голосового ассистента, причем эта зависимость хорошо видна в Москве и в Петербурге. Можно наложить распространение умных домов на эти города, и тогда получим прямую зависимость. Как раз начиная с 2019 года есть определенный всплеск в использовании умных домов, их количество растет, а Алиса безусловно доминирует в этой области. Уверен, что имя полностью не исчезнет, но то, что стараниями “Яндекса” оно станет менее распространенным, не вызывает сомнений.

И в этом аспекте выбор выдуманных имен намного лучше, а ведь таковыми являются Google, Cortana, Bixby. Сказать, что имена собственные так же хороши, нельзя. Выходом становится возможность назначать другие имена (фразы активации) для продуктов. Изъяном для маркетологов выглядит то, что люди могут баловаться и называть своих помощников неблагозвучно: “Эй, дурень, включи мне любимую музыку”. Но изменить природу человека так, как этого хотят маркетологи, чтобы все было исключительно по брендбуку, невозможно. Будут менять, будут баловаться, и с этим просто нужно смириться.

В Америке и частично в Европе не первый год идут нешуточные баталии относительно голосов ассистентов. Почему это женские имена, почему они звучат как женщины? И это несмотря на то, что вы уже можете выбрать и мужские голоса, выбор всегда за вами. Пройдет совсем немного времени, и голосовые ассистенты научатся говорить голосами разных людей — звезд кино и просто известных людей, выдуманных персонажей. Выбор будет за вами, будет зависеть от того, кого вы захотите услышать. Огромный рынок имитации голосов еще ждет пробуждения, и он наверняка появится. Поэтому все крики о сексизме, о том, что ассистенты исключительно женщины, от дурости, и можно сказать, что люди бесятся с жиру. В конце концов, никто не обещал, что ассистент изначально должен быть любым и предоставлять выбор. Это всегда дополнительные деньги, которые компании тратят неохотно. И причина этого в том, что им нужно развивать голосовые ассистенты, доводить до нового уровня.

Технологии, что стоят за голосовыми ассистентами и их разумностью, обыденны. Алгоритмы не так уж сложны, но требуется наработка большого количества голосов, их распознавания. Поэтому Google и лидирует в этой области, объем обрабатываемых данных на разных языках огромен. Компания лидер в этой области и останется им.

Эмоция — это сложная штука. Эмуляция эмоций не так проста, в голосовом помощнике это заученные фразы, которые быстро приедаются, мы слышим в них фальшь. И это следующий рубеж, над которым работают компании, научить синтезированные голоса не только зачитывать текст, но и придавать ему эмоции. Тот же “Яндекс” пытается это сделать на массиве книг, в недавнем обновлении Алисы добавили возможность чтения любой бумажной книги, это та самая наработка базы, чтобы в дальнейшем преобразовать начитанное в подобие эмоций. Текст, в котором знаками препинания передается та или иная эмоция, оцифровывается и превращается в учебник для робота.

Бурное развитие голосовых помощников идет последние пять лет, они постепенно проникают в нашу повседневную жизнь. Сказать, что это направление затормозится, нельзя. Но от энтузиазма первых шагов мы перешли к зрелому рынку. Например, та же Siri замерла в развитии, она так и осталась младенцем, которым почти не пользуются, так как она сильно ограничена в своих возможностях. В Bixby от Samsung та же проблема, задачка оказалась не такой простой и требует нешуточных вложений, поэтому Bixby эволюционировал от голосового помощника к системе команд (собственно, так же, как и Siri). Сильнейшим игроком на этом поле является Google, второй с заметным отрывом от нее идет Amazon. В России в отсутствие этих двух компаний лидер только один, это наш “Яндекс”. И это дает компании возможность развиваться, защитить свой кусочек мира, лучше приготовиться к приходу конкурентов. Но скорость развития Алисы очень низка, за это время Google уходит далеко вперед и не удается не то что сохранить разрыв в технологиях, он постоянно увеличивается. С другой стороны, это лучше, чем ничего. Многие страны просто не имеют ничего подобного, и наличие собственного голосового ассистента — это хорошо. Тем более что в гонку вступили другие компании и тот же Сбер за счет финансовых вливаний может побороть технологии Алисы в среднесрочной перспективе. Для нас это хорошо, так как совсем скоро мы сможем переименовывать своих помощников и болтать с ними на отвлеченные темы. Хорошо это или плохо, не знаю, но будущее станет именно таким.

А вы пользуетесь умными колонками?