Ах, Алиса, как бы нам встретиться? Как поболтать обо всем?
Привет.
На днях услышал грустную историю о том, как мой приятель мучается в отсутствие умного дома от Google в наших широтах. В городской квартире и за городом он настроил Алису от “Яндекса”, все возможности умных колонок полностью его устраивают, за исключением одной “мелочи”: его младшую дочь зовут Алиса. Пятилетний ребенок с удовольствием говорит со своей тезкой, но для родителей это превратилось в нескончаемый кошмар, любое обращение к дочери пробуждает колонки. Смена фразы активации на “Яндекс” привнесла другие проблемы, теперь каждая колонка пробуждается и пытается что-то сделать. Дети смотрят в гостиной фильм, родители на кухне что-то обсуждают и просят “Яндекс” найти ответ на вопрос — мультики отрубаются, и нужно их включать снова. Невозможность выбора имени в настройках Алисы – функция, скопированная у Google, причем скопированная механически и без особых размышлений (если вам нравится, то можно сказать, что копировали Alexa от Amazon, разницы тут нет).
В идеальном мире каждая колонка должна уметь определять, что обращаются именно к ней, и соответственно реагировать. К сожалению, у продуктов от “Яндекса” такая опция есть, но работает она не слишком хорошо. Решением могла бы стать возможность называть каждую колонку своим именем, но такой опции в силу ряда причин нет. И это то, что унаследовано от той же Google как идея, которая потерялась или не была понята правильно.
Лидером рынка голосовых ассистентов в мире сегодня является Google, компания изначально выстроила систему так, чтобы при обращении вам нужно было произносить имя корпорации. Кто-то скажет, что это выдумка маркетологов, чтобы повышать привязку к бренду, но на самом деле это не совсем так. За выбором фразы активации стоит красивая идея о том, что голосовые помощники должны эволюционировать, от младенчества, в котором они находятся сегодня, переходить к первым шагам, затем дорасти до школы и так далее.
Хорошим примером может служить фильм “Она”, он вышел в 2013 году, но отлично описывает то будущее, что нас ждет. Небольшой компьютер в виде беспроводной гарнитуры становится спутником Теодора, главный герой обретает в нем друга, любимую женщину. В фильме есть интересный момент, когда Теодор настраивает голосового помощника, и “она” пролистывает книгу с детскими именами, чтобы выбрать имя собственное, называет себя Самантой. Если пропустили фильм, то посмотрите, он откровенно хорош и пытается исследовать грань между человеком и технологией.
Идея Google в области голосовых ассистентов заключается в том, что они могут получать имя собственное в момент, когда их AI-алгоритмы станут неотличимы от живого человека и такой ассистент пройдет тест Тьюринга. Конкуренты, не имеющие столь сложных технологий и перспектив, напротив, используют имена собственные, чтобы придать своим продуктам налет человечности. Мы видим использование таких имен, как Siri, Alexa, Алиса и других, это попытка добавить человечности продуктам, в которых нет на данный момент чего-то сложного. Одушевление нематериальной материи, программных кодов дает дополнительные очки, словно человек начнет относиться к продукту иначе, перенесет на него отношение к живому человеку. Но этого не происходит в силу того, что голосовые ассистенты не очень сложны, они не умеют поддерживать диалоги, могут отвечать только на прямо поставленные вопросы, причем многие из них неверно их понимают в разном контексте.
Будущее за решениями, в которых мы сможем самостоятельно выбирать имена для своих устройств, для каждого из них. Поставили колонку на кухне, придумали для нее имя. В гостиной у колонки другое имя и так далее. При этом следующий шаг, который необходим для развития умных колонок, это распознавание индивидуальных голосов тех, кто живет в доме. В “Яндексе” пока не умеют этого делать, что приводит к тому, что ребенок может заказать такси, просто играя с колонкой. Задача, безусловно, сложная и требующая недюжинных технологических трюков, но та же Google с ней справляется. В “Яндексе” над распознаванием разных голосов работают, но за последние два года прогресс в этой области отсутствует, если судить по тому, что происходит в коммерческих продуктах.
В 2017 году, когда в “Яндексе” выбирали имя Алиса, в компании рассуждали, что оно должно быть уникальным и не самым распространенным. Выбирая между именами Майя и Алиса, предпочтение отдали второму, так как перепутать его с другими словами сложно. А вот Майя легко бы отзывалась на словосочетание “Девятое мая”.
Мне стало интересно посмотреть, как выбор имени “Яндексом” повлиял на то, как называют девочек в нашей стране. Пока такое влияние есть в больших городах, на примере Москвы видно, что имя Алиса постепенно становится все менее популярным, и это только начало пути.
Думаю, что родители не хотят называть девочек именем голосового ассистента, причем эта зависимость хорошо видна в Москве и в Петербурге. Можно наложить распространение умных домов на эти города, и тогда получим прямую зависимость. Как раз начиная с 2019 года есть определенный всплеск в использовании умных домов, их количество растет, а Алиса безусловно доминирует в этой области. Уверен, что имя полностью не исчезнет, но то, что стараниями “Яндекса” оно станет менее распространенным, не вызывает сомнений.
И в этом аспекте выбор выдуманных имен намного лучше, а ведь таковыми являются Google, Cortana, Bixby. Сказать, что имена собственные так же хороши, нельзя. Выходом становится возможность назначать другие имена (фразы активации) для продуктов. Изъяном для маркетологов выглядит то, что люди могут баловаться и называть своих помощников неблагозвучно: “Эй, дурень, включи мне любимую музыку”. Но изменить природу человека так, как этого хотят маркетологи, чтобы все было исключительно по брендбуку, невозможно. Будут менять, будут баловаться, и с этим просто нужно смириться.
В Америке и частично в Европе не первый год идут нешуточные баталии относительно голосов ассистентов. Почему это женские имена, почему они звучат как женщины? И это несмотря на то, что вы уже можете выбрать и мужские голоса, выбор всегда за вами. Пройдет совсем немного времени, и голосовые ассистенты научатся говорить голосами разных людей — звезд кино и просто известных людей, выдуманных персонажей. Выбор будет за вами, будет зависеть от того, кого вы захотите услышать. Огромный рынок имитации голосов еще ждет пробуждения, и он наверняка появится. Поэтому все крики о сексизме, о том, что ассистенты исключительно женщины, от дурости, и можно сказать, что люди бесятся с жиру. В конце концов, никто не обещал, что ассистент изначально должен быть любым и предоставлять выбор. Это всегда дополнительные деньги, которые компании тратят неохотно. И причина этого в том, что им нужно развивать голосовые ассистенты, доводить до нового уровня.
Технологии, что стоят за голосовыми ассистентами и их разумностью, обыденны. Алгоритмы не так уж сложны, но требуется наработка большого количества голосов, их распознавания. Поэтому Google и лидирует в этой области, объем обрабатываемых данных на разных языках огромен. Компания лидер в этой области и останется им.
Эмоция — это сложная штука. Эмуляция эмоций не так проста, в голосовом помощнике это заученные фразы, которые быстро приедаются, мы слышим в них фальшь. И это следующий рубеж, над которым работают компании, научить синтезированные голоса не только зачитывать текст, но и придавать ему эмоции. Тот же “Яндекс” пытается это сделать на массиве книг, в недавнем обновлении Алисы добавили возможность чтения любой бумажной книги, это та самая наработка базы, чтобы в дальнейшем преобразовать начитанное в подобие эмоций. Текст, в котором знаками препинания передается та или иная эмоция, оцифровывается и превращается в учебник для робота.
Бурное развитие голосовых помощников идет последние пять лет, они постепенно проникают в нашу повседневную жизнь. Сказать, что это направление затормозится, нельзя. Но от энтузиазма первых шагов мы перешли к зрелому рынку. Например, та же Siri замерла в развитии, она так и осталась младенцем, которым почти не пользуются, так как она сильно ограничена в своих возможностях. В Bixby от Samsung та же проблема, задачка оказалась не такой простой и требует нешуточных вложений, поэтому Bixby эволюционировал от голосового помощника к системе команд (собственно, так же, как и Siri). Сильнейшим игроком на этом поле является Google, второй с заметным отрывом от нее идет Amazon. В России в отсутствие этих двух компаний лидер только один, это наш “Яндекс”. И это дает компании возможность развиваться, защитить свой кусочек мира, лучше приготовиться к приходу конкурентов. Но скорость развития Алисы очень низка, за это время Google уходит далеко вперед и не удается не то что сохранить разрыв в технологиях, он постоянно увеличивается. С другой стороны, это лучше, чем ничего. Многие страны просто не имеют ничего подобного, и наличие собственного голосового ассистента — это хорошо. Тем более что в гонку вступили другие компании и тот же Сбер за счет финансовых вливаний может побороть технологии Алисы в среднесрочной перспективе. Для нас это хорошо, так как совсем скоро мы сможем переименовывать своих помощников и болтать с ними на отвлеченные темы. Хорошо это или плохо, не знаю, но будущее станет именно таким.
А вы пользуетесь умными колонками?
Да, Сири из первого массово внедренного в потребительскую технику ассистента превратилась в самого отстающего. Эльдар Викторович тут абсолютно прав, текущее её состояние иначе как плачевным не назвать, в сравнении с тем же Гуглом.Добавлю только, что Эппл стала на данный момент единственной из зарубежных техгигантов, который внедрил поддержку русского языка в свои умные колонки. Для меня по сей день остаётся загадкой, почему Гугл убрал поддержку русского языка из своих динамиков
Думаю политика, демократия и что-то типа Крым наш. Хотя сейчас подумал, возможно тут товарищ майор замешан.
Надо было Виленой назвать
Переезд с "Ок, Гугл" на "Алиса…" в моем случае тормозит только отсутствие у Яндекса календаря, нормальной напоминалки, контактов и синхронизации всего этого добра с моими устройствами. Вот что стоит допилить такую простую фичу в свой софт?
Прекрасная фраза, чтобы показать, как манипулировать сознанием масс: " В “Яндексе” над распознаванием разных голосов работают, но за последние два года прогресс в этой области отсутствует, если судить по тому, что происходит в коммерческих продуктах."А если бы Яндекс выпустил недоделанный функционал, сказали бы, что они криворукие.
В том же навигаторе 90% ставит женский голос. Даже девушки.Могу ошибаться, но по моему 90% в навигаторе выключают голос вообще, любой.
Что за туфта со статистикой?!!!! Сумма по колонке банально не бьется и это видно даже на глазок. За 20-й год цифра в среднем около 150, что за 12 месяцев дает всего 1800, но никак не 3700. Также в комментариях упоминали что не учтена рождаемость. В реальности ситуация выглядит так: https://uploads.disquscdn.c… Падение есть. Не настолько катастрофичное, но и не настолько маленькое, чтобы считать незначительным. Около 10%. С 1 Алисы на 30-31 девочку, до 1 на 33-34.
Возможно, но думаю это не главная причина. Мужские голоса банально хуже звучат. Возьмите любого производителя, у которого есть оба. Женский всегда мелодичней.
3. Чтобы добавить жизненности.
есть станция мини в тандеме с модулем новым.работают, часто кое-как.Модуль уж вышел пару месяцев как, а кривь все не исправляют: 1. раз в неделю минимум пульт перестает реагировать на голосовые команды. приходится пепеспаривать.2. в приложении Окко для модуля нет звука при проигрывании фильмов, при этом в трейлерах и на заглавной странице звук есть. Поддержка Окко говорит проблема известна и она на стороне яндекса, яндекс пишут стандартную фигню про "попробуйте переустановить".3. нельзя командами открывать приложения, ютуб, например.4. результаты поиска, серии в сериалах выводятся в виде горизонтальной полоски вверху экрана, 3/4 экрана пустая, проматывать вдаль вправо по полчаса приходится5. во время проигрывания титров (пока горит табличка "пропустить") невозможно сделать ничего, кроме как выйти на домашний экран.6. прерывается проигрывание если колонка среагирует на что-то. Например, как она часто делает, на имя Эльза. Если ребенок смотрит Холодное сердце (там есть такая Эльза) — приходится кнопкой выключать микрофон на колонке.на фоне этого смешно было смотреть хвалебный фильм яндекса о самом себе, кот. появился недавно на заглавной странице)
На формирование личности влияют: генетика, воспитание и окружающая среда. "Генетика" и "воспитание" у всех голосовых ассистентов одного бренда — одинаковая. Окружающая среда их не меняет. Поэтому даже подобия "личности" у них нет.Вот когда на утренний вопрос "ОК, Google. Какая сейчас погода на улице?" колонка в спальне ответит мне : " Блин, окно в метре от тебя. Посмотри и увидишь", а такая же колонка в прихожей: " Ближайшие два часа дождя не будет, можно надеть на пробежку "Кинвары" , вот тогда это будет хотя какая-то имитация личности. А сейчас обе колонки разными голосами проговаривают один и тот же текст. Какая тут личность?
Класс. Но можно сказать еще проще — для личности нужен разум. Которого нет и в ближайшее время не предвидится.
Разум — это уже вершина. И в искусственном разуме я вижу потенциальную опасность. Тут хотя бы правдоподобную имитацию сделали. На самом деле, вся нужная для этого информация обо мне у Google есть или он может её получить. Они же научились присылать таргетированную рекламу. Что стоит "прикрутить" к ассистенту таргетированные ответы?
Кажется мы под термином понимаем разное. В данном случае, я жду лишь метанейросеть, которая сама сможет обобщать. Потому что нынешний "интеллект" не более чем рефлекс A -> B. Да, под стрелочкой может лежать довольно нетривиальный механизм принятия решений, но на A -> B1 или A1 -> B (где 1 указатель на отличный, но подобный набор данных/выводов), этот рефлекс не способен.
Да нет, говорим об одном и том же. И не совсем понимаем друг друга. Вот оно — разум! )))) Колонки поняли бы друг друга с полуслова."Метанейросеть", умеющая обобщать и подстраиваться под каждого конкретного абонента, со знанием технологий межличностного общения, как мне кажется, может в значительной мере "убить" обычное общение между людьми. Зачем общаться с живым человеком, если есть ассистент, который и подскажет так, как нужно и послать может в нужный момент и вообще будет идеально подстраиваться под настроение.
Поворот прохлопать можно или зад авто спереди, тоже прохлопать по причине отвлечения на навигатор 🙂
Левитана зачем использовали в своё время? ;-)Использовали бы какую-нибудь молодую профурсетку.
Пока что все эти ассистенты невероятно тупые.Что то спрашиваешь, они заглыхают.Быстро «наигрываешься» с ними.То есть погоду и пробки можно посмотреть на телефоне на одном экране.Некоторые извращуги вешают включение света на голосовую команду, но это очень похоже на неоднократное повторение в телефон «позвонить жене» — когда можно просто ткнуть на иконку вызова. https://uploads.disquscdn.c…
Чем вам поможет "через 500 метров возьмите немного левее"? Насколько немного мипая? И как я на ходу эти 500 метров отсчитаю. Ты только скажи. Я возьму, если не промажу :)Или это приглашение посмотреть на экран где опять сменилась реклама в плашке.
Считаю, что корреляция выбора имени Алиса с распространением ассистента в статье не доказана. "Думаю" это не доказательство. Такие утверждения надо обосновывать даже в курсовой работе, не говоря уже о более серьезном уровне.
Вы не поняли! Компьютерные голоса, а не человечьи!
С точки зрения возможностей, Алиса действительно уступает Google, но это вопрос времени. А вот с точки зрения самой речи, Алиса на порядок лучше, и скорее всего такое лидерство у неё будет ещё долго. Даже если опустить язык, Алиса разговаривает куда более естественно, чем любой другой ассистент в мире. У Алисы есть чёткие эмоции, настроения, тональность, и её воспринимаешь как живого помощника. Ассистента Google воспринимаешь исключительно как бездушную машину без имени. Если Google и соберётся активно развивать в России это направление, он всё равно будет на втором плане, так как не достигнет такого же уровня построения речи (раз уж на английском этого не достиг, на русском тем более они этим заниматься не будут).
Наличие некоторых спорных указаний, не исключает множество полезных. Да и в данном случае, мозг отлично поймет — через 500 метров внимание на лево. То есть направо смотреть не надо, вот прямо сейчас тоже никаких действий, но и расслабляться нельзя, скоро поворот. И в отличии от пешеходных маршрутов, где тропинки могут пересекаться и поворачивать под неимоверными углами в неимоверных сочетаниях, асфальт на порядок предсказуемее.
Яндекс отнял у маленьких девочек шансы быть названными Алисами. Ну после этого обвинения кровожадная корпорация уж точно должна обратить внимание на правильную аналитику! ))))
Я, кстати, не пользовался Google-ассистентом именно из-за его деперсонифицированности. Siri пользуюсь регулярно, когда руки заняты. Классический сценарий — для управления музыкой в наушниках, она же мне уведомления зачитывает, когда телефон в кармане. Но именно "Алиса" мне нравится больше всего тем, что она почти живая. А за Google-ассистентом — там за ним ничего нет, что наш человеческий мозг может воспринять как личность. Это именно как говорить с телефоном.
А разве в навигаторах у примеру не человечьи голоса, — чистый синтез (прямо абсолютно, вне семплов человечьего голоса) вроде нигде не встречается.
Ну как только навигатор начинает говорить — смотришь на него и готовишься к маневру.Это в телефонах, их большинство и использует.Встроенный навигатор с проекцией все таки очень редко встречаются, как раз 10% дай боже.
Раньше, во времена WinCE, да, сэмпловый. Причем для каждой программы свой. А сейчас, когда синтез является системным компонентом почти любой ОСи, фиг его знает. От модели наверное зависит.
я не знаю, чем там занят гугль, но в последнее время часто можно заметить, что на многие вещи они просто забивают. Особенно это видно, конечно же, в андроиде. Например, явное нежелание допиливать функции, которые остаются недоделанными годами, или заниматься русификацией. Это очень раздражает. И впоследствии может пошатнуть гегемонию андроида. Нокия тоже думала, что им ничего не грозит.
У iOS не лучше кстати :-)Шатать гегемонию некому, на это нужны огромные деньги просто.
Я бы с этим вообще не парился, мне эта колонка и даром не нать 😉
Кстати да ))))
Почему? Вполне подтверждает. Может не настолько ярко как с ошибкой в итого, но каждая десятая семья Москвы из потенциально желавших назвать ребенка Алисой, _резко_ передумала. Вполне аргумент.
https://uploads.disquscdn.c…
ну разве нельзя переименовать ребенка??? Алиса — это же полное имя. У нас никто полным именем дома не называет. Леонид, Анна, Светлана. Так разве говорят дома???? Называйте ребенка Аля и все.