Отказ умного дома Xiaomi и не только. Один сервер для всех

Привет.

Вечером 4 октября десятки тысяч людей по всей стране столкнулись с тем, что у них неожиданно перестала работать умная техника, их умные дома оглохли, иногда в прямом смысле этого слова. Попытки привычно включить или выключить что-то натыкались на отсутствие реакции со стороны умного дома. Фраза «Алиса, включи свет» перестала работать для большинства тех, кто использовал умный дом от Xiaomi. Кто-то подумал на сбой на стороне «Яндекса», кто-то полез в настройки Mi Home и понял, что не может ничего сделать, так как достучаться до сервера было невозможно. Такого масштабного сбоя еще не случалось, отказ произошел для всех, у кого был указан регион Россия, например, если это был Китай, то все работало, как и раньше.

В первые несколько часов никакой ясности в том, что происходит, не было, все шло по сценарию тренировок РКН, но последние неформально говорили, что это не они и все сломалось без их участия. Тут надо отметить, что сегодня первая мысль, которая возникает, когда что-то так масштабно ломается, именно про РКН, ребята долго шли к такой славе. Да и в прошлые разы, когда ломали точно они, ответ был примерно такой же: мы тут не при делах.

Наши читатели постепенно стали дополнять картину, помимо Xiaomi, отказ произошел у Roborock, что выглядит логичным, так как компания долгие годы работала под зонтиком бренда Xiaomi. Дальше — больше, отказ коснулся умного дома Aqara и ряда других китайских марок.

Поразительно, как в одночасье прекратили работать миллионы устройств по всей России, только у меня дома это десятки разных датчиков, камер и тому подобного, связи с ними вообще не было. А при попытке входа в приложение меня просто выкидывало. В Aqara сообщили, что сбой на стороне провайдера, вопрос решается и в течение короткого времени все заработает. Именно так в итоге и произошло.

А теперь самое смешное, то, что вас поразит. Исторически Xiaomi была одной из первых китайских компаний, что активно работали в России. И многие иные бренды шли по их стопам, более того, размещали свои приложения и сервисы у одного и того же провайдера, шли по проторенной дорожке. Исторически сложилось так, что приложения и сервисы физически находились на одном сервере, никакого резервирования не было предусмотрено (экономия должна быть экономной!). То есть мы столкнулись с тем, что на стороне большинства компаний просто отсутствует дублирование функций, а работа того же умного дома зависит исключительно от одного сервера! Нет никаких дополнительных дата-центров, что разнесены физически и могут в случае сбоя автоматически перехватить нагрузку. Если посмотреть на то, как реализована работа с умным домом у Apple или Google, то мы увидим принципиально иной подход — многократное резервирование в разных географических точках, проектирование систем так, чтобы они перенесли любые возможные сбои. И тут нужно говорить, что изначально качество сервиса сильно отличается, но мы как пользователи этого просто не видим.

Любопытно, что для Китая у той же Xiaomi такое резервирование предусмотрено, на родном рынке компания не может и не хочет допустить масштабных сбоев, отказы случаются, но они не носят такого характера, как произошедшее в России. И это тоже качество сервиса, но о нем мы узнаем только задним числом, когда что-то происходит. В магазине узнать о числе серверов, о том, где они расположены, невозможно. Любопытно, что достаточно чувствительная информация про настройки умных домов жителей России де-факто существует вне страны. Персональными данными такая информация не является, что с точки зрения существующего законодательства не накладывает никаких ограничений на поставщиков решений. Но все равно как-то неаккуратно, мне хотелось бы видеть серверы на территории России, так было бы правильно.

Проблемой для Xiaomi стало также неудачное стечение обстоятельств, в Китае во время сбоя была ночь и в дополнение к этому праздничные дни. Что также характеризует возможности компании, она сама не отслеживает нагрузку и не реагирует проактивно. Реакция началась после шквала обращений в социальных сетях, когда дергали разных сотрудников компании (сам дернул нескольких людей, никто не был в курсе сбоя, но информация пошла по цепочке дальше). Время восстановления сервиса оказалось гигантским, частично он вернулся в строй через двенадцать часов, полностью — фактически через сутки (надеюсь, что это так и никаких иных сбоев не произошло).

На мой взгляд, сам характер сбоя очень показателен и многое говорит о вещах, которые обычно от нас скрыты. Натура Xiaomi заключается в том, что компания старается экономить на всем, а если пользователь не видит чего-то и тут можно не тратиться на резервирование сервисов, то почему этого не сделать? В конце концов, это реальные деньги, которые не нужно тратить в никуда, никто этого не оценит. А сбои? Они не так часты, и про них быстро забывают. Многие в момент сбоя даже не знали, что их умные дома перестали работать, не обратили на это внимания. К сожалению, в большинстве случаев мы узнаем о таком подходе компаний в момент, когда все ломается.

Другой вопрос заключается в том, что владельцы умных устройств оказались не готовы к их использованию без приложений. Например, большая часть роботов-пылесосов умеет работать от кнопки на корпусе, локально и без приложения. Но для пользователей это оказалось просто невероятным, они не знали о таких возможностях. И поломка сервера стала «поломкой» их устройств. К слову, это отличная иллюстрация того, что при деградации связи мы можем столкнуться с тем, что качество работы современных устройств заставит нас беситься на ровном месте, они не будут работать так, как должны.

Также большинство владельцев умного дома настроили его по умолчанию, то есть на работу через серверы компании, локальная работа умного дома остается для многих тайной за семью печатями. Хотя многие компании позволяют создавать локальные сценарии, устанавливать свое железо, чтобы все работало на уровне вашего жилища. Но, безусловно, это несколько сложнее, чем просто настроить все из коробки под облачный сервис.

На фоне происходящего можно вспомнить, что аналогичные проблемы были в «Сбере», их умный дом приказал долго жить, когда Tuya просто отключила его из-за санкций. В итоге «Сбер» полностью переписал умный дом под российские решения, размещает серверы в России. Хочется верить, что это не один сервер в одном дата-центре (говорят, что есть резервирование, когда-нибудь узнаем об этом на практике, если будет масштабный сбой). После перехода на свое решение никаких масштабных сбоев не было, так что скрестили пальцы и считаем, что все должно быть хорошо.

Подобные массовые сбои — это звоночек, который рассказывает о том, что и как происходит у разных компаний, как выстроена их коммуникация с внешним миром при возникновении проблем. Он показывает скорость реакции, это также немаловажный момент. Та же Aqara легла, но ее быстро подняли, несмотря на праздники в Китае, ровно те же проблемы, что стояли перед Xiaomi.  И тут можно говорить, что этот бренд справился с кризисной ситуацией лучше.

Главный вывод, который нужно сделать нам всем. Полагаться на умную технику и то, что она будет работать при любых условиях, нельзя. Нам необходимо точно узнавать о том, что произойдет, если дома не будет интернета (это более частая ситуация, чем глобальный сбой). Точно проговаривать поведение умных устройств еще до того, как мы их покупаем. Чтобы потом не удивляться, когда все поломалось и многие вещи просто не работают так, как должны. Особенно «радует» то, что у многих людей системы безопасности, камеры наблюдения построены на массовых решениях, не имеют никакого резервирования. И, как следствие, просто приказали долго жить в этой ситуации. Делайте выводы, что для вас важнее — дешевизна или безопасность. Дешево и хорошо не бывает, стоит забыть о таких сказках.

Расскажите, как вы пережили этот отказ? Конечно, если у вас есть устройства, которые пострадали, и вы обратили на это внимание.

[email protected]
наверх