Привет.

Впору заводить рубрику про удивительные данные, которые на-гора выдают компании. Те же операторы в буквальном смысле сидят на золотых россыпях данных, могут анализировать трафик абонентов, исследовать их поведение и создавать очень интересные отчеты. Но зачастую все упирается в странную реализацию, при которой не всегда понятно, какую мысль до нас пытались донести. Посчитал, что до бесконечности это продолжаться не может и нужно помочь коллегам с этой адской работой, объяснить, что может быть интересно, а что нет. Одним словом, ликбез по поиску интересной информации, которая может заинтересовать обычных людей и привлечь внимание к вашей компании. Примеров топорной работы у меня накопилось много, но решил не распыляться и разобрать свежую историю от Yota. В моем почтовом ящике оказался пресс-релиз, в описании было сказано следующее:

“Федеральный мобильный оператор Yota проследил, как менялся интернет-трафик клиентов, потраченный на приложения для сада и огорода с 1 января по 22 мая 2022 года. Приложение GreenS потеряло более 24% в доле трафика. Материал с подробной информацией приложила во вложении к письму”.

Первый звоночек прозвенел после чтения описания, открывал приложенный файл в предвкушении. Первая и детская ошибка связана с диапазоном дат, для которых приводится анализ. На любом рынке существует фактор сезонности, который влияет на продажи, погоду, настроение покупателей, да на что угодно. Поэтому анализ всегда проводится для того, что можно сравнивать, например, вы часто видите сравнение год к году, когда мы берем первый квартал этого года и сравниваем его с первым кварталом годом ранее. Это позволяет нивелировать фактор сезонности, добиться общего знаменателя. Никто не пытается сравнить продажи первого квартала с третьим, так как это разные временные отрезки. Порой для простоты демонстрации рыночной ситуации приводятся продажи смежных периодов, при описании второго квартала вы видите и данные за первый. Они важны для того, чтобы показать отсутствие или наличие каких-то ключевых изменений. Например, рынок мог рухнуть или резко вырасти во втором квартале, вы это увидите при таком сравнении.

Но сравнивать неделю в январе и в мае? Идея сама по себе порочна, так как несет в себе кучу недостатков и проблем, особенно в аспекте конкретного исследования о том, как пользуются приложениями для анализа растений, поиска их имен или ухода за ними. Даю подсказку, проблемой является слово из четырех букв, начинается на “З”, заканчивается на “А”. Да, это зима, время года, когда растения выращивают дома, сезон дач и грядок еще бесконечно далек и на улицах не увидеть ярких цветов и почек. Конечно же, речь идет про Россию, а не какие-то райские острова. Зимой эти приложения бесполезны для подавляющего большинства людей, удивлен, что они в принципе пользуются спросом.

Кстати, тут возникает очень неплохой вопрос, действительно люди пользуются зимой этими приложениями или просто они получают обновления баз данных, обновления самих приложений и так далее. Вот в этом интересно покопаться, равно как и в принципе сделать исследование, сколько люди тратят трафика на обновление приложений в течение года. Цифры, уверен, будут очень необычными.

В Yota для анализа взяли семь самых популярных приложений в этой категории, — GreenS, PictureThis, «Флорист-Х», HoGa, Seek by iNaturalist, PlantNet и PlantSnap. Первый график, что нас встречает, это описание того, какой процент трафика тратят абоненты Yota на эти приложения, и количество пользователей.

Переворот сознания! Я всегда считал, что Yota позиционируют себя на молодежную аудиторию, тех, кто охоч до инноваций и тому подобных вещей. У меня нет предрассудков, что только пожилые люди интересуются цветами и выращивают что-то, сам пользуюсь парой приложений из списка. Но тут должен возникнуть вопрос, а как получены эти данные и почему так огромна доля дневного трафика на эти приложения. И ответом на этот вопрос могла послужить методика того, как считали, из процента чего исходили. Всех приложений? Общего трафика на сети? Трафика людей, которые ими пользуются? Догадываться можно о чем угодно, но готов поспорить, что это не может быть процент от общего трафика на сети, он слишком велик.

Ладно, если уж совсем придираться, то неплохо было бы услышать признаки, по которым выбирали сами приложения, так как фраза “семь самых популярных приложений” требует уточнения. Например, есть множество других приложений с огромной аудиторией, и они очень популярны — в LeafSnap Plant их более миллиона на Android. И таких приложений достаточно много, методика, описывающая, как выбирались приложения, точно не была бы лишней. Просто для понимания того, что мы на одной волне и одинаково трактуем термины. Любое исследование требует того, чтобы мы базисно согласились в том, что и как мы считаем, как выбираются те или иные цифры. Иначе возможны очень вольные трактовки, примерно такие, как у меня выше. Добавлю сюда, что по количеству загрузок «Флорист-Х» уступает десятку аналогичных приложений и выбор непонятен.

Мы добрались до следующей картинки, давайте посмотрим на нее.

Любой человек, работающий с данными, должен обладать любопытством, и если какие-то данные выпадают из общей картины, то нужно до бесконечности задавать вопрос, почему так происходит. Приложение GreenS доступно только на iOS, посмотрите на стоимость приложения.

Теперь давайте вспомним, что у нас происходило в апреле и мае с платежами в магазине приложений от Apple? Компания их закрыла, и оплачивать приложения и сервисы стало невозможно, обходные пути сохраняются, но пользуются ими немногие. Дело раскрыто, получается, что приложение потеряло аудиторию из-за того, что люди не могли оплатить его. И вот тут можно было бы рассказать, на что они перешли, проанализировать трафик.

Оператор может делать еще больше, например, рассказать, какими связками приложений пользуются те, кто увлекается цветами. Для определения растений — такое-то приложение, для полива — вот это и так далее. Это готовые подборки приложений, которые будут интересны многим, так как показывают опыт других людей, рассказывают, чем те пользуются. И их можно создавать не только для растений, а практически в любой области.

Другой извечный момент — где больше огородников, на Android или на iOS? Тоже хотелось бы увидеть такую разбивку и понять разницу в цифрах, как минимум это любопытное сравнение.

Цифр, которые оператор может вытащить из своих данных, огромное количество. Но в начале работы всегда нужно задаваться вопросом — зачем? Что вы хотите показать, какую теорию проверить, насколько полученные данные будут представлять интерес для людей. Из пресс-релиза Yota следует, что весной люди больше интересуются растениями, чем зимой. Могу предложить с десяток подобных тем:

  • почему люди чаще проверяют прогноз погоды утром, а не вечером;
  • использование карт для навигации, в какое время суток оно популярнее;
  • поиск туристических путевок, сравниваем январь и май;
  • когда спрос на школьные учебники максимален.

Все перечисленные темы не требуют подробных исследований, мы догадываемся об ответах на эти вопросы и можем точно предположить, что чаще всего прогноз погоды смотрят утром, учебники в школу покупают в августе и сентябре, а также в конце учебного года. То знание жизни, что у нас есть, диктует нам ответы, и уточнять их с помощью исследований точно не нужно. Любая работа с данными — это интересное путешествие, и в нем можно открыть новые материки и страны, которыми и нужно делиться. А когда вы повторяете общеизвестные истины, то это никому не нужно, в первую очередь вам.

Проблема в том, что многие не могут правильно поставить себе задачу, понять, что именно они хотят узнать о нашем мире или своих пользователях. Цифры можно крутить как угодно, они стерпят все. Но ведь хочется, чтобы результат был интересным и увлекательным, а получается, что, сидя на горе золота, оттуда достают всего лишь ошметки руды, которые даже не блестят. И меня это расстраивает.

Уверен, что в Yota смогут сделать отличный анализ данных, если не будут спешить, остановятся и просто подумают, что именно они хотят сказать миру и почему. На самом деле это не так сложно, как кажется, главное — задуматься, построить на бумаге проект и расписать свои гипотезы, а затем уже приступить к сбору данных, чтобы получить на выходе интересный результат. Надеюсь, что в следующий раз все будет именно так!