Привет.
Каждый день вы производите информацию, сами того не осознавая. С первого момента моего пробуждения телефон понимает, что можно включать уведомления, и начинает тихо вибрировать, когда они приходят на него. Помимо воли я включаюсь в постоянный процесс создания данных, разбросанных по всему миру, и этот процесс для меня непрозрачен. Согласитесь, сложно осознать, что где-то хранится график ваших пробуждений и отхода ко сну, причем он намного точнее, чем все, что вы можете вспомнить не только за свою жизнь, но даже за последние дни. Человеческая память не очень точна, а машины запоминают любую деталь. И это данные, что копятся где-то в недрах дата-центров, разбросанных по всему миру.
Крутил в голове задачу, как посчитать объем данных, которые я произвожу ежедневно. Посчитать число набранных на телефоне и компьютере знаков, расценивать как данные только текст, который имеет осознанную природу, убрать все шаблонные фразы «привет», «как дела», «хотел спросить» и тому подобное? Но ведь это точно такие же данные, что хранятся в недрах машин, и для последних нет никакой разницы между банальностями, сказанными в личной переписке, и адресами страниц, которые мы набирали в течение дня, а скорее спрашивали у поисковой машины те или иные вещи, что нас интересовали.
Какое количество данных мог создать человек до века компьютеров? Вопрос со звездочкой, ведь тогда у нас не было машин, которые могут сохранить наши действия и мысли. Передача информации носила аналоговый характер, скрижали могли не сохраниться в веках, превратиться в устные предания, но они отличный пример сохранения и производства информации, ровно такой же, как письмо на бересте или другом носителе информации. Утрируя, можно сказать, что и сам человек в какой-то мере носитель информации. Устные предания, передаваемые от поколения к поколению, — тоже информация в чистом виде. Но именно машины впервые позволяют посмотреть и оценить объем данных, что мы производим постоянно. Хотя бы на глазок представить, сколько данных возникает из-за нас в мире. Философский аспект вопроса затрагивать не будем, тут можно представить, что из энтропии мы создаем порядок, ведь любые данные упорядочены и отличаются от изначального раскардаша, оставленного после Большого взрыва. Мой взгляд на вопрос определенно варварский, физические законы мира, как известные, так и еще не открытые, рисуют картину порядка, который мы просто не до конца осознаем.
Условно можно разделить данные, что мы постоянно создаем, на осознанные и бессознательные, первые предполагают действие с нашей стороны, усилие по их созданию и в какой-то мере свободную волю. Вторые возникают по причине самого нашего существования, лучше всего это описать как данные, появляющиеся из-за наших действий. Мы идем куда-то по улице, камеры наблюдения снимают нас в этот момент, телефон запоминает предпочтения или подсчитывает, сколько шагов мы прошли. Ни один человек в прошлом не мог сказать точно, где он был в такое-то время, его знания о собственной жизни, воспоминания носили приблизительный характер.
Моя жизнь несется вскачь, поездки и встречи по всему миру, мне сложно держать в голове все, что происходит вокруг меня. Почти невозможно вспомнить, что было в недавнем прошлом, оперативная память моего биологического мозга периодически переполняется, новые впечатления вытесняют старые, а некоторые города до степени смешения становятся похожи на другие. Телефон позволяет точно сказать, где я был такого-то числа и что делал. Симбиоз внешнего носителя информации и собственных воспоминаний дает инструмент, чтобы восстанавливать в памяти прошлое и делать это точно, быстро и без особенных затрат энергии. Сортировка воспоминаний такова, что вы можете как восстановить маршрут конкретного дня, так и посмотреть какие-то конкретные города. Инструментов для этого хоть отбавляй, каждый использует тот, что ему знаком.
Например, в хронологии карт от Google можно посмотреть все свои поездки, вспомнить точное расписание дня, с точностью до минуты отмотать каждый день и увидеть все посещенные места. Посмотрел свои перемещения 12 декабря 2022 года в Дубае.
Инструмент от Google не единственный, просто он показывает в удобном виде те данные, что мы создаем помимо своей воли. Наша жизнь наполнена данными, мы их создаем бессознательно и без особой воли на то, они существуют просто в силу самого факта нашей жизни.
Пользуюсь умными часами много лет, они считывают разные показатели. Не задумываюсь, зачем мне знать, сколько шагов я прошел десять лет назад, но даже такая информация хранится, равно как и мой пульс, уровень стресса и многое иное. Биографы великих людей в будущем смогут получать доступ к данным умерших людей, чтобы, копаясь в показаниях умных часов, восстанавливать их реакции, записанные для конкретных дат и событий, искать любовные интриги по изменившемуся пульсу. Представляю, как можно препарировать прошлое с такими знаниями. Носи Клеопатра умные часы, мы бы с точностью до минуты знали, когда состоялась первая встреча с Марком Антонием и насколько она переживала, проявляла эмоции.
Люди создавали дневники, в которых тщательно записывали свои мысли о событиях, места, которые посетили и хотели бы запомнить. Бессознательное накопление данных не требует никаких действий, надобность в таких дневниках отпала. Вы можете «вспомнить» большинство своих действий и то, что вы делали когда-то, с помощью цифрового костыля. Чтобы удалить такие «воспоминания», нужно приложить усилие, на что не идет почти никто из ныне живущих. Но даже озаботившись удалением этих данных, вы не уничтожите их в дата-центрах компаний, а просто закроете к ним доступ для себя. Произведенные вами данные никуда не денутся, они будут все так же храниться где-то, но вы потеряете их для себя, ничего более. Лицензионные соглашения корпораций не предполагают, что бессознательно созданные вами данные являются вашей собственностью, наборы данных существуют помимо вашей воли, но дают определенное удобство.
Приведу другой пример. В Дубае множество разных интересных мест, также как и в других огромных городах, которые являются центрами притяжения. Перестал запоминать названия многих ресторанов, художественных галерей, в памяти остаются только самые яркие впечатления. Помню, как иранец в облике дервиша танцевал в огромной галерее в Дубае, примерно помню год, но название места вылетело из головы. Зачем мне помнить об этом два года, тем более что само место не так поразило воображение. Захотел доехать туда и посмотреть, что там изменилось, какие выставки идут. И специально ничего не сохранял для того, чтобы вновь найти эти галереи.
У меня почти с десяток разных инструментов в моем телефоне, которые позволяют восстановить прошлое. Через минуту уже нашел название места, посмотрел расписание выставок и наметил планы на следующий день. Нравится ли мне это? Однозначно да.
Но из моей жизни исчезло то, что классики описывали как мучительную попытку вспомнить места, людей, запахи и эмоции. Телефон заменил мне мою память, и я во многом полагаюсь на него, уверен, что он не подведет. Можно поразмышлять о том, как можно прививать людям воспоминания, переформатируя их цифровые следы, но об этом как-нибудь отдельно, не сейчас.
То, как мы думаем, насколько полагаемся на свою память, изменилось с появлением цифровых носителей информации. Родившись в СССР, я застал аналоговые телефоны, крутил наборный диск, чтобы позвонить дедушке с бабушкой, и прекрасно помню номер их телефона, которого давно не существует. Ровно так же помню домашние номера всех мест, где я жил подолгу. Зачем мне эта информация сегодня, неясно. Но она врезалась в мою память помимо моей воли, удалить ее из памяти произвольно не получается. Мы запоминаем множество вещей, но почти никогда не помним по памяти номера самых близких, так как записываем их в телефонную книжку, не набираем цифры. Мы не даем своему мозгу запоминать те же объемы данных, что и раньше. Не даю никакой оценки, хорошо это или нет, просто стало по-другому.
Ученые утверждают, что изменился стиль того, как мы запоминаем данные. И это касается буквально каждого аспекта нашей повседневной жизни, так как мы полагаемся на наши телефоны и меняем свое поведение соответствующим образом. Недавно писал о том, как появление GPS изменило профессию таксиста, а также то, как мы ориентируемся на местности (мы в какой-то мере стали глупее, хуже справляемся с задачами, которые у наших предков не вызывали ни малейших затруднений). Но жизнь стала проще, безопаснее, и это сильно расслабляет. Теперь люди скорее рискуют упасть на пути в метро, чем быть сожранными каким-то зверем, который выскочит из-за угла. Уровень стресса снизился, и продолжительность жизни резко выросла по сравнению с доисторическими временами, когда в двадцать пять лет тебя уже считали стариком.
Подергал знакомых инженеров, которые видят, какое количество данных обо мне собирает телефон в течение дня. По их словам, их не так много, в среднем 50-60 МБ на человека. Телефон фиксирует не содержание разговоров или переписки, а сами факты того, что они состоялись. Отсюда небольшой объем данных, но это то, что можно назвать бессознательным накоплением, то, что происходит минуя нашу волю. Такие данные важны и полезны, они меняют то, как мы живем в мире. Но главным становится осознанное накопление данных, когда мы запоминаем многие вещи и формируем свое мировоззрение через инструменты, данные нам цифровым миром.
Правильно будет разделить обсуждение осознанного хранения данных и бессознательного, пока же предлагаю вам задуматься и ответить себе на простые вопросы:
- Как много данных вы создаете помимо воли каждый день?
- Можете ли вы отказаться от создания таких данных?
- А какой объем осознанных данных у вас есть и что это за данные?
Попробуйте подумать над этими вопросами. Именно подумать, а не взять телефон, скопировать написанное и спросить ответа у поисковой машины. Ведь поиск — это еще один инструмент современного мира, когда кажется, что ответы на все вопросы уже существуют и не нужно размышлять, а достаточно просто набрать вопрос и получить ответ. Также как нет попыток вспомнить что-то забытое и получить удовольствие от того, что удалось достать это с полок собственной памяти. У нас почти не стало размышлений, когда мы заставляем свой мозг включаться и думать, решать задачки из реального мира. И это тоже характеризует наш идеальный инструмент, который умеет помнить за нас, давать ответы на любые вопросы, а главное, за нас «думает».
В отдельном материале мы поговорим про то, какие воспоминания и как мы сохраняем осознанно, а также что делаем с ними потом.
>> Как много данных вы создаете помимо воли каждый день?Маршруты, количество шагов, тренировки, предпочтения в плейлисте (какие песни перемотал), предпочтения в графическом контенте (лайки). Признаться, для меня ценность какого-то там хранения околонулевая, если я осознанно не разместил информацию где-нибудь в социальных сетях (это мой личный маркер важности).На алгоритмы воспоминаний в телефоне не рассчитываю. Предпочитаю гуглить потребовавшиеся сведения. К тому же информация имеет свойство устаревать и по старым адресам уже может и не быть того самого кафе.
Автор не задал главного вопроса — зачем Гугл и пр. собирают эти данные. Самый очевидный ответ — ради денег. Как они могут получть эти деньги? Ответ — таргетированной рекламой с учетом собранных данных, динамическим ценообразованием у партнеров и пр. Самый простой пример, если чел шарится по Дубаям — можно с хорошей вероятностью предположить, что у него дофига лишних денег и можно попытаться ему продать то же самое, но подороже. Вывод: если жалко денег — нужно максимально ограничить возможность сбора данных, отключив все отключаемые настройки и периодически сбивать алгоритмы неотключамых. Например, после новой резины для Мерседеса (зачеркнуто) Зикра можно поискать красный ценник на картофан в Пятерочке. И пусть алгоритмы гадают, сколько у вас есть лишнего бабла.
похоже, надо опять напоминать разницу между данными и информацией, а то автор этими двумя терминами жонглирует свободно, и одно подменяет другое.Данные — это сигналы любой природы, регистрируемые любым известным способом. Растет количество разных способов регистрации — растет объем регистрируемых данных. Данные измеряются в битах.Информация — это: — данные, имеющие смысл, значение или ценность для некоторого потребителя. — результат обработки данных каким-либо методом.Информация измеряется в байтах.Объем генерируемых человеком данных не меняется, меняется объем собираемых о нем данных.А вот объем информации меняется, и зачастую очень резко. Фактически, каждое новое устройство, каждое новое приложение, используемое человеком, может увеличивать объем собираемой о нем информации. Каждая новая методика обработки данных может увеличивать объем информации. НО! Не надо забывать о том, что тон на рынке информации задают маркетологи, которые обожают время от времени придумывать новые названия хорошо известным технологиям, чтобы подстегнуть падающие продажи. Как это в свое время случилось с Data Mining, которым человечество пользовалось еще в 90-е. Когда интерес к DM начал падать достаточно сильно, его оперативно переименовали в Data Science и Big Data, и продолжили впаривать всем желающим. А потом и цифровые мультиверсы подъехали вместе с цифровыми двойниками…
Филипп Мастяев, >> Данные — это <…> Информация — это …Даже не задумывался о различии. С одной стороны, и так ясно, о чем шла речь, с другой же, утечка данных в отрыве от процесса превращения в информацию не страшна и париться об их сборе нет смысла. Правда едва ли нужно будет собирать данные, если не собираешься их обрабатывать 🤔
GrishaTav_SE, Ой, да получите рекламу и на резину и на картофан))) И на новый зикр и морковку в придачу.
Mikhail Volkov, >>Правда едва ли нужно будет собирать данные, если не собираешься их обрабатыватьДумаю, что государство и всякие безопасники с вами не согласятся. Что делает условный Петя в данный момент времени им может быть и неинтересно, но вот если он окажется в нужное время в нужно месте им может быть еще как интересно как он туда попал. Так что в целом любая информация имеет свою цену, но не всю можно в явную монетизировать.
Mikhail Volkov, Когда занимаетесь просвещением населения, очень важно называть сущности своими именами, а не чужими. Чтобы не возникало лишнего недопонимания…
Константин, А динамическую цену какую на Яндексе? Высокую или низкую?
GrishaTav_SE, На зикр высокую, на морковку низкую))) Не надо недооценивать алгоритмы.
>Телефон фиксирует не содержание разговоров или перепискиГлавное верить :DИ потом не удивляться рекламе которую вам начинают подсовывать…
Филипп Мастяев, В целом согласен. Но один момент улыбнул. Данные в битах. Информация в байтах. А ничего, что это зависимые единицы измерения? Байты всегда можно перевести в биты.Я бы сказал, что информация измеряется в фактах и связях. А цифровые единицы, лишь последствия ее кодирования. Представление слова "слово" в кодировке 1251 и UTF-8, в байтах различается вдвое. Но информации больше ведь не стало?
Lecron, Длина измеряется в метрах. А расстояние — в километрах. Умный человек должен понимать разницу и не называть сущности чужими именами!
Филипп Мастяев, >> Данные измеряются в битах.>> Информация измеряется в байтах.Не выдумывайте. Особенно когда >> занимаетесь просвещением населения — это тяжкий грех.
Какова вероятность, что часы Клеопатры бы дожили до наших дней 3000лет? Даже без учета батереи. Ведь даже на CDдисках информация не вечна и пропадает в течении даже 100 лет.
Eleven_, Тут даже свои фотки скирдуемые куда-то в большинстве случаев не смотрят больше никогда, не говоря уже о том что как там дышала тетка в начале нашей эры не интересно вообще никому.
Eleven_, А такой задачи не стояло. Никто же не ожидает, что колбаса будет хранится вечно? Но почему ждут от устройств?Долго — понятие относительное.
В идеале, любая негосударственная организация, собирающая информацию, должна:- публично объявить, какую именно информацию она собирает.- предоставить возможность отказаться от сбора информации (возможно, при этом ранее бесплатная услуга станет платной).- если сбор информации является неотъемлемой частью оказываемой услуги, то должна быть обязательная выплата пользователю за то, что он позволяет собирать данные о нем.Негосударственная организация, которая уличена в сборе информации с нарушение предыдущих пунктов разоряется штрафами, возможно уголовное преследование. Продажа или передача информации без явного разрешения от того, о ком она собрана должна быть также уголовно наказуема. В том числе и для обезличенной машинной обработки.
Pavel, Звучит хорошо. Более того, некоторое уже есть в законодательстве. Но нереализуемо. Утопия. Причем из-за нас самих. Кто читает публичные оферты? А если читает, кто поставит в приоритет конфиденциальность, когда "Мне надо! Хочу!" — билет, такси, музыка, и прочее. Законодательно же закрепить запрет им пользоваться нашей ленью, не получится. Все равно лазейку найдут, даже при ваших пунктах. Причем, вангую, это будет даже не лазейка, а целая вереница ангарных ворот.
Pavel, И да, почему ограничиваетесь негосударственными? А госудраственные не должны что ли?
Pavel, Ну по идее государственные и так не имеют права никому продавать собранные данные. Но драть их активнее за утечки тоже стоит.
Ух. Мыслей много. Но ведь все собираемые данные используются для не только для рекламы, но и для изучения клиентского опыта. Считаю сбор полезным, так как знаю как использовать накопленную бигдату с пользой )
Езжу много, посещаю мест много, не использую для того, чтобы вспомнить )
Pavel, Бабка на лавочке у поезда или сосед по автобусу обязательно расскажут. Когда, куда, в каком виде и как ругались, если их спросят. И ничего они вам не должны
Lecron, а я где-то утверждал, что они независимые?
Филипп Мастяев, Тогда зачем вообще упоминать эти единицы измерения?
Lecron, чтобы подчеркнуть различия между терминами
Maxim V, Для изучения клиентского опыта, чтобы профессионалы в продажах и социологии смогли еще глубже залезть в карман клиента? Ибо если хотите помочь, просто не создавайте проблемы. Например не используйте винты с редкой проприетарной головкой. И таких примеров можно наскрести десятки.От минуса воздержусь. Но с большим трудом.
Lecron, Понимаю, принимаю, соглашаюсь. Эпоха разумного потребления закончилась. Началась эпоха сверхагрессивного маркетинга и максимизации ARPU (термин из телекома, но вполне подходит под любой бизнес), расчета CLV в горизонте от 5 лет и т.п. Такие времена. Но вы же не реагируете на каждое навязчивое предложение сделать вас "счастливым" от покупки/подписки/… Все равно включаете голову. Ну и, я уверен, точно лезете в настройки и глушите геопозицию для приложений, которым эта геопозиция не нужна для функционирования. Приватность же настраиваете? Что я имел в виду — сбор приветствую для тех пользователей, которые на это соглашаются добровольно. Все остальное тоже не приветствую и это противозаконно. Например, я бы хотел, чтобы точное местонахождение отнесли к персональным данным.
Lecron, Пару раз устраивал скандал, когда мне на кассе Спортмастера в Астане говорили, что я не смогу сделать оплату товара без сообщения номера телефона. Глупая кассирша, уверен, закон о ПД не читала (он такой же, как в РФ, слизан), что творит (менеджер сказал, я и делаю что сказали) не понимает, не предупреждает о том, что потом будет агрессивный таргетинг (с умом ли нет уж не знаю, но Спортмастер я лично учил в свое время правилам таргетированных кампаний) — в общем, треш полный. Но колонка от тындекса мне удобна для ряда вещей, слушает и собирает она все подряд, если через блокировщик рекламы пробивается реклама, то она постоянно про то, что дома обсуждали. А еще подумайте, пожалуйста, можно ли скрыть геопозицию, например, для сервиса такси? Ну в любом случае тындекс видит куда я и члены моей семьи ездят.
Lecron, Минусить меня можно сколько угодно. Я из стана тех, кто учит собирать и использовать данные, по другую сторону баррикад.5 читал на программе MBA "Электронный бизнес" курс по e-comm и изрядная часть моего курса как раз про клиентскую аналитику, таргетирование на основе анализа больших данных — как собираем, для чего собираем, как используем. При этом я всегда четко своим слушателям говорю: не собирайте то, на что вам не давали право, не таргетируйте без согласия на то клиента, делайте везде дисклеймеры. Со ссылкой на действующее законодательство — отдельная лекция посвящена вопросам права.
Maxim V, >> Но вы же не реагируете на каждое навязчивое предложение сделать вас "счастливым" от покупки/подписки/…Не реагирую. Но всё равно знаю, что проигрываю профессионалам воздействия на (под)сознание.И да, оценивать "глушите геопозицию", "Приватность же настраиваете?" нужно не по мне, а для среднего пользователя. Который ничего этого не делает, ибо просто не знает. И этот пользователь проигрывает упомянутым профессионалам вчистую.>> сбор приветствую для тех пользователей, которые на это соглашаются добровольно. Буквально вчера писал. Слово "добровольно" нужно заключать в кавычки. Ибо эту (псевдо)добровльность пропихивают те же профессионалы. В том числе используя нашу лень и/или торопливость. Реальной же добровольности, с объяснениями "вы нам это, а мы используя это, сможем вам то — win-win", не встречал почти нигде. А где встречал, скорее всего было некоммерческим, типа Mozilla Foundation.
Eleven_, кто знает, может, Фестский диск есть бекап часов какой-нибудь Клеопатры 🙂