Кража голоса мошенниками. Мы все в опасности, здесь и сейчас

Привет.

Раздается звонок от моего ребенка, голос немного надломлен, и он задыхается: «Папа, я попал в аварию, мне срочно нужно доехать до больницы. Кажется, у меня сломана рука, телефон садится, продиктую номер приятеля, скинь туда деньги — такси, больница, напишу, куда тебе ехать. Не могу говорить, извини. Запиши номер». Телеграфный стиль, очень отрывистые слова, ребенку больно, и в этот момент нормальный родитель должен начать сходить с ума. Моя проблема в том, что я точно знаю, где находится мой ребенок и почему он не мог мне позвонить. Перезвонил на его номер: сонный голос, никакой спешки нет, он дома.

Мошенники первыми осваивают новые технологии и переиначивают их на свой лад. Помните старый развод — «мама, я попал в аварию, мне срочно нужны деньги»? С его вариацией столкнулся и я, причем это везение, так как подобные звонки пока единичны, мошенники тестируют свой продукт до выпуска в массовое производство. В отличие от предыдущих лет, это продукт, относиться к нему нужно именно так. В чем-то простой, в чем-то сложный и задействующий высокие технологии. Воры и мошенники постепенно превращаются в IT-специалистов.

Давайте посмотрим на анатомию этого продукта от мошенников. Они где-то обнаружили информацию о том, что у меня есть дети (невелика сложность, тут все просто), затем прошерстили базы с утечками (скорее всего, «Яндекс.Еда», где были примечания с телефоном сына, которому заказывал еду, но там не было имени!). Несколько звонков на телефон сына, когда получили голосовые слепки его речи. Затем их скормили нейросети, чтобы создать запись с нужным текстом. Пока она звучит не очень правдоподобно, но в ближайшем будущем на массовом рынке появятся дешевые и общедоступные инструменты для имитации чужих голосов. Причем они будут работать в реальном времени, то есть можно будет говорить в микрофон, и нейросеть тут же будет моделировать чужой голос. Пока такие модели только умеют записывать фразы, что для мошенников доставляет определенное неудобство.

Давайте посмотрим на другую историю, которая случилась в Москве, про нее рассказал Telegram-канал Baza вот тут.

С помощью поддельного голоса подруги мошенники смогли похитить браслет Bulgari стоимостью полмиллиона у простой и безработной студентки из Москвы.

23-летняя Станислава пока ещё студентка «Плешки», но уже любит взрослый тяжёлый люкс. Недавно девушка заказала из Дубая дорогой золотой браслет Bulgari с природными бриллиантами за 430 тысяч рублей. Но носить его Станислава не захотела, поэтому решила продать на сайте объявлений. Чтобы украшение всё же принесло ей немного радости, девушка поставила цену в 500 тысяч рублей.

Через некоторое время с ней связался покупатель. Мужчина по имени Ярослав сообщил, что хотел бы купить товар, причём как можно скорее, — и почти сразу же выслал к Станиславе своего водителя. Однако, когда машина приехала, возникли трудности: покупатель почему-то не мог отправить деньги на карту Станиславы. Чтобы завершить сделку, он попросил номер телефона её подруги, чтобы через него оформить перевод. Станислава согласилась и дала номер знакомой, после чего предупредила её — «скоро тебе должны упасть 500 тысяч».

Через 10 минут подруга перезвонила Станиславе и своим голосом сообщила радостную весть: деньги пришли. Девушка отдала водителю драгоценный браслет и уехала по своим делам. Её удивлению не было предела, когда примерно через час ей перезвонила подруга и сказала, что сумма так и не упала. Станислава протянула долгую «эээ» и отправилась в полицию писать заявление. Впереди — расследование и, возможно, новая поездка в Дубай.

В обеих историях есть еще один важный элемент обмана — подмена номера. То есть мошенники звонили как будто с номера, который вы знаете, что вкупе со знакомым голосом убирало всяческие подозрения. В России системно пытаются закрыть возможности для массовой подмены номеров, но изжить эту проблему на сто процентов невозможно, также как в ноль убить число мошеннических схем. Исходя из этого можно прогнозировать, что через несколько лет мы столкнемся с валом мошенничеств, направленных против конкретных людей. Это не будет массовый развод, стоимость подготовки обмана вырастет, но и потенциальный куш будет заметно отличаться. Блокировать подменные номера, которые будут разово использоваться в мошенничестве, крайне сложно. Отрадно, что Россия одной из первых в мире активно принимает законы для борьбы с подменой номеров и реально прикладывает усилия для искоренения этого зла.

Другой тип обмана стал возможен за счет развития нейросетей и алгоритмов, которые умеют копировать чужие голоса. Пока они делают первые шаги, и до успехов Midjourney или других нейросетей, рисующих картинки, им далеко. Не хватает наработанной базы образцов голосов — такая сегодня есть у Google, компания — пионер в этой области и очень активно развивается. Хорошо, что мошенники не могут получить доступ к их технологиям. Но другие компании также стремятся наработать такие базы.

Посмотрите на пример инструмента VALL-E от Microsoft, копирование чужих голосов зачастую получается очень неплохим. Ознакомиться с описанием нейросети и послушать примеры голосов можно вот тут.

Деятели культуры уже озаботились проблемой, например, дикторы обратились в Госдуму с просьбой запретить копирование и синтез их голосов сторонними компаниями, это бьет по их кошельку. Стать диктором не так просто, это большой труд — но нейросеть может скопировать чужой голос, а дальше нечистоплотная компания использует его, например, в навигации или где-то еще. Нет смысла платить обладателю голоса, дешевле украсть его.

Хорошо, если это прямое воровство, которое можно как-то доказать. А если нейросеть изменит голос, но оставит его узнаваемым? Как доказать, что за основу взят голос диктора или известного человека? Почти никак. Вопросы, которые ставит развитие технологий, не так просты, как может показаться на первый взгляд. Но также надо понимать, что запреты никак не остановят развитие технологий в принципе.

Мошенники сегодня бегут впереди паровоза, они развивают свои умения в технологиях, и то, что они делают, выглядит для обычных людей как чудо. Согласитесь, если вам позвонит мама со своего номера, будет говорить с вами своим голосом, вы не почувствуете подвоха. И на это делается ставка. Но поскольку такой продукт дорог, выгодно вначале снимать сливки, то есть не обманывать людей массово, а выбирать своих жертв точечно. И в этом помогают утекшие базы разных компаний — заказы в Интернете, покупка еды и тому подобное. Обогатить эти данные, найти дополнительные рычаги воздействия — вопрос времени. Первоначально история не будет носить массовый характер, но постепенно перейдет в разряд обычных мошеннических схем. На это, по самым грубым оценкам, уйдет несколько лет.

И это дает нам всем шанс подготовиться. Государство и операторы готовят свои рубежи обороны, но нам придется в общении даже с очень близкими людьми всегда думать о контексте и придумывать секретные слова, известные только нам. С помощью таких слов в разговоре можно будет выяснять, что в действительности происходит. Например, если мне позвонит сын и скажет: «Папа, я попал в аварию. Чувствую себя хорошо. Штифт в порядке», — то я буду знать, что это мой сын. У него нет штифта, но секретное слово поможет мне понять, с кем я говорю.

Технически мы придем к тому, что нам придется либо отказываться от привычных звонков, либо перебираться в мессенджеры и другие средства связи, где можно однозначно идентифицировать звонящего и понять, что мы говорим с таким-то человеком и он настоящий. Реализовать такие средства связи можно.

Для производителей телефонов и не только открывается широкое поле, будут нужны алгоритмы, которые начнут анализировать качество голоса, реален он или синтезирован программой. Еще один большой фронт работ. Развитие технологий не всегда благо, и тут мы видим оборотную сторону медали. Прогресс неизбежен, мы его никак не остановим. Но важно быть морально готовыми к тому, что голос родного человека не всегда будет значить, что вы говорите именно с ним. Будущее наступило, и в нем нужно быть осторожными.

[email protected]
наверх