По материалам The Verge
В последние месяцы неблагие знамения накапливаются с угрожающей скоростью. Google пытается убить 10 синих ссылок. Твиттер* брошен на произвол ботов и синих галочек. Amazon захламлен и TikTok* загажен. Увольнения истощают жизненные силы интернет-СМИ. В объявлении о вакансии «редактора ИИ» требуют выхлопа «от 200 до 250 статей в неделю». ChatGPT используется для создания целых спам-сайтов. Etsy наводнен мусором, созданным искусственным интеллектом. Чат-боты цитируют друг друга, создавая дезинформационного уробороса, который кусает собственный хвост. LinkedIn* использует искусственный интеллект, чтобы расшевелить уставших пользователей. Snapchat и Instagram* надеются, что боты будут разговаривать с вами, когда вашим друзьям не до того. Пользователи Reddit устраивают блэкауты. Модераторы Stack Overflow бастуют. ИИ потрошит «Википедию». Старый Интернет умирает, а новый изо всех сил пытается родиться.
Конечно, Интернет умирает постоянно. Он умирал в течение многих лет – то приложения стали воровать трафик у веб-сайтов, то алгоритмы стали поощрять быстрое переключение внимания. Но в 2023 году он умирает снова — и, как следует из вышеизложенного, в игру вступает новый фактор. Это искусственный интеллект.
Если говорить в самых общих чертах, проблема вот в чем. Много лет назад Интернет был местом, где люди что-то делали. Они создавали домашние страницы, форумы и рассылки, а заодно зарабатывали небольшие деньги. Затем компании решили, что они могут сделать это лучше. Они создали удобные и многофункциональные платформы и открыли свои двери для всех желающих. Они будто поставили перед нами коробки, и мы заполнили эти коробки текстом и изображениями, и люди приходят посмотреть на содержимое этих коробок. Компании гнались за масштабом, потому что когда где-то собирается много людей, обычно есть и способ заработать на них деньги. Но ИИ меняет эти предпосылки.
Учитывая деньги и вычислительные ресурсы, системы искусственного интеллекта — особенно модные сейчас генеративные модели — легко масштабируются. Они в изобилии производят текст и изображения, а вскоре это коснется музыки и видео. Их продукция потенциально может превзойти платформы, на которых мы привыкли искать новости, информацию и развлечения. Но качество этих систем часто не выдерживает критики, и они построены таким образом, что пока могут только паразитировать на сети. Эти модели обучаются на массивах данных, заложенных во время последней эпохи Интернета, они создают их заново и делают это неидеально. Компании извлекают информацию из открытого Интернета и превращают ее в машинный контент, который дешев в создании, но менее надежен. Затем этот продукт конкурирует за внимание с платформами и людьми, которые были до него. Сайтам и пользователям приходится считаться с этими изменениями и пытаться понять, как к этому адаптироваться и можно ли вообще это сделать.

В последние месяцы обсуждения и эксперименты на некоторых из самых популярных и полезных сайтов в Интернете — на таких, как Reddit, «Википедия», Stack Overflow и сам Google — выявили напряжение, вызванное появлением систем искусственного интеллекта.
Модераторы Reddit устраивают блэкауты после заявления компании о том, что она резко повысит плату за доступ к своему API. А руководители компании заявляют, что эти изменения (частично) являются ответом на то, что компании, занимающиеся ИИ, практикуют скрейпинг данных. «Массив данных Reddit действительно ценен, — сказал основатель и генеральный директор Reddit Стив Хаффман в интервью The New York Times. — Но нам не стоит отдавать все эти ценности ряду крупнейших компаний мира бесплатно». Правда, это не единственная причина — Reddit пытается выжать больше доходов из платформы перед запланированным IPO в конце этого года. Но это показывает, насколько такое использование данных является одновременно угрозой и возможностью для нынешней сети, что заставляет компании переосмыслить открытость своих платформ.
Например, с использованием своих данных не понаслышке знакома «Википедия». Ее информация уже давно используется Google для формирования «блоков знаний», и в последние годы поисковый гигант начал платить за эту информацию. Но модераторы «Википедии» обсуждают, как использовать новые языковые модели ИИ для написания статей для самого сайта. Они хорошо осведомлены о проблемах, связанных с этими системами, которые фабрикуют факты и источники с быстротой, вводящей в заблуждение. Но в то же время им известно, что эти системы дают явные преимущества с точки зрения скорости и масштаба. «Риск для “Википедии” заключается в том, что люди могут снизить качество, добавляя материалы, которые они не проверяли, — говорит Эми Брукман, специалист по онлайн-сообществам и автор книги “Стоит ли верить Википедии?” — Я не думаю, что есть что-то плохое в том, чтобы использовать их в качестве заготовки, но каждый пункт должен быть проверен».
Stack Overflow — аналогичный, но, возможно, даже более экстремальный случай. Как и в Reddit, его модераторы тоже бастуют, и, как и редакторы «Википедии», они беспокоятся о качестве генерируемого ИИ контента. Когда ChatGPT был запущен в прошлом году, Stack Overflow была первой крупной платформой, запретившей результаты его работы. Модераторы писали: «Основная проблема заключается в том, что, хотя ответы, которые выдает ChatGPT, содержат высокий процент неправильных, они обычно выглядят так, как будто они могут быть правильными и их очень легко дать». Сортировка результатов занимает слишком много времени, поэтому модераторы решились на полный запрет.
Однако у руководства сайта были другие планы. С тех пор компания, по сути, отменила запрет, увеличив количество доказательств, необходимых для того, чтобы пользователи могли публиковать контент, созданный ИИ, и объявила, что, напротив, хочет воспользоваться этой технологией. Как и Reddit, Stack Overflow планирует взимать плату с фирм, которые берут ее данные при создании собственных инструментов искусственного интеллекта, — предположительно, чтобы конкурировать с ними. Борьба с модераторами идет в плоскости соблюдения стандартов сайта и того, кто должен их обеспечивать. Модераторы утверждают, что результатам работы ИИ нельзя доверять, но руководители говорят, что риск того стоит.
Однако все эти трудности меркнут по сравнению с изменениями, происходящими в Google. Поиск Google поддерживает экономику современного Интернета, распределяя внимание, а значит, и доход в большей части сети. Google подтолкнула к действию популярность Bing и ChatGPT в качестве альтернативных поисковых систем, и поисковый гигант экспериментирует с заменой своих традиционных 10 синих ссылок сводками, созданными ИИ. Но если у компании все пойдет по плану, то изменения будут лавинообразными.
В статье Аврама Пилча, главного редактора технического сайта Tom’s Hardware, посвященной бета-версии поисковой системы Google с искусственным интеллектом, освещается ряд проблем, в частности, Пилтч говорит, что новая система Google — это, по сути, «двигатель плагиата». Его сводки, сгенерированные ИИ, часто дословно копируют текст с веб-сайтов, но размещают этот контент над исходными ссылками, лишая их трафика. Это изменение, которое Google продвигала в течение долгого времени, но посмотрите на скриншоты в статье Пилча, и вы увидите, как сильно сместился баланс в пользу контента, извлеченного ИИ. Если эта новая модель поиска станет нормой, она может повредить всей сети, пишет Пилч. Сайты с ограниченным доходом, вероятно, будут вытеснены из бизнеса, а у самой Google закончится контент, созданный людьми, который ИИ мог бы перетасовывать.
Именно в этом суть развития ИИ — создание дешевого контента на основе чужой работы. И если Google продолжит использовать свой текущий вариант поиска на основе ИИ, последствия будет трудно предсказать. Потенциально это нанесет урон целым сегментам сети, которые большинство из нас считает полезными — от обзоров продуктов до блогов с рецептами, страниц про хобби, новостных агрегаторов и всевозможных вики. Сайты могли бы защитить себя, блокируя вход и взимая плату за доступ, но это также будет означать огромную перестройку экономики сети. В конце концов, Google может убить экосистему, породившую ее собственную ценность, или изменить ее настолько безвозвратно, что существование компании окажется под угрозой.

Но что произойдет, если мы позволим ИИ встать за штурвал и начать скармливать информацию массам? Что изменится?
Увы, имеющиеся на сегодняшний день данные свидетельствуют о том, что это ухудшит качество сети в целом. Как отмечает Пилтч в своем обзоре, несмотря на всю хваленую способность ИИ рекомбинировать текст, именно люди в конечном итоге создают исходные данные — будь то журналисты, которые совершают звонки и проверяют факты, или пользователи Reddit, у которых случилась конкретная проблема с батареей в конкретном устройстве и которые рады рассказать вам, как они ее решили. Напротив, информация, создаваемая языковыми моделями ИИ и чат-ботами, часто неверна. Хитрость заключается в том, что когда что-то не так, это «не так» трудно обнаружить.
Вот пример — агенты ИИ, системы, использующие языковые модели, такие как ChatGPT, которые подключаются к веб-сервисам и действуют от имени пользователя, заказывая продукты или бронируя авиабилеты. В одной из многочисленных вирусных тем в «Твиттере»*, превозносящих потенциал этой технологии, автор представляет сценарий, в котором компания-производитель водонепроницаемой обуви хочет заказать исследование рынка и обращается к AutoGPT (системе, построенной на основе языковых моделей OpenAI) для создания отчета о потенциальных конкурентах. Полученное описание является простым и предсказуемым. В нем перечислены пять компаний, в том числе Columbia, Salomon и Merrell, а также пункты, которые предположительно описывают плюсы и минусы их продуктов. «Columbia — известный и уважаемый бренд снаряжения и обуви для активного отдыха», — говорят нам. «Их водонепроницаемая обувь бывает разных стилей», а «их цены конкурентоспособны на рынке». Вы можете посмотреть на это и подумать, что это настолько банально, что, в принципе, бесполезно (и будете правы), но кроме того, информация малость неверна.
Модератор сабреддита r/hiking по имени Крис, которого автор оригинальной статьи привлек в качестве эксперта, сказал, что результат работы ИИ был по существу пустышкой. «Куча слов, но реальной ценности в том, что написано, нет». Не упоминаются такие важные факторы, как разница между мужской и женской обувью или типы используемой ткани. ИИ искажает факты и оценивает бренды с большим присутствием в Интернете как более достойные. В целом, как говорит Крис, никакой экспертизы в полученной информации нет — только догадки. «Если бы мне задали тот же вопрос, я бы дал совершенно другой ответ, — заявил он. — Следование советам ИИ, скорее всего, приведет к тому, что на тропе пострадают ноги».
Точно на то же жалуются модераторы Stack Overflow: дезинформация, генерируемая ИИ, коварна, потому что часто невидима. Она выдается моментально, но не основана на реальном опыте, поэтому для ее оценки требуются время и личный опыт. Если машинный контент заменит человеческое авторство, будет сложно — даже невозможно — полностью оценить ущерб. И да, люди также являются многочисленными источниками дезинформации, но если системы искусственного интеллекта задушат платформы, на которых в настоящее время правит бал человеческий опыт, у нас будет меньше возможностей исправить наши коллективные ошибки.

Эффекты, которые производит ИИ в Интернете, непросто обобщить. Даже в нескольких приведенных выше примерах задействовано множество различных механизмов. В некоторых случаях кажется, что предполагаемая угроза ИИ используется для оправдания изменений, желательных по другим причинам (как в случае с Reddit), в то время как в других случаях ИИ является оружием в борьбе между теми, кто создает ценность сайта, и теми, кто им рулит (Stack Overflow). Есть и другие области, в которых способность ИИ заполнять упомянутые в начале текста «коробки» оказывает разное влияние — от социальных сетей, экспериментирующих с привлечением ИИ, до торговых площадок, где мусор, созданный ИИ, конкурирует с другими товарами.
В каждом случае есть что-то в способности ИИ масштабироваться — в простом факте его грубого распространения и доминирования — что меняет платформу. Многие из самых успешных веб-сайтов — это те, которые используют масштаб в своих интересах либо за счет умножения социальных связей или выбора продуктов, либо за счет сортировки огромного конгломерата информации, из которой состоит сам Интернет. Но этот масштаб зависит от массы людей, которые создают базовую ценность, а люди не могут превзойти ИИ, когда дело доходит до массового производства (несмотря на то, что за кулисами много человеческого труда тратится на создание ИИ.) Есть известное эссе на тему машинного обучения «Горький урок», в котором отмечается, что десятилетия исследований доказывают: лучший способ улучшить системы искусственного интеллекта – это не применять инженерные таланты, а попросту использовать больше вычислительной мощности и данных для конкретной задачи. Урок горький, потому что он показывает, что масштаб машин превосходит возможности человеческого надзора. То же самое можно сказать и о сети.
Но является ли это чем-то плохим? Изменится ли сеть, какой мы ее знаем, перед лицом искусственного изобилия? Некоторые скажут, что так устроен мир, отметив, что сама сеть убила то, что было до нее, и во многом к лучшему. Например, печатные энциклопедии почти вымерли, но большинство предпочтет широту и доступность «Википедии» весу и убедительности «Британники». И несмотря на все проблемы, связанные с написанием текстов искусственным интеллектом, существует множество способов его улучшить — от усовершенствованных функций цитирования до усиления контроля со стороны человека. Кроме того, даже если сеть наводнена мусором, созданным ИИ, это может оказаться полезным, стимулируя разработку финансируемых платформ. Например, если Google постоянно выдает вам мусорные результаты поиска, вы можете предпочесть платить за источники, которым доверяете, и обращаться к ним напрямую.
На самом деле, изменения, которые в настоящее время порождает ИИ, являются просто самыми недавними в долгой истории борьбы в Интернете. По сути, это битва за информацию — за то, кто ее создает, как вы получаете к ней доступ и кто получает за это деньги. Но то, что это знакомая битва, не означает, что она не имеет смысла, и не гарантирует, что новая система будет лучше, чем та, что у нас есть сейчас. Новая сеть изо всех сил пытается родиться, и решения, которые мы принимаем сейчас, будут определять ее развитие.
*Компания Meta Platforms, в которую входят социальные сети Facebook и Instagram, признана экстремистской организацией и запрещена в РФ.
Резюмируя, можно выделить 3 вида вреда.1. Вред конечному пользователю, на которого навалят кучу мусорного, но похожего на правду контента.2. Вред бизнесу, который извлекает выгоду из UGC, контента генерируемого пользователем.3. Вред самому ИИ, которому в следующем поколении не на чем будет учиться.Пока не готов оценить последствия. И если честно, последние два пункта меня мало волнуют. Не думаю, что тому же 4pda это чем-то грозит, как и пользователям использующим информацию оттуда. А сайтов с мусорным контентом, продвинутым с помощью SEO, и сейчас дофига. Инфу с StackOverflow очень легко быстро проверить и заминусовать вредителя. Остаётся Википедия. Основная угроза. Туда заходят за информацией люди, которые в исследуемой теме некомпетентны. Следовательно угрозе от "мусора" подвержены в наибольшей степени.
GrishaTav_SE, Да, люди создают потенциально неточный контент. Ну такие мы 🙂 Но что выдаст сеть, обученная на этом контенте? А что выдадут люди, обученные уже на смешанном контенте? А что выдадут следующие поколения ИИ, обученные на смешанном контенте, ухудшенном людьми обученными на смешанном контенте?То есть, чтобы вы не говорили про людей, вмешательство ИИ ведет к деградации контента.
В последней книге Нила Стивенсона поднималась эта проблема)Там ее решили просто — сделали сервисы, за деньги ессно, где инфа цензурируется мясными экспертами.А без подписки на сервис — барахтайся в океане фейков.
GrishaTav_SE, >> где вся инфа будет за деньги… появится закон…Смущает только одно. Где появляются деньги, пропадает порядочность. А если сверху интересы госудраства…Я все-таки надеюсь, что сработают механизмы самоорганизации. В помойке возникнут островки здравомыслия, которые перетянут на себя людей, отчего остальная территория потеряет интерес для захламления. И Новый Интернет возродится как птица-феникс. Мечтатель, да?
Форратьер, Платный сервис плохо дружит с UGC, пользовательским контентом. Которого сейчас по интресности половина сети. И куда скорее всего будут направлен ИИ.
GrishaTav_SE, Реддит, Вики, SO, Хабр с вами не согласны.Вы кажется не поняли. Есть два типа контента — авторский и пользовательский. И проблемы ожидаются именно с пользовательским. У которого своя экономика и побудительные причины. Бабло извлекают создатели сервисов для пользователей, а не сами пользователи.
GrishaTav_SE, Есть и такая буква. Но UGC первичен. Если перестараются с подмешиванием или тем более сделают вход платным, UGC сократится настолько, что в сервисе пропадет смысл.
есть такой закон (родом из системного анализа, по-моему) — никакая система не может построить другую систему, если уровень сложности второй системы равен или превышает уровень первой системы. т.е., не может нейросеть стать круче человека, ее породившего. соотв. опасаться, что нейросети отнимут у нас Интернет, не стоит. максимум, нейросети заменят в нашем Интернете "хомячков" — невелика потеря, как по мне.
Филипп Мастяев, Так нейросеть испортит интернет не потому что хорошая, а как раз потому, что она плохая.
GrishaTav_SE, Для конечного пользователя в этом даже может быть плюс. Меньше станет тупить в экран, поглощая информационный мусор. Но вот что выживут сервисы, не верю. Отрицательная обратная связь убьет. Будет меньше UGC и меньше посетителей, отчего еще меньше UGC и соответственно еще меньше посетителей, отчего еще меньше…
GrishaTav_SE, из какой части моего комментария это следует? с чего вы взяли, что каждое следующее человеческое поколение проще предыдущего?
GrishaTav_SE, тупее — нет. сытее — точно да
GrishaTav_SE, Скорее, с точки зрения общеобразовательного/времяубивательного потребления. Именно таких посетителей на UGC сайтах большинство. И главное, именно такими и для таких этот UGC создается.Просто представьте, что StackOverflow или 4pda стали брать за посещение деньги. Качество не вырастет, а только уменьшит количество.
GrishaTav_SE, Если всё так хорошо и нужно пользователем, почему такого еще нет? Может потому что между популярностью площадки, количеством читающих, спрашивающих и отвечающих прямая связь? А деньги популярность обрушат на пару порядков.Конечно, можете надеяться что за 100 рублей получите ответ, который сейчас находите бесплатно. Да, может такое быть. Но может и так быть, что вы вообще не получите ответа. 50/50. По прежнему "за то, чтобы вход был платным"?
Lecron, Там нет пользовательского контента. На входе сервиса — интернет, на выходе — ранжированная по вероятности текущая повестка.
GrishaTav_SE, Для людей это неприменимо, мясные умеют генерить информацию, поэтому являются открытой системой. GPT — не умеет, может только лишь рекомбинировать имеющуюся.
GrishaTav_SE, Прогнозы должны быть обоснованы. Иначе это не прогнозы, а мечты. Пока нет разработок вне существующей парадигмы.И да, сам удивляюсь, что таких разработок нет. Графы с абстракцией и композицией, прям напрашиваются. Кажется Миколов, со своей работой по векторам слов, подложил сетям большую свинью. Лепят где надо и не надо. Вырваться не могут.
Когда Знания собраны в документе и его можно скачат ь ихранить и просматривать автономно, то это лучше всяких нейросетей и ИИ
GrishaTav_SE, Эта модель не сработает. Вот есть ценовой порог входа в экосистему Apple и что с того? Вместо осознанного потребления и генерации качественного контента с помощью такого крутого инструмента как айфон, наблюдаеи одни понты и деление на классы: лакшери — нищеброд.
GrishaTav_SE, Схема с платными вопрос-ответами не сработает, потому как мало получить информацию, даже за деньги, ещё нужно её усвоить, проанализировать и сделать собственные выводы, на основании которых принять решение. Поэтому и существуют тематические форумы, где информацию даже из ФАКа сторонний пользователь, не погружённый в тему, не поймёт.
GrishaTav_SE, Это какой-то конкурс: кто предвзятей и продажней?
GrishaTav_SE, А кто решает что лучше? Книга в твёрдом переплёте лучше, чем в мягком. А, если по содержанию, по сценарию применения? Перьевая ручка стоит дороже шариковой, но последняя по всем параметрам лучше первой.
GrishaTav_SE, ну так я и не утверждаю, что с каждым поколением человечество в своей структуре упрощается. это вы утверждаете, что раз очередное поколение тупее предыдущего, то оно и органически проще. а это не так.
GrishaTav_SE, Да на здоровье! Продолжайте идеализировать дальше. Это в мире Apple за деньги уже всё продумано, правильно настроено и пользователю подано. А, если что-то не так, то сам пользователь и виноват, за свои же деньги.
GrishaTav_SE, Могу также сказать про андроидфон.
GrishaTav_SE, Тем более он натурал и джентльмен, можно верить на слово.
Интернет всегда был помойкой. Мусором больше, мусором меньше, помойка не изменится.
Хорошо написано, одно удовольствие читать! Автору большое спасибо.По теме: "битва фейков" продолжается и набирает обороты, скоро будут ценится подписки на прямые источники, владельцы которых будут выкладывать верификационные данные чуть ли ни ежечасно. Оставшиеся в стороне несколько миллиардов людей будут по прежнему жить относительно "нормальной" жизнью…
Хорошо обощили текущие данные что ИМХО подтверждает, что никакого искусственного интеллекта не существует. Тупо выборки использующие теорию графов из БигДата (интернет). Ителлект никогда не создаст "уробороса", которым является бестолковая бесконечность. Интеллект это конечный и оконченный вывод. Он может быть верным или неверным — но всегда он конечный, он не может быть рекурсивным — интеллект это именно то, что позволяет находить концовку.А уроборос — это и есть проблемы нерешенных задач из теории графов.Поэтому я как говорил что текущий "искусственный ителлект" это тупой термин для "лохов". Хоть как-то встряхнуть стагнирующий IT. Теория графов, решение графов похожа на прицип действия нейронов в головном мозге — но это только подмена понятий. Не хватает чего-то важного чего в принципе человечество не понимает для создания настоящего интеллекта.Я реально думал что текущий "ИИ" продержиться 3-5 лет и будет развиваться. Но нет — они наплодили столько рекурсивного г*вна, что утонет это все гораздо быстрее, без возможности всплытия…
В то время как колхозные технологии ИИ бороздят просторы интернет-вселенной и сеют плевелы,на медиа площадке youtube с огромной живой аудиторией пользователей включают теневую цензуру в комментариях.По запросу в гугл "youtube shadowban" уже десятки ссылок на этот факт.Посетители сайта quora описывают свои случаи, как youtube им прикрывает рот. Самое заметное, что под нелицеприятными отзывами в сторону популярного сервиса от гугл больше всего лайков.Возможно, что когда в youtube решили скрыть дизлайки они решили и ввести рандом-бан на комментарии.Под предлогом борьбы с токсичностью идёт борьба с самым ценным — живым мнением живых людей.Порой доходит до абсурда и безобидная фраза попросту скрывается неведомой фильтр-системой.Будущий интернет может быть подобием youtube, где модератор ИИ пресекает всё что ему указали большие боссы, как "нарушение принципов сообщества" или даже намекающее на это слова. Развитие ИИ это ещё одна стадия деградации человечества. И некоторые от жадности и тупости активно учавствуют в этом процессе. Вы всё ещё майните? Вот недавняя новость:Нейросети обучаются на оборудовании для добычи криптовалюты.Основатель компании из Испании назвал эту деятельность "майнинг 2.0"А десятилетия исследований доказывают: лучший способ улучшить системы искусственного интеллекта – это не применять инженерные таланты, а попросту использовать больше вычислительной мощности и данных для конкретной задачи. Всё идёт к электронному рабству с кляпами во рту.