Смартфон и телевизор с AI, умная колонка с GPT — искусственный интеллект стал маркером новизны и привлекательности. Но как обстоят дела с практическим применением для рядового пользователя и что день грядущий нам готовит?
Лениво разбираемся и сдержанно фантазируем на примере ChatGPT и Suno AI
С каждым годом скорость развития технологий искусственного интеллекта (ИИ) становится все более ошеломляющей. Если еще несколько лет назад обсуждение генеративных моделей было достоянием лишь узкого круга специалистов, то сегодня ИИ уже активно присутствует в нашей повседневной жизни.
Мы не задумываемся, когда поисковик генерирует нам «быстрый ответ» — компиляцию из обобщенных сведений о вопросе, которая поручается языковой модели.
Также как не задумываемся, каким образом происходит разблокировка по лицу в большинстве современных смартфонов, как работают режимы портретной съемки, как переводится текст с фотографии и о многом подобном, без наличия чего в своем смартфоне мы будем возмущены и даже фраппированы, поскольку привыкли к незримым благам, которые нам предоставляет мир искусственного интеллекта.
Однако для большинства пользователей мир ИИ является закрытой книгой, примерно как криптовалюты – все о них говорят, но никто толком не понимает, как это работает, а главное, практическую ценность и практическое применение. Иными словами, в действии известная школьная максима: «Зачем мне знать про сумму квадратов катетов, как это может пригодиться в реальной жизни?!»
ChatGPT и с чем его едят
Давайте же на примере ChatGPT и программы генерации музыки Suno попробуем разобраться не в терминологии, методах обучения и системах развертки генеративных моделей, а в том, как любой из нас может использовать их для собственного удобства и удовольствия уже сейчас.
Я пользуюсь различными генерациями ChatGPT на протяжении уже пары лет и уверенно отмечаю рост как качества ответов самого ИИ, так и собственного понимания того, что и как надо спросить. Раньше я был подобен той самой цивилизации из замечательной книжки Дугласа Адамса «Автостопом по галактике», которая создала невероятно сложный компьютер «Думатель», чтобы загрузить в него единственный «Главный вопрос жизни, Вселенной и вообще…», на что спустя семь с половиной миллионов лет вычислений получила ответ: «42!»
Привычку «гуглить» различную новую и интересную информацию, сначала в форме игрового обучения, а позже и на постоянной основе, я заменял на телеграм-бота ChatGPT и со всей очевидностью наблюдал торжество ИИ над привычными ответами поисковика. Так как в качестве хобби я часто пишу различные статьи, то и здесь я немедленно нашел применение этому чуду ‒ оперативно составить поверхностное впечатление о вопросе (разрешено использовать только продвинутым копирайтерам и контент-криейторам), структурировать план статьи, потребовать от бездушной железяки мозгового штурма в виде фонтана идей, проверить пунктуацию и орфографию (здесь надо быть бдительными, ибо велик и могуч русский язык), даже перевод иностранных статей стал намного более комфортным, одним словом – находка!
Однажды, находясь на неформальном мероприятии среди малознакомых людей, я даже выдал положительно оцененный коллективом тост, который предварительно насобирал за пару минут из лоскутков идей, подкинутых чатом.
Знакомые ленивые программисты и тестировщики перед запуском отладчика не стесняются залить кусок кода в электронного болванчика с весьма примитивным вопросом: «Почему этот код не работает?»
Эти примеры демонстрируют, как разнообразно и полезно можно использовать ChatGPT в повседневной жизни. Он становится компаньоном, помощником и источником информации, оспаривая представление о том, как мы взаимодействуем с технологиями. Как когда-то смартфон стал продолжением наших рук, так теперь и виртуальные помощники в виде ИИ становятся продолжением продолжения, еще больше увеличивая наши возможности. А с учетом того, как стремительно эволюционируют и усложняются генеративные паттерны, мы обязаны иметь представление о том, как с ними взаимодействовать.
Главное, не стоит забывать, что упрощение доступа к информации и окружение себя виртуальными помощниками не должно сказываться на глубине погружения в источники. Кроме того, не менее важно, что при всем своем развитии ChatGPT пока еще очень юн и ни в коем случае нельзя терять концентрацию при обращении к нему за помощью, иначе запутается сам и запутает нас. Наша задача — не научиться списывать (это мы со школы умеем), а обзавестись новыми знаниями за меньший объем времени, знания эти валидировать и употребить во благо!
Немного о Suno AI
Многие наверняка уже слышали, как голосом Виктора Цоя поются мировые хиты, а песни Пола Маккартни исполняются Егором Летовым. При этом человечеству явно не хватало открытости, публичности и пользовательского удобства у подобных платформ, и вот появилась Suno! Познакомился я с ней прошлой зимой, и уже успел «написать» свои «шедевры», которые, простите мне эту заботу, выкладывать не буду.
Тоже генеративная модель-помощник, весьма ловкая в понимании жанров, дирижерства стрелочками в текстовом редакторе (да, есть и такое!), ударений, даже различные вокальные украшения при правильном написании понимает. Самое главное, достаточно простая в восприятии: пишем запрос, например, «песня про Смешариков в стиле Советского марша» ‒ «Create» ‒ вуаля! Теперь вы музыкант с потенциалом, ограниченным лишь собственной фантазией и возможностями Suno.
Можно вставить свой текст или стихотворение, расписать по куплетам тип инструментального сопровождения и части композиции, выбрать тональность, гамму, даже тембр и пол вокалиста. Но апофеоза принципа «вкалывают роботы – счастлив человек!» я достиг, когда сгенерировал текст оперы «Смелый курва-бобр» с описанием солирующего голоса и хора в ChatGPT, а следом закинул ее в Suno, сопроводив необходимым жанровым описанием. По тексту получилось посредственно, но бодро, «смелый бобр нес свой свет в этот темный мир» на протяжении трех минут, а вот вокально-инструментальное сопровождение было настолько эпическим, что извечную проблему генеративных песенок – ощущаемую искусственность модуляций голосов – почти не было слышно за шикарным ревом десятков искусственных глоток.
Хотя в настоящий момент для отечественного пользователя есть сложности с платным доступом, в Интернете уже достаточно статей, как написать больше десяти ежедневно доступных бесплатных треков ‒ по собственному опыту могу сказать, для досугового развлечения более чем достаточно.
Нельзя также обойти вниманием и маркетинговые перспективы этой платформы. Согласно одному исследованию, порядка 80% рекламного контента на видеоплатформах содержит музыку. А у нас пока еще есть возможность использовать условно-бесплатный генератор этой музыки. Здесь сам собой напрашивается «аудиобрендинг». Все мы помним «винрарный» пример ‒ блеющую овцу при запуске знаменитого плеера Winamp или заставки всемирно известных кинокомпаний. Создание сопровождающей контент музыки и эффектов, бесконечная генерация приятного музыкального фона супротив обрыдлых мелодик при удержании клиента на линии ожидания. Словом, перспективы существенные, и они не ждут!
Футурологическая бочка меда
На мой взгляд, геометрическая прогрессия развития генеративных моделей приведет к тому, что рядовой пользователь останется на уровне потребителя, сопоставимым с описанными мной выше примерами. То есть при существенном росте вовлечения ИИ в повседневную жизнь компетенции в области формулирования средним мещанином различных промт-запросов вырастут несущественно. Что влечет за собой неизбежное развитие новых профессий, в первую очередь промт-инженера ‒ например, оператора ChatGPT. Специально обученный человек из специально обученного университета будет точно знать, как и какие промт-запросы необходимо отправлять генеративной модели, чтобы получить достоверный ответ на сложный, комбинированный вопрос. Например, о составлении экономической модели компании в определенный период при условии уточнения достаточного количества влияющих факторов. Звучит вполне достоверно и уже не так фантастически.
Не раз наблюдал, как отечественные книжные издательства неосторожно экспериментируют с иллюстрациями на своих выставках и обложках книг ‒ ИИ-иллюстраторы превратят даже самые претенциозные ТЗ в шедевры, например, с помощью не попавшей в эту статью программы генерации изображений Midjourney. Кстати говоря, Midjourney и ее аналоги заслуживают отдельного детального внимания как к возможностям, так и к уже имеющимся достижениям юных духом промт-музыкантов.
ИИ-писатели, ИИ-тестировщики, ИИ-музыканты и даже самостоятельные программы, умеющие работать в качестве промт-инженеров широкого профиля, ‒ это будущее, которое важно не упустить, дабы составить достойную конкуренцию на острие мирового рынка труда!
Футурологическая ложка дегтя
За всеми радостями и удовольствиями, которые нам преподносят генеративные модели, не следует забывать об обществе и политике, которые объединяются в одном понятии ‒ государство. С развитием таких мощных инструментов воздействия и взаимодействия возникает необходимость в регулировании и безопасном для общества хранении и распространении искусственно сгенерированного контента. Вопросы о контроле над произведениями, созданными операторами при помощи ИИ, а впоследствии созданными самим ИИ, становятся всё более актуальными. Как с этим справится законодательство, которому зачастую не хватает скорости реакции? Боязнь непредсказуемых последствий использования ИИ поднимает волну дискуссий о том, как следует подойти к вопросу ответственности, авторства и распространения.
Становится всё более вероятным возникновение «подпольных ЧатовGPT» ‒ платформ, предлагающих услуги генерации вне рамок регулируемого пространства. Эти платформы могут конкурировать с мейнстримными сервисами, предлагая более гибкие решения вне законных ограничений. Как будут реагировать правительства на такую ситуацию? Вероятно, мы увидим не только попытки закрыть или ограничить доступ к таким сервисам, но и создание новых законов, направленных на защиту авторских прав и творческих интересов.
Полагаю, что недалек тот день, когда объявятся законные владельцы-лицензиары голосов известных личностей, которые запретят искусственному Цою петь. Когда искусственный Цой уйдет в подполье, совместно с государством начнут использовать пунитивные воспитательные практики применительно к нерадивым промт-операторам и прочим создателям контента на базе нарушения авторского права. И молодые создатели генеративных машин, и промт-анархисты будут создавать свои Зионы, ибо кто не был в юности радикалом, у того нет сердца, а я скрепя сердце оплачу подписку…
Заключение
При всей сложности как правоприменительной практики, так и лавинообразного развития генеративных моделей нужно понимать, что мы открыли дверь удивительного явления, которое уже сейчас меняет линию горизонта далекого будущего. Поэтому важно внимательно следить за перспективами ближайшего. Человечество многим обязано ужасающе-удивительным открытиям и достижениям двадцатого века, которые навсегда изменили ландшафт социальной и экономической жизни. Похоже, что его обязательства в отношении двадцать первого века тоже не заставили себя ждать. Как говорит моя мама – главное, чтобы на пользу шло!
>> возникает необходимость в регулировании и безопасном для общества хранении и распространении искусственно сгенерированного контентаА возникает ли? Недавно какого-то депутата-коммуниста поймали скрытой камерой с недвусмысленными приключениями в компании юной леди. Партия сразу сказала, что это все нейросети. Не станет никто их запрещать и контролировать. Слишком удобно все валить на них. Были бы такие нейросети, которые проступками людей бы управляли, так бракоделы бы закидали разработчиков деньгами, чтобы свои перлы прикрыть.>> законные владельцы-лицензиары голосов известных личностейУ нас, несколько я могу судить нет правоприменительной базы с правами на образ (в США есть). Только авторские права на художественные произведения, патенты и свидетельства на товарные знаки. Голоса пока, тьфу-тьфу, сюда не подпадают. Надеюсь, так и останется.За наводку на Suno спасибо. Интересно стало.
Много проблем с русским языком. Например, сгенировать изображение с надписью на русском могут один-два сервиса, а вот создать видеоролик с запрещённым противозаконным контентом с вашим недоброжелателем в главной роли проще простого
"пунитивные воспитательные практики" Карательные
Mikhail Volkov, Добрый день, спасибо за комментарий)Я предлагаю рассматривать мои размышления именно как ленивую футурологию, приправленную некоторым пониманием развития законотворческой практики и жизненным опытом вообще) По моему опыту, когда государство что-то не понимает, оно, перво-наперво это "что-то" запрещает и не пущает" (см. развитие криптовалюты в России). Я бы сказал, что это совсем не плохо, поскольку сначала надо понять что это такое, сформулировать позицию, подготовить законодательную базу и т д.>>Слишком удобно все валить на них.Отчасти по этой причине и будут регулировать. Но причин, более важных, как водится, больше)>>У нас, несколько я могу судить нет правоприменительной базы с правами на образ (в США есть).Это так, но здесь вопрос вполне прогнозируемого будущего)
119270, Это правда, но развитие ошеломляющее. Но надо признать, что те, которые умеют — делают это весьма неплохо. Что касается роликов, то лучше не надо этого делать, даже против недоброжелателя))
Филипп Мастяев, Именно так)
Владимир, ,>> когда государство что-то не понимает, оно, перво-наперво это "что-то" запрещаетКриптовалюта здесь неудачный пример. Она, напротив, была слишком хорошо понятна государству. Неподконтрольная эмиссия, сложности налогооблажения и т.п. Так что запрет более чем понятный.>> Отчасти по этой причине и будут регулироватьА фотошоп чего не запретили? А Cinema 4D? Технических средств, которые позволяют в умелых руках создавать фейки было вагон и до нейросетей. Никто проблем на эту тему не испытывал.>> сначала надо понять что это такое, сформулировать позицию, подготовить законодательную базу и т д.Нет, нет и ещё раз нет. Это путь догоняющего. Государству новые направления нужно брать под свой контроль, не создавая для них нормы, а консолидируя в своих руках специалистов этих направлений.
"ИИ-тестировщики, ИИ-музыканты" — никогда не будет. Первые потому что это только кажется легко, а на деле давать ии доступ и прописывать его в весь проект — практически не реально (на это кстати есть unit тесты). Музыканты — у ии нет собственного чувства вкуса и не может быть. Он не хочет ничего донести, у него нет истории, нет переживаний. ДА и как замена гуглу (по крайней мере тому гуглу, который был лет 5 назад) — ии проигрывает. Вопрос только что гугл тоже стал выдавать много мусора, что бы сохранять удержание, но в целом — если я задаю четкий вопрос, я не должен задав его второй раз получить другой ответ.
Mikhail Volkov, >>Так что запрет более чем понятный.А вы поглядите, как это все дальше развивается, заговорили о цифровом рубле и о дальнейших разрешениях. Это как раз и говорит о типично государственном подходе. Запретить — адаптировать под себя — предложить свой вариант. Единственно логичное поведение для обеспечения монополии на хождение денег.>>А фотошоп чего не запретили?Я все-таки не утверждал, что запретят, я писал о предполагаемом регулировании, которое может привести и к закрытию некоторых платформ. Здесь еще можно рассматривать этот момент с точки зрения регулирования со стороны будущих владельцев всяких топовых чатов, которые будут вводить подписки на использование и т д (впрочем уже вводят) — это неизбежно влечет за собой развитие пиратства всех видов.>>Государству новые направления нужно брать под свой контрольКонечно надо, но получается это далеко не всегда. Вот если бы условный Яндекс был государственной компанией и таких ИИ-генераторов было еще некоторое количество, я бы на это явление смотрел с большим оптимизмом. Поэтому этот подраздел и называется "Футурологическая ложка дегтя". В самом названии скрыта моя уверенность, что проблема эта будет носить намного менее значимый характер, супротив бочки меда.
Роман Бутюгин, >>"ИИ-тестировщики, ИИ-музыканты" — никогда не будет. В данном случае имеются в виду именно промт-инженеры в этих областях искусства. Все вышеперечисленное у них есть, а ИИ просто помощник. Пожалуй, я не совсем корректно это указал.>>ДА и как замена гуглу (по крайней мере тому гуглу, который был лет 5 назад) — ии проигрывает.Речь не идет о замене, речь идет о забавном опыте, который дает пищу к размышлениям.
Уже NVIDIA свой ИИ выкатила… Понеслась. Новый ИИ как новый айфон. Каждый раз лучше)))
Владимир, ,>> заговорили о цифровом рубле и о дальнейших разрешенияхЦифровой рубль — это даже близко не криптовалюта. Скорее это экономия на бумаге. Не более. Ну и шаг к большей деанонимизации.>> я писал о предполагаемом регулировании, которое может привести и к закрытию некоторых платформЕсли заменить «запрет» на «регулирование», то фотошоп также не регулируется никак. Исключительно в рамках существующего правового поля, когда его используют для чего-то вроде клеветы или подделки чего-либо. Контроль будет аналогичен утверждению Дурова о необходимости запрета слов, поскольку их используют злоумышленники. Если действия посредством инструмента будут вредить, то разбираться нужно с вредителем, а не с инструментом (за исключением случаев, когда инструмент создан исключительно, чтобы вредить).>> скрыта моя уверенность, что проблема эта будет носить намного менее значимый характерСогласен с вами. Скорее всего пользователи поиграют, перебесятся и все пойдет само собой.
😤
занимаюсь музыкой и разработкой. Если для разработки чат реально круто и удобно (при знании дела продуктивность вырастает в разы, потому что чат неплохо экранирует рутину), то для музыки прям вообще бесполезно. Суно не умеет дорабатывать, оно ничего не умеет, кроме как по промпту написать готовую песню. Например, оно даже не может по имеющейся гармонии накидать аранжировку в таком-то стиле или добавить одну партию инструментов. Просто пишет готовую песню. Если для поиграться или послушать примеры в жанре — да, но реальной пользы нет. Если бы можно было последовательностью промптов довести идею до реализации, то да, а каждый раз писать новую готовую песню — нет.
Bassist, Согласен с вами, платформа еще сыровата для профессионального использования, но на то мы и фантазируем, при чем сдержано)Но она дает широкому пользователю возможность "побаловаться" и те самые первичные навыки промта. А моменты несовершенства скорее конкурентный недостаток, который в будущем отделит игрушки для аматоров от профессиональных платформ под специальные задачи музыкантов. Я в этом убежден.А вам успехов в творчестве!