ChatGPT и Suno. Взгляд и опыт ленивого футуролога

Смартфон и телевизор с AI, умная колонка с GPT — искусственный интеллект стал маркером новизны и привлекательности. Но как обстоят дела с практическим применением для рядового пользователя и что день грядущий нам готовит?

Лениво разбираемся и сдержанно фантазируем на примере ChatGPT и Suno AI

С каждым годом скорость развития технологий искусственного интеллекта (ИИ) становится все более ошеломляющей. Если еще несколько лет назад обсуждение генеративных моделей было достоянием лишь узкого круга специалистов, то сегодня ИИ уже активно присутствует в нашей повседневной жизни.

Мы не задумываемся, когда поисковик генерирует нам «быстрый ответ» — компиляцию из обобщенных сведений о вопросе, которая поручается языковой модели.

Также как не задумываемся, каким образом происходит разблокировка по лицу в большинстве современных смартфонов, как работают режимы портретной съемки, как переводится текст с фотографии и о многом подобном, без наличия чего в своем смартфоне мы будем возмущены и даже фраппированы, поскольку привыкли к незримым благам, которые нам предоставляет мир искусственного интеллекта.

Однако для большинства пользователей мир ИИ является закрытой книгой, примерно как криптовалюты – все о них говорят, но никто толком не понимает, как это работает, а главное, практическую ценность и практическое применение. Иными словами, в действии известная школьная максима: «Зачем мне знать про сумму квадратов катетов, как это может пригодиться в реальной жизни?!»

ChatGPT и с чем его едят

Давайте же на примере ChatGPT и программы генерации музыки Suno попробуем разобраться не в терминологии, методах обучения и системах развертки генеративных моделей, а в том, как любой из нас может использовать их для собственного удобства и удовольствия уже сейчас.

Я всё очень тщательно проверил, ‒ сказал компьютер, ‒ и со всей определённостью заявляю, что это и есть ответ. Мне кажется, если уж быть с вами абсолютно честным, то всё дело в том, что вы сами не знали, в чём вопрос.

Я пользуюсь различными генерациями ChatGPT на протяжении уже пары лет и уверенно отмечаю рост как качества ответов самого ИИ, так и собственного понимания того, что и как надо спросить. Раньше я был подобен той самой цивилизации из замечательной книжки Дугласа Адамса «Автостопом по галактике», которая создала невероятно сложный компьютер «Думатель», чтобы загрузить в него единственный «Главный вопрос жизни, Вселенной и вообще…», на что спустя семь с половиной миллионов лет вычислений получила ответ: «42!»

Привычку «гуглить» различную новую и интересную информацию, сначала в форме игрового обучения, а позже и на постоянной основе, я заменял на телеграм-бота ChatGPT и со всей очевидностью наблюдал торжество ИИ над привычными ответами поисковика. Так как в качестве хобби я часто пишу различные статьи, то и здесь я немедленно нашел применение этому чуду ‒ оперативно составить поверхностное впечатление о вопросе (разрешено использовать только продвинутым копирайтерам и контент-криейторам), структурировать план статьи, потребовать от бездушной железяки мозгового штурма в виде фонтана идей, проверить пунктуацию и орфографию (здесь надо быть бдительными, ибо велик и могуч русский язык), даже перевод иностранных статей стал намного более комфортным, одним словом – находка!

Однажды, находясь на неформальном мероприятии среди малознакомых людей, я даже выдал положительно оцененный коллективом тост, который предварительно насобирал за пару минут из лоскутков идей, подкинутых чатом.

Знакомые ленивые программисты и тестировщики перед запуском отладчика не стесняются залить кусок кода в электронного болванчика с весьма примитивным вопросом: «Почему этот код не работает?»

Эти примеры демонстрируют, как разнообразно и полезно можно использовать ChatGPT в повседневной жизни. Он становится компаньоном, помощником и источником информации, оспаривая представление о том, как мы взаимодействуем с технологиями. Как когда-то смартфон стал продолжением наших рук, так теперь и виртуальные помощники в виде ИИ становятся продолжением продолжения, еще больше увеличивая наши возможности. А с учетом того, как стремительно эволюционируют и усложняются генеративные паттерны, мы обязаны иметь представление о том, как с ними взаимодействовать.

Главное, не стоит забывать, что упрощение доступа к информации и окружение себя виртуальными помощниками не должно сказываться на глубине погружения в источники. Кроме того, не менее важно, что при всем своем развитии ChatGPT пока еще очень юн и ни в коем случае нельзя терять концентрацию при обращении к нему за помощью, иначе запутается сам и запутает нас. Наша задача — не научиться списывать (это мы со школы умеем), а обзавестись новыми знаниями за меньший объем времени, знания эти валидировать и употребить во благо!

Немного о Suno AI

Многие наверняка уже слышали, как голосом Виктора Цоя поются мировые хиты, а песни Пола Маккартни исполняются Егором Летовым. При этом человечеству явно не хватало открытости, публичности и пользовательского удобства у подобных платформ, и вот появилась Suno! Познакомился я с ней прошлой зимой, и уже успел «написать» свои «шедевры», которые, простите мне эту заботу, выкладывать не буду.

Тоже генеративная модель-помощник, весьма ловкая в понимании жанров, дирижерства стрелочками в текстовом редакторе (да, есть и такое!), ударений, даже различные вокальные украшения при правильном написании понимает. Самое главное, достаточно простая в восприятии: пишем запрос, например, «песня про Смешариков в стиле Советского марша» ‒ «Create» ‒ вуаля! Теперь вы музыкант с потенциалом, ограниченным лишь собственной фантазией и возможностями Suno.

Можно вставить свой текст или стихотворение, расписать по куплетам тип инструментального сопровождения и части композиции, выбрать тональность, гамму, даже тембр и пол вокалиста. Но апофеоза принципа «вкалывают роботы – счастлив человек!» я достиг, когда сгенерировал текст оперы «Смелый курва-бобр» с описанием солирующего голоса и хора в ChatGPT, а следом закинул ее в Suno, сопроводив необходимым жанровым описанием. По тексту получилось посредственно, но бодро, «смелый бобр нес свой свет в этот темный мир» на протяжении трех минут, а вот вокально-инструментальное сопровождение было настолько эпическим, что извечную проблему генеративных песенок – ощущаемую искусственность модуляций голосов – почти не было слышно за шикарным ревом десятков искусственных глоток.

Хотя в настоящий момент для отечественного пользователя есть сложности с платным доступом, в Интернете уже достаточно статей, как написать больше десяти ежедневно доступных бесплатных треков ‒ по собственному опыту могу сказать, для досугового развлечения более чем достаточно.

Нельзя также обойти вниманием и маркетинговые перспективы этой платформы. Согласно одному исследованию, порядка 80% рекламного контента на видеоплатформах содержит музыку. А у нас пока еще есть возможность использовать условно-бесплатный генератор этой музыки. Здесь сам собой напрашивается «аудиобрендинг». Все мы помним «винрарный» пример ‒ блеющую овцу при запуске знаменитого плеера Winamp или заставки всемирно известных кинокомпаний. Создание сопровождающей контент музыки и эффектов, бесконечная генерация приятного музыкального фона супротив обрыдлых мелодик при удержании клиента на линии ожидания. Словом, перспективы существенные, и они не ждут!

Футурологическая бочка меда

На мой взгляд, геометрическая прогрессия развития генеративных моделей приведет к тому, что рядовой пользователь останется на уровне потребителя, сопоставимым с описанными мной выше примерами. То есть при существенном росте вовлечения ИИ в повседневную жизнь компетенции в области формулирования средним мещанином различных промт-запросов вырастут несущественно. Что влечет за собой неизбежное развитие новых профессий, в первую очередь промт-инженера ‒ например, оператора ChatGPT. Специально обученный человек из специально обученного университета будет точно знать, как и какие промт-запросы необходимо отправлять генеративной модели, чтобы получить достоверный ответ на сложный, комбинированный вопрос. Например, о составлении экономической модели компании в определенный период при условии уточнения достаточного количества влияющих факторов. Звучит вполне достоверно и уже не так фантастически.

Не раз наблюдал, как отечественные книжные издательства неосторожно экспериментируют с иллюстрациями на своих выставках и обложках книг ‒ ИИ-иллюстраторы превратят даже самые претенциозные ТЗ в шедевры, например, с помощью не попавшей в эту статью программы генерации изображений Midjourney. Кстати говоря, Midjourney и ее аналоги заслуживают отдельного детального внимания как к возможностям, так и к уже имеющимся достижениям юных духом промт-музыкантов.

ИИ-писатели, ИИ-тестировщики, ИИ-музыканты и даже самостоятельные программы, умеющие работать в качестве промт-инженеров широкого профиля, ‒ это будущее, которое важно не упустить, дабы составить достойную конкуренцию на острие мирового рынка труда!

Футурологическая ложка дегтя

За всеми радостями и удовольствиями, которые нам преподносят генеративные модели, не следует забывать об обществе и политике, которые объединяются в одном понятии ‒ государство. С развитием таких мощных инструментов воздействия и взаимодействия возникает необходимость в регулировании и безопасном для общества хранении и распространении искусственно сгенерированного контента. Вопросы о контроле над произведениями, созданными операторами при помощи ИИ, а впоследствии созданными самим ИИ, становятся всё более актуальными. Как с этим справится законодательство, которому зачастую не хватает скорости реакции? Боязнь непредсказуемых последствий использования ИИ поднимает волну дискуссий о том, как следует подойти к вопросу ответственности, авторства и распространения.

Становится всё более вероятным возникновение «подпольных ЧатовGPT» ‒ платформ, предлагающих услуги генерации вне рамок регулируемого пространства. Эти платформы могут конкурировать с мейнстримными сервисами, предлагая более гибкие решения вне законных ограничений. Как будут реагировать правительства на такую ситуацию? Вероятно, мы увидим не только попытки закрыть или ограничить доступ к таким сервисам, но и создание новых законов, направленных на защиту авторских прав и творческих интересов.

Полагаю, что недалек тот день, когда объявятся законные владельцы-лицензиары голосов известных личностей, которые запретят искусственному Цою петь. Когда искусственный Цой уйдет в подполье, совместно с государством начнут использовать пунитивные воспитательные практики применительно к нерадивым промт-операторам и прочим создателям контента на базе нарушения авторского права. И молодые создатели генеративных машин, и промт-анархисты будут создавать свои Зионы, ибо кто не был в юности радикалом, у того нет сердца, а я скрепя сердце оплачу подписку…

Заключение

При всей сложности как правоприменительной практики, так и лавинообразного развития генеративных моделей нужно понимать, что мы открыли дверь удивительного явления, которое уже сейчас меняет линию горизонта далекого будущего. Поэтому важно внимательно следить за перспективами ближайшего. Человечество многим обязано ужасающе-удивительным открытиям и достижениям двадцатого века, которые навсегда изменили ландшафт социальной и экономической жизни. Похоже, что его обязательства в отношении двадцать первого века тоже не заставили себя ждать. Как говорит моя мама – главное, чтобы на пользу шло!

ChatGPT и Suno. Взгляд и опыт ленивого футуролога

Лениво разбираемся и сдержанно фантазируем на примере ChatGPT и Suno AI

Флагман среднего сегмента realme 16 Pro+. Мастер портрета

Субботний кофе №378

Фитнес-браслет HUAWEI Band 11 Pro: чемпион сегмента до 10 000 рублей

Серый рынок и все, что нужно про него знать, из первых рук. Читаем внимательно

ChatGPT и с чем его едят

Открытые TWS-наушники, модные Huawei FreeClip 2

Ваш следующий телевизор Samsung – Samsung QLED или с технологией микро-светодиодов RGB

Обзор умного диктофона Mobvoi TicNote (NE-79). Зачем диктофону ИИ?

Чем хорош iQOO 15R: минимум маркетинга, максимум результата

Немного о Suno AI

Футурологическая бочка меда

Футурологическая ложка дегтя

Заключение