Про «рисование» с помощью нейросети Midjourney – игрушка или будущее?

Привет.

Какие-то темы перекликаются между собой, причудливо переплетаются и создают взгляд на одну и ту же историю с разных сторон. Без энтузиазма досматривал четвертый сезон «Мира Дикого Запада», попытка смешать философские вопросы бытия с актуальными событиями, разбавив все неизменной стрельбой, привела к причудливому результату. Ни боевика, ни какой-либо скрытой морали, только мертвечина, раскрашенная кое-как. Не захватывает и не развлекает, сериал был многообещающим, но, как часто бывает, с каждым сезоном становился все менее интересным.

Вспомнить сериал заставил один из образов, альтер эго Долорес трудилась в компании, которая создавала истории. Кристина сидела за столом, диктовала компьютеру описание сцен, людей и тут же видела, как они появляются в воздухе, им можно было добавлять черты, программировать их поведение. Ничего сказочного в таком интерфейсе нет, он может появиться уже в ближайшие годы и стать массовым. Причем произойдет это незаметно и без нашего активного участия. Я думаю, что никто не помнит, когда появился поиск по картинкам в Google Photos, кажется, они были первыми. Постепенно такой тип поиска проникал в повседневную жизнь, для меня он стал единственно возможным: «Найди мне картинки из Лос-Анджелеса, даунтаун, май 2020 года, чтобы на них были ретроавтомобили». Не всегда поиск работает правильно, но он облегчает навигацию в сотне тысяч фотографий моего архива. И без такого поиска я как без рук. Алгоритм его примерно совпадает с кучей других задач, где важно распознавание предметов или текстов на изображении. Наши смартфоны умеют переводить вывески на лету, делать перевод или сохранять текст с фотографии в заметках, достаточно открыть приложение. Одним словом, чудеса случились, но как-то буднично и обыденно. Никто не славит эти достижения, они воспринимаются как нечто само собой разумеющееся. Мы слишком привыкли к прогрессу и его плодам.

Сегодняшние алгоритмы умеют создавать картинки и тексты по описанию, которое вы им задаете. Задачи выглядят очень сложными, но, разбив их на составляющие, можно получить удобоваримый результат. Впечатляющие картинки, получаемые AI-алгоритмом DALL-E, кажутся чем-то невообразимым, но на самом деле сложность системы весьма относительна и упирается в возможность обсчитывать большие массивы информации, работать с картинками. Не хочу слишком упрощать, алгоритм нужно написать, натренировать, и сказать, что все настолько просто, нельзя. Но сама идея очень проста и не вызывает удивления, отсюда отсутствие восхищения, которое должно захлестнуть нас с вами.

Выложил в Telegram-канале картинки, созданные нейросетью Midjourney, их автор — художник Александр Доброкотов. Он смог подобрать запросы к нейросети таким образом, чтобы она нарисовала образы панельных зданий в стилистике разных художников. Получилось добротно и любопытно.

В комментариях кто-то закономерно спросил, можно ли считать Александра художником, ведь рисовал картинки не он! И этот вопрос будет мучить многих людей в ближайшие десятилетия, так как образ художника сильно изменится. Полюбопытствуйте о работах Александра, у него очень богатое воображение и отличный вкус, усомниться в том, что он умеет рисовать, нельзя. Возможно, мы начнем разделять обычных художников и цифровых, но простота создания вот таких «картин» с помощью нейросети очень быстро девальвирует их ценность как таковую. Слишком много «художников» будет вокруг нас.

На данный момент широкому распространению DALL-E или Midjourney мешает только отсутствие достаточных вычислительных мощностей, за обработку графики и ваших запросов всегда кто-то должен платить из своего кармана. Сегодня вопрос не в алгоритмах, а в том, как сделать их не очень затратными и прожорливыми для обсчёта данных. Через какое-то время наши смартфоны научатся локально производить ровно такие же вычисления, появятся режимы симбиоза, когда вы подкидываете свои эскизы, а их эволюцию и проработку на себя берет устройство. Под вашим чутким руководством, когда вы говорите, какого именно результата хотите добиться. И не тратите свое время на заполнение части картинки текстурой, не вырисовываете мельчайшие детали. Зачем это делать, если можно заставить заниматься рутиной компьютер?

В нескольких текстах, обсуждающих будущее AI-искусства, встретил тезис, что можно создать свой алгоритм, свои образы, которые будут уникальны, и поэтому вы сможете выделиться. Возможно, единицам это удастся, но очень быстро такие образы станут эксплуатироваться всеми без исключения. Тут же вопрос моды, которая в наше время быстротечна и очень преходяща. Вспомните приложение Prisma, которое наделало много шума в 2016 году, люди сходили с ума по фотографиям, обработанным в нем. Этакий фильтр для ваших снимков.

Ничего не изменилось за эти шесть лет, что-то становится модным, алгоритм требует вычислительных мощностей, и поэтому доступ к нему ограничивают. Обратите внимание, что фильтры, подобные Prisma, сегодня являются частью обычных фоторедакторов, они бесплатны и мало кого интересуют. За минуту сделал снимок в лифте и тут же в пару касаний получил его различные варианты. В 2016 году для обработки снимка нужны были серверы, и они дымились от нагрузки, так как толпы людей хотели «уникальную» картинку. Ничего такого сегодня нет.

Давайте попробуем новую игрушку Midjourney

Не стоит переоценивать новую игрушку, которая привлекает внимание. Тот же Midjourney хорошо оформлен, но это один проект из многих. Его отличие в том, что вам дают возможность поиграть с ним, создать свои картинки и посмотреть, как работает технология.

Для начала вам нужен свой аккаунт Discord, зарегистрируйтесь, если у вас его нет. И отправляйтесь в канал Midjourney. Его можно найти вот тут.

Слева находите раздел Newcomers rooms, заходите туда и можете начинать творить. Вам нужно набрать /imagine и далее вести описание того, что вы хотите «нарисовать», на английском языке.

Бот напишет, что занялся работой, дальше покажет четыре предварительных наброска, вы можете улучшить какой-то из них либо выбрать версии. Все очень просто, но для бесплатного аккаунта возможно 25 изменений, это число меньше, чем число картинок, которые вы сможете получить. Каждый вариант — это попытка, поэтому относитесь к ним бережно. Либо регистрируйтесь повторно, никто не следит за этим, можете пользоваться сервисом до бесконечности.

Давайте посмотрим на мои опыты. «Прекрасная девушка на песке другой планеты с Луной в небесах». Примерно так составил свой запрос.

Пока ждал обработки несколько минут, рассматривал чужие запросы и картинки, они видны. Некоторые получаются очень даже любопытными.

И вот мне предложили четыре варианта, выбрал для изучения последний.

Получившуюся картинку можно апскейлить до максимального размера.

И вот что вышло в итоге.

Следующий вариант – «Юный пришелец смотрит в экран смартфона, за спиной океанская волна и серферы». Варианты мне не понравились, изучать дальше не стал.

«Красотка, пьющая мартини на закате в Италии». Получилось очень странно, тоже пропустил.

В стиле Дали и Мондриана попросил изобразить игроков в шахматы, обдумывающих следующий ход и сидящих под дубом в поле. Не очень, но в одной картинке что-то есть.

Реализм получился странным – «Рука, держащая шахматную фигуру, королеву». Вот что нарисовал алгоритм.

Печатал «Старик и море», почему-то все сбилось, и остался старик. Выдало атмосферные картинки.

Исследовал одну из них, и вот что получилось.

«Смартфон, лежащий на старом деревянном столе с цветами». Картинки не впечатлили.

Откровенно говоря, разинутого рта не было, картинки и картинки, какие-то можно доработать так, чтобы они были удобоваримы. Для тех, кто не умеет рисовать, это, безусловно, инструмент, который облегчает жизнь, например, так можно иллюстрировать статьи, задавая картинку образами. И вот тут мы переходим к авторским правам и стоимости таких работ.

Сколько стоит Midjourney, кому принадлежат работы

В бесплатной версии работы принадлежат вам, но вы не можете их использовать в коммерческих целях и должны ссылаться на Midjourney. При подписке за 10 долларов в месяц вы получите возможность создавать до 200 картинок в месяц, иметь доступ к галерее других людей (если хотите закрыть доступ к своим работам, за 50 долларов в месяц это возможно). Кстати, в библиотеке показывают наилучшие работы, они яркие и притягательные, что понятно — товар показывают лицом.

За тридцать долларов в месяц вы получаете все права на свои работы, можете использовать их как угодно. Ограничений на число работ нет, но оговаривается, что особо рьяных энтузиастов могут ограничить, следует проявлять разумность и не загружать серверы 24 на 7. Любая лицензия персональная.

Для компаний, имеющих выручку от миллиона долларов в год, есть персональная лицензия на одного человека — 600 долларов в год. Достаточно терпимая сумма, картинки можно использовать как угодно.

Назвать художниками тех, кто будет создавать в Midjourney картинки, нельзя, тут нечто другое. Я воспринимаю это направление развития технологий как некий продвинутый клипарт, который художественной ценности, как правило, не несет. Конечно, такие люди, как Александр Доброкотов, могут создавать интересные вещи, но это вопрос мышления и подготовки. Инструмент любопытный, но он пока не готов к прайм-тайм. В повседневной работе использовать его будет сложно, время от времени — возможно.

Нас будет ждать все больше и больше таких инструментов, само понимание того, кто такой художник, размоется. Уже говорят, что есть цифровые художники, а мне это видится иначе. Художник — человек с воображением, совсем не важно, какими инструментами он будет пользоваться. В чем-то завидую сам себе, потому что совсем скоро расширится набор инструментов, вот только, с другой стороны, есть боязнь, что людей с воображением не станет больше. И, наверное, стоит обратить на это внимание, алгоритмы нас не заменят. Хотя и это тоже зависит от нас и от нашего восприятия мира.

[email protected]
наверх