Художник на AI-алгоритмах, DALL‑E 2 как поворотный момент истории

Привет.

Время чудес, которые нас окружают, сделало нас черствыми и не заставляет сердце биться чаще, когда мы сталкиваемся с ними в реальной жизни. Человечество постоянно открывает новые двери в будущее, но за редким исключением мы неспособны осознать, что нам несет это будущее. Алгоритм DALL-E от Open AI — счастливое исключение, его применение понятно и наглядно, а область использования настолько широка, что даешься диву, как такого не существовало раньше. И это фантастика во всех смыслах.

Название DALL-E недвусмысленно напоминает про Дали, написание говорит, что создатели вдохновлялись мультфильмом WALL-E от Pixar. Этакое соединение двух миров, человеческого и искусственной земли алгоритмов. Что делает DALL-E, достигший за год второй версии? Рисует картины, причем умеет делать это на основании того, что вы скажете алгоритму. Например, у вас может быть странное чувство юмора и вы захотите изменить картину Яна Вермеера “Девушка с жемчужной сережкой”. Посмотрите одноименный фильм, который хорошо описывает процесс создания картины, то, как жили люди в 1665 году. Забыть, как выглядит эта картина, невозможно, но на всякий случай напомню.

Теперь вернемся к дурному чувству юмора и попросим DALL-E нарисовать выдру с жемчужной сережкой. Текстовый запрос не так прост, как может показаться, тут важен контекст. Программа должна понять, что мы не просто хотим получить изображение животного с сережкой, а создаем пародию на известную картину. И нарисовать картинку нужно именно в таком стиле. Смотрим, что получилось на выходе.

Круто? Не то слово. Причем вы можете получить произвольное число картинок, уточнять свой запрос и “рисовать” словами. Уникальное изображение, которое вы получите на выходе, будет вашим детищем, никакие отчисления никому платить будет не нужно. И это сразу же ставит вопрос о том, кем будут художники будущего, ведь отныне создание картины в любом стиле и технике — вопрос наличия программы и большого принтера, который умеет печатать на холсте. Идея становится важнее исполнения, художником сможет стать буквально каждый без долгого и муторного процесса обучения. Нет, крест на художниках подобные программы не поставят, но сделают их жизнь значительно труднее. Появится другой смысл в словах «настоящее искусство», речь будет идти не о качестве исполнения работ, а о том, что все сделано руками, а не программой. Какое количество скандалов нас ждет, что такой-то и такой-то оказались проходимцами и пользуются услугами программ. Но главное, что оформить любое помещение своей “картиной” не составит труда. Да и в нашей работе все будет намного легче, будет достаточно придумать картинки для текста, и нейросеть тут же их нарисует. Никаких авторских отчислений, необходимости ссылаться на третьи лица. Не уверен, что авторские права на текстовый запрос возможны в нашем мире, но число и качество иллюстраций явно вырастет.

Авторские отчисления — всегда камень преткновения, а подобный софт позволит уйти от этой проблемы. В экономике будущего место человека всегда незавидно, он потребитель, но не создатель чего-либо. Вспомним, что тот же Uber строил свою стратегию вокруг замены водителей роботами. Но это утилитарная, простая функция, творчества в вождении машины немного. С другой стороны, Spotify еще в 2020 году запустил AI-алгоритм, который генерирует музыку, и за нее никому не нужно ничего платить. Поэтому направление развития понятно, и разные компании идут в этом направлении. Каждый со своей стартовой позиции.

Давайте посмотрим, как DALL-E справляется с разными картинами, что рисует по текстовым запросам. Как вам такой запрос — «астронавт на лошади в реалистичной манере». На выбор можно получить несколько изображений, выбрать можно то, что подходит именно вам.

Другой запрос — «плюшевые медведи в Древнем Египте пошли за покупками». И вот варианты.

Но можно изменить стиль рисунков, сделать его японским.

Сказать, что я восторге, значит ничего не сказать. Разнообразие стилей и возможностей, но проблема в том, что пока доступ к DALL-E 2 есть у небольшого числа людей, алгоритм только тестируется. Можно записаться в число тех, кто хочет испытать его, сделать это можно вот тут.

Понятно, что товар показывают лицом и это наилучшие работы, тут нет того, что мы называем браком. Но все равно результат впечатляет, это огромный шаг вперед. Давайте посмотрим еще картинки, сделанные теми, кто уже попробовал алгоритм.

Запрос — «робот, рисующий руку».

Запрос — «ребенок и собака смотрят на звезды».

Запрос — «Голлум пишет автобиографию».

Запрос — «картина Рафаэля младенца и Мадонны в виде робота».

У меня нет сомнений в том, что будущее уже наступило. Алгоритмов, подобных DALL-E, будет появляться все больше и больше, это вопрос ближайшего времени. Да и их качество начнет расти, причем постепенно мы доберемся и до создания видео по текстовым описаниям. Мир будет меняться на наших глазах, и на первый план выйдет доступ к вычислительным ресурсам, у кого они будут, тот и сможет “рисовать” или творить. Художник будущего — это человек с мощным компьютером или, точнее, кусочком сервера в облаке.

Стоит ли художникам беспокоиться и бросать рисовать? Думаю, что стоит думать о том, как стать известным, чтобы подложить соломку под свое будущее. С другой стороны, если это просто времяпрепровождение для себя, а не средство заработка, то почему нет? Мир становится совсем другим, и это уже данность, от которой никуда не убежать. Мы можем только принять эти изменения.

00:02, 5 апреля

Эльдар Муртазин

Вычислительная фотография в смартфонах, а также RAW‑файлы

Как изменилась вычислительная фотография на примере смартфонов Samsung, редактор фото - убираем лишние объекты; приложение Expert Raw, для кого оно нужно. Будущее фотографии в мобильных устройствах.

00:03, 24 января

Эльдар Муртазин

Предвзятость и ошибки искусственного интеллекта. Уродливая копия человека?

Могут ли системы искусственного интеллекта заменить человека в суждениях или они так же предвзяты, как мы, - разбираемся на примерах.

Художник на AI-алгоритмах, DALL‑E 2 как поворотный момент истории

Trouver E30 Aqua: недорогой робот-пылесос с премиальным качеством уборки

Субботний кофе №378

Обновленный кроссовер Omoda C5. А стал ли он лучше?

Обзор умного диктофона Mobvoi TicNote (NE-79). Зачем диктофону ИИ?

Вычислительная фотография в смартфонах, а также RAW‑файлы

Предвзятость и ошибки искусственного интеллекта. Уродливая копия человека?