Привет.
Время чудес, которые нас окружают, сделало нас черствыми и не заставляет сердце биться чаще, когда мы сталкиваемся с ними в реальной жизни. Человечество постоянно открывает новые двери в будущее, но за редким исключением мы неспособны осознать, что нам несет это будущее. Алгоритм DALL-E от Open AI — счастливое исключение, его применение понятно и наглядно, а область использования настолько широка, что даешься диву, как такого не существовало раньше. И это фантастика во всех смыслах.
Название DALL-E недвусмысленно напоминает про Дали, написание говорит, что создатели вдохновлялись мультфильмом WALL-E от Pixar. Этакое соединение двух миров, человеческого и искусственной земли алгоритмов. Что делает DALL-E, достигший за год второй версии? Рисует картины, причем умеет делать это на основании того, что вы скажете алгоритму. Например, у вас может быть странное чувство юмора и вы захотите изменить картину Яна Вермеера “Девушка с жемчужной сережкой”. Посмотрите одноименный фильм, который хорошо описывает процесс создания картины, то, как жили люди в 1665 году. Забыть, как выглядит эта картина, невозможно, но на всякий случай напомню.
Теперь вернемся к дурному чувству юмора и попросим DALL-E нарисовать выдру с жемчужной сережкой. Текстовый запрос не так прост, как может показаться, тут важен контекст. Программа должна понять, что мы не просто хотим получить изображение животного с сережкой, а создаем пародию на известную картину. И нарисовать картинку нужно именно в таком стиле. Смотрим, что получилось на выходе.
Круто? Не то слово. Причем вы можете получить произвольное число картинок, уточнять свой запрос и “рисовать” словами. Уникальное изображение, которое вы получите на выходе, будет вашим детищем, никакие отчисления никому платить будет не нужно. И это сразу же ставит вопрос о том, кем будут художники будущего, ведь отныне создание картины в любом стиле и технике — вопрос наличия программы и большого принтера, который умеет печатать на холсте. Идея становится важнее исполнения, художником сможет стать буквально каждый без долгого и муторного процесса обучения. Нет, крест на художниках подобные программы не поставят, но сделают их жизнь значительно труднее. Появится другой смысл в словах «настоящее искусство», речь будет идти не о качестве исполнения работ, а о том, что все сделано руками, а не программой. Какое количество скандалов нас ждет, что такой-то и такой-то оказались проходимцами и пользуются услугами программ. Но главное, что оформить любое помещение своей “картиной” не составит труда. Да и в нашей работе все будет намного легче, будет достаточно придумать картинки для текста, и нейросеть тут же их нарисует. Никаких авторских отчислений, необходимости ссылаться на третьи лица. Не уверен, что авторские права на текстовый запрос возможны в нашем мире, но число и качество иллюстраций явно вырастет.
Авторские отчисления — всегда камень преткновения, а подобный софт позволит уйти от этой проблемы. В экономике будущего место человека всегда незавидно, он потребитель, но не создатель чего-либо. Вспомним, что тот же Uber строил свою стратегию вокруг замены водителей роботами. Но это утилитарная, простая функция, творчества в вождении машины немного. С другой стороны, Spotify еще в 2020 году запустил AI-алгоритм, который генерирует музыку, и за нее никому не нужно ничего платить. Поэтому направление развития понятно, и разные компании идут в этом направлении. Каждый со своей стартовой позиции.
Давайте посмотрим, как DALL-E справляется с разными картинами, что рисует по текстовым запросам. Как вам такой запрос — «астронавт на лошади в реалистичной манере». На выбор можно получить несколько изображений, выбрать можно то, что подходит именно вам.
Другой запрос — «плюшевые медведи в Древнем Египте пошли за покупками». И вот варианты.
Но можно изменить стиль рисунков, сделать его японским.
Сказать, что я восторге, значит ничего не сказать. Разнообразие стилей и возможностей, но проблема в том, что пока доступ к DALL-E 2 есть у небольшого числа людей, алгоритм только тестируется. Можно записаться в число тех, кто хочет испытать его, сделать это можно вот тут.
Понятно, что товар показывают лицом и это наилучшие работы, тут нет того, что мы называем браком. Но все равно результат впечатляет, это огромный шаг вперед. Давайте посмотрим еще картинки, сделанные теми, кто уже попробовал алгоритм.
Запрос — «робот, рисующий руку».
Запрос — «ребенок и собака смотрят на звезды».
Запрос — «Голлум пишет автобиографию».
Запрос — «картина Рафаэля младенца и Мадонны в виде робота».
У меня нет сомнений в том, что будущее уже наступило. Алгоритмов, подобных DALL-E, будет появляться все больше и больше, это вопрос ближайшего времени. Да и их качество начнет расти, причем постепенно мы доберемся и до создания видео по текстовым описаниям. Мир будет меняться на наших глазах, и на первый план выйдет доступ к вычислительным ресурсам, у кого они будут, тот и сможет “рисовать” или творить. Художник будущего — это человек с мощным компьютером или, точнее, кусочком сервера в облаке.
Стоит ли художникам беспокоиться и бросать рисовать? Думаю, что стоит думать о том, как стать известным, чтобы подложить соломку под свое будущее. С другой стороны, если это просто времяпрепровождение для себя, а не средство заработка, то почему нет? Мир становится совсем другим, и это уже данность, от которой никуда не убежать. Мы можем только принять эти изменения.
что то слишком однообразная сеть.
медведи, космонавты…
Я не буду вас спрашивать ни о "пайпере", ни о "cherry picking", ни о типе используемой сети, потому что Вы Эльдар просто не сможете на это ответить, потому что этого просто не знаете.
Вы просто взяли типичные "лучшие отобранные демки", и просто скопировали себе в статью, сделав обрамление из пустопорожнего текста.
Причем даже не догадались, что отбор лучших картинок происходил с помощью второй нейросети.
Однако это не помешало Вам написать статью от первого лица так, как будто Вы сами непосредственно и сформировали эти запросы к генератору нейросети (а незадачливый посетитель по умолчанию так и решит, исходя из прочитанного им текста).
Так что это как раз тот случай, когда пытаешься понять, что хуже — прямая ложь или умалчивание.
Поэтому Ваши "рассуждения об искусстве", которые окружают указанные семплы, больше напоминают копи-пасту с пикабу.
Возможно у вас самого нет доступа к генератору, если вы пользуетесь уже готовыми чужими изображениями?
Вот например статья от 10 апреля с еще большим количеством изображений:
dtf ru /life/1153666-eto-tehnologicheskoe-chudo-v-seti-podelilis-izobrazheniyami-sgenerirovannymi-neyrosetyu-dall-e-2-po-opisaniyu
Рисовать — это каждый может, хотелось бы информации по генераторам текста, ну где типа задаешь тему Apple — фсе, а оно само статью интересную пишет.
ฺВладимир, Владимир, я понял посыл Вашего сообщения так, что автор не разбирается в том как производится то, о чем он написал. Вы разбираетесь в этом лучше, Вас интересно услышать. Но в этой статье автор писал И о другом — как появление этих продуктов изменит жизнь. И в основном — об этом. Мне кажется, что эту часть статьи Вы пропустили.
Как мне кажется здесь тоже вполне реально патентное право прикрутить. Не так, как с патентами на изобретения, но что-то типа товарного знака или домена. Зарегистрировал раньше остальных — ищите другой. Тут возможно тоже самое. Картинка на товарный знак разрабатывается дизайнерами и охраняется, исключая копирование или замещение изображениями, в том числе, даже просто сходными до степени смешения (когда отличается, но очень похожа). Так что огрызок с ДВУМЯ укусами вам вряд ли зарегистрируют. Здесь же, как я понял можно сослаться на первенство напечатанной фразы. Типа, получил на фразу «Xiaomi — топ за свои деньги» картинку, выбрал удачную, оплатил и всё, ты владелец, единственный и неповторимый творец. Теперь печатай другую фразу. Эта — занята. Можно возразить, сказав, мол, нейросеть же старалась, однако, когда изобретатель приходит с идеей к подрядчику за условной 3D-фрезеровкой, автором всё равно является носитель идеи. То, что этот подход является переломным — безусловно. Ведь ранее, как говорил, в том числе, Ларри Пэйдж: «Идея — не стоит ничего. Главное — реализация». И до момента появления максимально доступной реализации идеи, его утверждение — верно. Но вот вам алгоритм с рисованием картинок и дизайнеры уже напряглись. Появится схожий для трёхмерного моделирования с экспортом в формат, пригодный для 3D-печати и напрягутся уже инженеры и конструктора, поскольку «очумелые ручки» выйдут на совершенно иной уровень, вооружившись автоматическим нейросетевым расчётам и быстрым изготовлением без комментариев от специалистов о том, что у тебя неправильно указана шероховатость.
"В экономике будущего место человека всегда незавидно, он потребитель, но не создатель чего-либо."
Абсолютно ложное утверждение. Люди создают устройства, программы, придумывают алгоритмы, правильно ставят кадр при фотосъёмке, умело монтируют отснятое видео. Все мы, одновременно, и создатели, и потребители. Не надо умалять значение человека.
mikha1ych, Изменит жизнь — сильно сказано! Просто ещё один вариант создания, генерирования графического объекта. Фантазию человека ИИ не заменит, ибо не сможет спрогнозировать нейронные связи для её работы.
Всю эту цифровую бесовщину выдаёт правый глаз выдры. 😂
LDM, а Голлум в виде Йоды не выдает? 🙂 но ту же вопрос развития и оттачивания алгоритмов
GrishaTav, в редакции уже есть доступ к такой программе, но она пока тоже не для всех, только по инвайтам 🙂
Иван Петров, Точно. Да и там на всех картинках с глазами проблемы… 😲
"Алгоритмов, подобных DALL-E, будет появляться все больше и больше, это вопрос ближайшего времени."
Лучше бы научились омографы аккуратно разрешать. Всё больше толку. А то как начинаешь TTS слушать, так уши вянут. А обсуждаемая игрушка, не более чем игрушка. В лучшем случае, промежуточный результат на пути к реально полезному.
izzzgoy, фантазия человека — это общее понятие. У одних людей она выдающаяся, у других средняя, у третьих ниже средней. Нагляднее на примере спорта/физкультуры. У всех есть мышцы и нервы. Но у 5% людей они выдающиеся, а 1% среди этих еще и "рабочие лошадки". Вот их мышцы и нервы — ничего не заменит. А у диванных сидельцев мышцы тоже есть. Но заменить применение мышц этих людей при воздействии на окружающий мир и людей — проще простого, что с успехом и делается. Аналогично в творчестве. Сейчас выложить в сеть "своё творчество" и на этом основании полагать себя творческим человеком — проще простого. Но с чего кто-то думает, что ситуация с творчеством отличается от спорта. Реально интересная фантазия у 5-10% людей. Но её надо еще и воспитывать, образовывать. Это могут 1-2%. Проявления "фантазии" остальных людей для окружающих — проще и успешнее заменить алгоритмами. Для себя — конечно прикольно. Но значимость такого творчества для окружающего мира и людей не стоит переоценивать. Маме конечно понравится )
mikha1ych, Не увидел в статье "о другом — как появление этих продуктов изменит жизнь". Нужны более практичные примеры. Из аналогов, существует куча программ стилизации изображений. Под акварель, под карандашный набросок. Меняют жизнь? Нет! Ставят на побаловаться и вскоре сносят. Далл-И из той же оперы.
Из практики вижу только одно направление — индексация и поиск изображений. Включая кадры из фильмов. По описанию — женщина в красном стоит перед машиной с бананом в руке, — находят нужное. Но почему-то в этом направлении ни одной подвижки.
izzzgoy, программы уже создают программы, люди пока еще придумывают большинство алгоритмов но в шахматы уже выигрывают роботы у людей, гугл сервисы уже монтируют ролики из фоток пользователя. Пока примитивно это делают, но и в шахматы 30 лет назад программа у Каспарова не выигрывала. А сегодня — без шансов. И там НЕ математика работает, думаю Вы знаете
А почему на первой картинке у девушки на голове флаг Украины, нет ли здесь скрытой провокации?
🤔
Lecron, Вы правы. Потому что Заказчик не готов. Не с Вами ли мы обсуждали в прошлой системе комментариев, что программисты и программы могут очень многое, но в жизни от них зависит очень мало ?
mikha1ych, Такого обсуждения не помню. Возможно. Но что вы подразумеваете под "Заказчик не готов"? Как он должен показать готовность? И кто он вообще, этот Заказчик?
Maks_Liubin, И как это будет работать? Если НФТ всего лишь ссылка на некий ресурс, по которому и расположена сама сущность. Стоит утечь ссылке или сущности…
mdc_01, Позвоните Яну Вермееру, он вам все объяснит — почему так вышло
izzzgoy, Когда читал, в шахматах работает как раз "математика", точнее алгоритмика. Вариация поиска кратчайшего пути. Только "искаженные" критерии кратчайшести. А все совершенство связано с усложнением этих критериев и отбросу заведомо невыгодных вариантов. То есть программа вычисляет настройки для программы.
И вообще, все алгоритмы, особенно нейросети, это чистейшая математика. Посмотрите научные работы являющиеся источником программных реализаций. От формул глаза разбегаются.
mdc_01, Вы случайно не муж вот этой мадам https://t.me/breakingmash/34244 ? Ей тоже флаги украины всюду мерещатся…
mikha1ych, У нас в ДНК тоже программа заложена, но это не одно и тоже с той реализацией, что мы сейчас создаём. В начале и конце цепочки создания-потребления стоит человек, без него в этой связи нет никакого смысла.
mikha1ych, Так я вот тоже восторгов Эльдара не разделяю. Миллиарды людей имеют смартфоны с фотокамерами, но стали ли они от этого фотографами? Конечно, доступность фотосъёмки и алгоритмы обработки снимков добавили в наш мир новых возможностей, но умение ставить кадр и видеть красоту глазами это не заменило. Также и с этим ДАЛ-И.
izzzgoy, не стали. Вот только фотосалонов и людей, которых окружающие называют фотографами, стало меньше. Теперь для этого не достаточно иметь фотокамеру (как раньше), а надо уметь ставить кадр и видеть красоту. Лучше и интереснее чем другие. Иначе это человек со смартфоном, а не фотограф.
izzzgoy, проиллюстрирую на примере. Компания, в которой я работаю, ежегодно проводит мероприятия для лучших сотрудников. С выездом в отель на на 3-4 дня — на 200 человек, в залах — на 600 человек, примерно. Лет 15 назад на таких мероприятиях работали фотографы, видеооператоры — для сотрудников, для корпоративных изданий. Уже несколько лет от этого отказались. Фотографии самих сотрудников на смартфоны, плюс несколько более увлеченных и продвинутых сотрудников сами снимают и монтируют клипы, фильмы.
, Я за мобайл-ревьювов волнуюсь, вдруг роскомнадзорнут еще…
mikha1ych, Да ладно, фотографов стало больше, по-крайней мере, людей себя их считающими. Студии берутся в аренду, чтобы потом в них сделать шаблонные фотографии, отредактированные затем в лайтруме дефолтными пресетами.
ฺВладимир, Всё зависит от того, для чего делается фото/картина. Если просто для памяти/развлечения, то и спрос с такого продукта невелик. Ну, уж восторга и фантастики здесь точно не наблюдается.
izzzgoy, я говорю о том, что когда совершенство механизмов в цепочке возрастает, реальную ценность создают только талантливые и тренированые (развитые) личности в начале и самом конце цепочки, о которой Вы написали. Продукт уровня "среднего человека" эта "цепочка" создаст и без его участия. А огромное кол-во людей сейчас как раз мигрируют к тому, что мнят себя творцами, на деле просто играя элементами цепочки. Пример — бухгалетрия, хоть и не про творчество. Но произошло именно это.
izzzgoy, >>"В экономике будущего место человека всегда незавидно, он потребитель, но не создатель чего-либо."
>Абсолютно ложное утверждение.
Возможно Эльдар имел ввиду именно себя, а не нас с вами?
Ведь истинный графоман, который зациклен на себе и своих произведениях, мало обращает внимание на окружающую его действительность…
Кстати, никто не подскажет, неужели DALL-E уже научился понимать ввод на русском языке?
Автор как то скромно умолчал об этом, но глядя на построение фраз (на английском языке), я подозреваю, что автор просто скопировал из чужой статьи не только картинки но и их переведенные названия.
mikha1ych, Художественная ценность подобных поделий явно преувеличена.
Скажу даже больше, на выходе сети у нас есть матрица серийных картинок, которые, можно продавать как готовые NFT.
Намёк, надеюсь, слишком прозрачен?
В том смысле, что только слабо образованные индивиды могут повестись на подобное.
Только если поиграться день-два, а потом это станет просто неинтересно.
Вам уже расписали, насколько уже существующие подобные проекты изменили жизнь обычных людей (ни на сколько!).
mdc_01, Эка вам нечисть всюду мерещится!
"речь будет идти не о качестве исполнения работ, а о том, что все сделано руками, а не программой" — и… Ничего не поменялось) Наличие такого явления, как "Чёрный квадрат Малевича" говорит само за себя.
Среди работ великих художников очень часто можно найти откровенную халтуру, но это не мешает таким картинам продаваться за баснословные деньги.
К тому же не забываем, что компьютер есть компьютер. Сколько бы хорошо обучена не была нейросеть — это всё равно строгий алгоритм, случайности в работе которого исключены. Компьютеры умеют вычислять, анализировать, но они не умеют главного — думать. А именно способность думать ключевая в искусстве.
Почему-то Эльдар скромно умолчал о российском аналоге от сбера ruDALL-E. Чат-бот в телеге @sber_rudalle_xl_bot.
izzzgoy, Тоже наткнулся на него, сделал через "Салют" заказ на "наглую рыжую морду"))
KhabMan, Можно подробней в чем заключается халтура "черного квадрата" Малевича? Интересно!
Алёхин Вячеслав, Она заключается в черном квадрате. Это своего рода хулиганство, на которое способны и вы, и даже я. Но в отличии от нас с вами Малевич умел кое что еще в живописи, именно поэтому его черный квадрат оценен несоизмеримо выше чем ваш или мой.
мимопроходил, Спасибо за ответ, примерно так я и думал.
>В экономике будущего место человека всегда незавидно, он потребитель, но не создатель чего-либо.
Вообще то человечество на протяжении всей истории к этому и стремилось.
Горшочек вари.
Скатерть самобранка.
Золотая антилопа.
Волшебная палочка в конце концов.
Позабыты хлопоты
Остановлен бег
Вкалывают роботы
А не человек
Это пока не ИИ, но очень крутой инструмент для создания контента 👍
, Я звонил — трубку не поднимает!
мимопроходил, вот только результат доступен почкму-то узкому кругу робовладельцев, а не вскму населению