Приветствую! У нас уже вышло немало материалов на тему того, что творится с современной массовой фотографией. Можно ли доверить смартфону «нарисовать» Луну, лицо модели и вообще все что угодно, а потом считать полученный результат фотографией. И хотелось бы в качестве промежуточного итога сделать одно предсказание: вычислительная фотография в массовом сегменте победит традиционную. И это неизбежно, потому что нет ни одного аспекта, в котором ее противоположность могла бы рассчитывать на успех, если мы не говорим про узкоспециализированные области применения. Нейронный процессор и его алгоритмы в мобильном устройстве сразу по трем причинам всегда будут успешнее в глазах потребителя — потому что за них будут выступать биология, физика и психология. И так будет всегда, пока не появится какой-то принципиально иной способ запечатлеть происходящее. Но только это будет уже не фотография и вообще не изображение на плоскости. Пока же нет ни одной причины, по которой стандартная попытка дать максимум точности выиграет у «дорисованных» снимков.
Биологический аспект
Для начала давайте вспомним, как вообще работает человеческое зрение. Это биологическая стереоскопическая оптическая система, позволяющая воспринимать электромагнитное излучение определенного спектра, создавая ощущение положения предметов в пространстве. Фактически наше зрение — это иллюзия, существующая у нас в голове, но основанная на интерпретации данных, получаемых из внешней среды. К иллюзорности восприятия мы вернемся в разделе психологии, а пока немного углубимся в физико-химический аспект. Фотоны попадают в клетки-фоторецепторы, вызывая химическую реакцию пигмента, которая затем снова преобразуется в электронный импульс, передаваемый нейронной связью в головной мозг. В принципе, наш глаз и фотоаппарат устроены сходным образом, так что в случае, когда мы смотрим на фотографию, получается некоторая рекурсия — мы видим изображение изображения.
Но есть и важное отличие. Фотография — это изображение на плоскости, тогда как сам смысл существования зрения для человека — воспринимать информацию объемно, получать пространственную картину мира. Т.е. никакая фотография, сколь бы тщательно мы ни продумывали фотоаппарат, который будет ее делать, и экран, который будет ее воспроизводить, не будет давать тех же ощущений пространства, которые мы получаем глазами. Собственно, иллюзорность объема на снимке мы всегда можем ощущать до тех пор, пока не начнем использовать дополнительные приспособления, которые смогут обмануть наше зрение, заставив видеть снимок не плоским, а во всем объеме. Вот только эти ухищрения кроются уже не столько в качестве кадра, сколько в способе его показа зрителю.
Дело в том, что не все клетки глаза одинаковы. Это не матрица и не фотопленка с однородной структурой, где каждый пиксель и каждая частица светочувствительного слоя полностью подобна любым соседним. Если вы не забыли школьный курс биологии, то помните про палочки, колбочки и ганглионарные клетки. За цветность и восприятие быстрого движения отвечают колбочки, которые в 100 раз менее чувствительны к свету, чем палочки. Палочки же — это фоторецепторы, которые могут уловить даже два-три фотона света, но чувствительны только к изумрудно-зеленой части спектра, так что именно они отвечают за периферийное зрение и возможность видеть в условиях недостаточной освещенности. При этом распределение фоторецепторов по сетчатке глаза неравномерное, а также неравномерны само количество чувствительных клеток и их пропорции в сетчатке.
Учитывая, что принципы фокусировки объектива фотоаппарата и человеческого глаза одинаковы, а механика различается лишь способом «изготовления» компонентов, основное различие выходит в «матрице». Сетчатка глаза не имеет ничего общего с понятием равномерности и одинаковости, тогда как матрица фотоаппарата являет собой упорядоченную и равномерную структуру. Создавать какую-то иную нет ни малейшего смысла. Во-первых, всей полнотой информации о функционировании всех клеток глаза мы пока не обладаем. Во-вторых, даже случись нам получить такие подробности, все равно все свелось бы к вопросу, какое зрение нужно принять за эталон (индивидуальные особенности дают десятки процентов разницы).
Получается, что с точки зрения биологии любая фотография — это оптический обман и иллюзия. Создать механизм воспроизведения пространственного зрения человека на данный момент не представляется возможным, но в случае, если он будет создан, это будет уже не то, что мы привыкли называть фотографией. Создание же абсолютно достоверного с точки зрения человеческого зрения плоского изображения невозможно или требует иных средств демонстрации.
Физический аспект
Что касается физической составляющей проблемы «традиционного» фото, ее нужно разделить на два аспекта. Первый — это общая проблема цифровой фотографии, основанной на самой природе света и принципах построения светочувствительной цифровой матрицы. Второй — физические ограничения на размер устройства.
Как бы нам ни хотелось, невозможно создать идеальную камеру, в которой на один пиксель будет попадать один фотон, а квантовый эффект будет равен 100%. Нам нужны пиксели, которые будут улавливать максимальное количество фотонов, чтобы уменьшить количество шумов, которое зависит от уровня освещенности. Соответственно, нам всегда нужна матрица с неким показателем сигнал/шум, но это соотношение никогда не будет идеально точно соответствовать реальному количеству фотонов.
Избавиться от погрешности, вызываемый как фотонами, не выбившими электрон в фотодиоде, так и случайно возбужденными за счет нагрева матрицы электронами, также на практике не получится. Для компенсации этих параметров всегда будут использоваться алгоритмы, но никогда не точный подсчет. Если такой агрегат и представится возможным создать теоретически, то на практике это будет лабораторная установка, едва ли хоть примерно отвечающая понятиям мобильности. То есть сама по себе цифровая фотография всегда будет требовать некоторой обработки с некоторой погрешностью, а вовсе не идеально воспроизводить данные от собранных фотонов света.
Если же говорить о практически достижимых средствах улучшения качества фотографии чисто физическими методами, то у нас остается два направления — улучшение оптической системы и повышение светочувствительности матрицы. И то и другое упирается в одну и ту же преграду — физические размеры и энергопотребление. Допустим, в каком-то не таком уж и далеком будущем вопрос энергопотребления в мобильных устройствах решится. Но вот решить вопросы оптики в объективе и количества фотонов на матрице без роста их размеров не выйдет.
Всегда будет искушение еще немножечко добавить или уменьшить, смотря какой требуется результат. Причем в зависимости от искомого можно подсчитывать, где тот предел, за которым изменение размеров будет уже неадекватно получаемому приросту характеристик или вызовет заметный ущерб. 100-150 лет назад очень модными были групповые снимки, на которых можно было разобрать черты лица каждого из нескольких сотен людей в кадре. Сейчас многие воспринимают эти снимки как некую загадку, ведь ни на пленочную, ни на цифровую камеру из числа современных такой снимок сделать не получится. Просто потому, что таких размеров камер в быту не встречается. Full frame нервно курит в стороне, когда речь заходит о фотопластине с размерами метр на метр. А «жалкий» APS-C начинает весьма внушительно смотреться, как только мы накладываем его на размеры смартфона.
Получается, что с точки зрения физики традиционная цифровая фотография — это бег по кругу, когда количество кругов и линию можно определять произвольно, поскольку добежать до горизонта все равно не получится, а в соревнованиях участвуют как двухметровые гиганты, так и карлики. Причем последних на порядки больше.
Психологический аспект
Итак, получается, что идеальная фотография, передающая, как оно есть на самом деле, без каких-то условностей, получается недостижимой с точки зрения биологии и физики. Оговорюсь еще раз, что речь идет исключительно об изображении на плоскости и с помощью уже известных технологий. Но раз уж у нас нет способа действовать иначе как с помощью подбора некоторого баланса между разными вариантами того, что похоже на правду, то почему бы не апеллировать к историческому опыту, полученному за несколько тысяч лет развития искусства? То есть давать потребителю то, что модно и красиво. А за градации красоты и соответствия моде отвечает в большей степени психология.
Почему я говорю о том, что в данном случае происходит обращение к историческому опыту? Да потому, что это все уже было. Искусство Римской империи успешно проделало путь от скульптурного портрета, изображавшего человека как он есть, без прикрас, к средневековому религиозному искусству, где плотская составляющая была совершенно не интересна, поэтому нужно было создать бестелесный образ. Затем в эпоху Ренессанса потребовалось заново открыть законы перспективы и принципы светотени. Но не успело классическое искусство дойти до реализма, как последовал новый поворот в сторону импрессионизма, постимпрессионизма и далее к стилям, представители которых уже напрямую апеллировали к тому, что мы видим и как воспринимаем, снова отбрасывая материальное, но теперь уже не ради религиозной духовности, а в поисках сути красоты.
Наглядная «линейка развития» портретов в римском искусстве.
И вот тут-то оказалось, что если рассматривать достаточно большие группы людей, то чувство прекрасного вполне может быть обобщенным. Его можно подобрать в нужной пропорции так, чтобы большинство сказало: «Да, это не так как на самом деле, но оно красиво и гармонично». В цифровую эпоху именно такой подход обеспечил взлет Instagram*. В тот момент, когда мобильная фотография по чисто технической составляющей пребывала в аутсайдерах, поскольку к половине кадров требовалось обязательное пояснение, что вообще хотелось запечатлеть, сервис предложил набор фильтров, позволяющих «сделать красиво». И этот процесс был максимально автоматизирован, пользователю оставалось лишь немного подвигать ползунки настройки, а то и вовсе просто выбрать готовый пресет.
Принципиальным моментом было то, что набор удовлетворял подавляющее большинство и работа с ним была максимально простой. Даже существовавшее жесткое ограничение по обязательной квадратности кадра было не случайной составляющей успеха. Возможно, вы ничего не слышали о принципах композиции, но невозможность просто взять готовый кадр и использовать его целиком заставляла вас интуитивно отбрасывать лишнее, смещая акцент на главное. И это все равно была ваша работа, а не волшебная кнопка, превращающая заурядный кадр во что-то приятное глазу. Пока не появились улучшалки кадра на основе искусственного интеллекта. Потому что зачем вообще какие-то индивидуальные настройки, если все люди следуют примерно одним и тем же алгоритмам, желая получить «красивое».
Если подавляющее большинство изо дня в день фотографирует один и тот же набор сюжетов и имеет одни и те же представления о том, какой кадр будет самым красивым, то при чем тут точность передачи? Нужно искать набор настроек фотомодуля смартфона, дающий пользователю кадр, который тот потом понесет в соцсети. А раз уж у нас есть инструмент, который позволяет анализировать, что за кадры размещаются в соцсетях и какую реакцию они вызывают, то задача становится еще проще. Даже, казалось бы, такая индивидуальная особенность, как лица — это условность. И нет разницы, дивы ли это из бьюти-блогов XXI века или картины малых голландцев, массовое искусство не поражает разнообразием. Оно его вообще не требует.
Нейросети, вычислительная фотография — это все отражение человеческой природы и психологии масс. Мы берем некий реально существующий элемент и путем нехитрых операций доводим до состояния общественно приемлемого, отбрасывая негативные моменты и усиливая позитивные. Поскольку вычислительная мощь процессоров мобильных устройств достаточна для того, чтобы делать это на лету, вот вам и готовый рецепт вычислительной фотографии. И чем дальше будет расти эта вычислительная мощь, а нейросети — совершенствоваться в обработке ранее накопленного человечеством опыта, тем точнее фотоаппарат будет угадывать то, что пользователь хотел бы видеть.
Вместо заключения
Вычислительная фотография неизбежно займет доминирующее положение в абсолютных цифрах. Это так же верно, как то, что бюджетные смартфоны сумели победить кнопочные телефоны, хотя по меркам топовых устройств это редкостные бастарды, не способные реализовать ни одну функцию в полной мере. А по меркам классических телефонов они не имеют ни автономности, ни надежности. Но кнопочным телефонам остались 3% рынка. Потому что большее узкоспециализированным гаджетам недоступно.
Обработанные нейропроцессором фотографии для соцсетей никогда не смогут выйти на тот же уровень, который будет у кадра, сделанного высококлассным профессионалом на Hasselblad. Но не потому, что его камера обладает какими-то чудо-свойствами по максимально точной передаче реальности, а потому, что время и силы, которые этот профессионал потратил на то, чтобы вначале научиться снимать, а потом еще и обрабатывать кадр, 99,99% фотографирующих никогда на эти навыки не потратят и, соответственно, его умений не получат. И фотохудожник не будет нуждаться в помощи вычислительной фотографии в доработке на лету, потому что он будет обрабатывать кадр потом.
Не потребуется вычислительная фотография и в случаях, когда речь идет о фиксации состояния предметов. Эксперту-криминалисту или инженеру не нужно, чтобы было красиво, и композиция им не нужна. Им нужна точность. Однако если посмотреть, например, на то, что собой представляют настройки камер телескопов, то окажется, что это тоже вычислительная фотография. Просто сюжеты и условия съемки не меняются, а значит, набор настроек фиксированный.
Так что да, вычислительная фотография победит, но не уничтожит традиционную.
*Компания Meta Platforms, в которую входят социальные сети Facebook и Instagram, признана экстремистской организацией и запрещена в РФ.
Kharkov-city, А не проще ли будет попросить нейросеть нарисовать тебе фотографию того что хочешь? 🙂
Прекрасная статья. Но нейросети победят. Рассказать как это будет? Ок, слушайте.
В мобильниках будет камера в 1Мп (да, да, в один!) которая будет улавливать общие черты происходящего, а нейросетка генерить по снимку изображение. А если вы будете снимать людей, то сеть из базы портретов будет подставлять максимально похожие лица. Ну а котики вообще все одинаковые.
Вижу, так будет!
Прекрасная статья. Но нейросети победят. Рассказать как это будет? Ок, слушайте.
В мобильниках будет камера в 1Мп (да, да, в один!) которая будет улавливать общие черты происходящего, а нейросетка генерить по снимку изображение. А если вы будете снимать людей, то сеть из базы портретов будет подставлять максимально похожие лица. Ну а котики вообще все одинаковые.
Вижу, так будет!
К соседней рекламе про смесители: аэраторы будут забиваться водным камнем быстрее, чем будет окупаться покупка такого крана, проверено
Ded_DM, Да и в принципе вещь, которая не участвует в получении дохода, не может окупиться. Если хотят сэкономить воду, пусть не открывают смеситель на полную и отключают подачу воды, когда её не используют, например, пока намыливаются в душе.
Товарищ А., У меня БМВ сегодня забрали бесплатную погоду, пробки на навигации и еще пару мелочей и вот как раз всю дорогу думал про это. Мне еще повезло что у меня 99% машины не по подписке, но ведь веселуха эта уже началась, я думаю через несколько большая часть доп опций будет подписочной, то что это в итоге дойдет до телефонов даже не сомневаюсь, самое обидное что люди в большинстве воспринимают это нормально, а это подтверждает именно то о чем я говорю — корпорации будут отжирать все больше и больше.
В итоге через несколько лет думаю легко процентов 5% от стоимости новой машины нужно будет выложить за все подписки. А это без учета еще десятка разных абон. плат и подписок которые предлагаются для игр, стриминга, музыки, хранилище ну и так далее. Грустно.
Ded_DM, А нельзя снять и почистить? Раз в месяц если делать это то ок должно быть.
Поручикъ Ржевскій, Удивляюсь что еще не началось такое, в частности в плане котиков и прочих минимально уникальных для нашего глаза вещей… деревья, дома какие то и прочее.
Warak, Пробовал, не полностью вычищается. Вода жесткая, водный камень внутри аэратора поры забивает. Даже специальной недешевой жидкостью раз за разом все труднее вычистить
Ded_DM, Значит нужно покупать смеситель где данный элемент является расходником не сильно дорогим, тупо менять раз в год за допустим 5-10% стоимости всего устройства.
Поручикъ Ржевскій, Ты дурак что ли?
Товарищ А., Посмотрим, мне вот интересно посмотреть где у стада красная линия 🙂
Warak, Так и делаем. Раньше словенские брали Hansen, теперь обычные китайские, но из хорошего металла, а в довесок пару десятков аэраторов
Товарищ А., Ну предел то у всех должен быть какой то, хотя да, корпорации тоже не идиоты и делают плавные шаги, растянутые на годы, тут не просто задумываться нужно, а конкретно думать 🙂
Ded_DM, Так может и у тех есть такое? Я статью не читал, принципиально не читаю рекламу с закрытыми комментариями, ноль уважения к таким рекламодателям.
Кстати нужно свои проверить как то будет… хотя хз найду ли я фильтры даже если они есть в теории, хз Schock возят ли свою продукцию к нам сейчас или нет.
>> нужны пиксели, которые будут улавливать максимальное количество фотонов, чтобы уменьшить количество шумов, которое зависит от уровня освещенности.
НЕ зависит. Поэтому ночной кадр с соотношением сигнал/шум условно 1/5 будет шумным, а дневной 1000/5 — нет.
Против вычислительной фотографии ничего против не имею. При соблюдении двух условий:
1. Можно регулировать ее влияние. Хотя бы 3-позиционно — выкл/норм/макс. А еще лучше, вынести в постобработку. Чтобы если влияние не понравилось, его можно было бы уменьшить или увеличить.
2. Производители надеясь на нее, не забьют на физику. Ведь обработка качественного кадра, однозначно лучше обработки некачественного. К сожалению, гонка мегапикскелей, именно забивает на физику.
И да, почему столько внимания уделяют стереоскопичности зрения? Когда расстояние в 10 раз больше стереобазы, 60-70 сантиметров, это имеет смысл. Когда 100 к 1 — крайне слабо, а при 1000 к 1 уже отсутствует.
Товарищ А., Я похоже что то пропустил, мода образ бомжа? Серьезно? Хотя не то что бы что то новое, корпорации и\или гос-ва всегда общество под свои интересы подстраивали.
Владимир Варламов, Все в мире относительно. Относительно вас — точно нет. 😉
Warak, вот это бесит, ты покупаешь не вещь, а подписку, вещь как бы в аренде, ты можешь продать, утопить, но если производитель захочет — у тебя останется корпус с функционалом кирпича
Товарищ А., у некоторых ещё и шнурки белые🤣
Ну а вообще, ботинки существовали и до субкультурного движения, и к образу не только одни ботинки относятся, теперь вообще не одеваться людям что ли?
Александр K, Тут кстати на днях очередная интересная история произошла в этом плане и большинство людей судя по всему даже не поняли что случилось. Стим, который магазин игр, прекратил поддержку Винды ниже 10, не просто прекратил, а клиент тупо не запустится, официальная позиция что это потому что Хром сделал тоже самое а Стим клиент базируется частично на Хроме…
Проблема — без возможности запустить Стим клиент ты теряешь доступ к купленным играм, причем в том числе и играм у которых Винды 10 даже в требованиях нету так как они старее чем она, игр которые легко запускались и запускаются на 7, 8… может даже Винде ХП блин. Еще более смешно то что ты покупал их не у Стима, Стим это платформа, посредник, покупку ты совершаешь у здателя\разработчика. Т.е. третья сторона, в одностороннем порядке, запретила доступ к тому что ты купил у кого то другого. Да формально по опросу Стима менее 2% пользователей осталось на Винде ниже 10, но сути то это не меняет, тебе в любой момент могу сказать что все, удачи, спасибо за деньги. Вот и все, доигрались.
Понятно что на ровном месте вероятность того что Стим просто пропадет не высокая, но суть в том что вероятность такая существует и ничего ты не сделаешь с этим, вот разорится он и закроется и все, твоей коллекции больше нет так как на деле ты не купил, а взял в долгую аренду по фиксированной цене.
Тут кстати еще читал что оказывается Интел уже давно мощность процессоров продает по подписке для серверного железа, которое изначально конский ценник имеет. А за несколько месяцев до этого конфликт Фотошопа с Пантоном из за которого пусть временно, но люди во первых не смогли работать, а во вторых лишились многих своих прошлых работ которые превратились в черные квадраты 🙂 Ну и так далее.
Эти все истории забавно звучат по одной, а вот если взять промежуток времени, допустим последние 5-10 лет, и смотреть на тенденцию в целом. Но это сложно, намного проще смеяться над "конспирологами" типа меня, а потом через несколько лет удивляться тому что подогрев у тебя по подписке, тому что батарею возишь с собой всю, а пользоваться можешь только 80%, тому что приложение которое ты используешь несколько лет стоит не 60-100 баксов как обычно, а уже перевалило за пару сотен и еще годы впереди. Вот это меня больше всего убивает.
Товарищ А., Нужно в ЦУМ заглянуть будет, там же у нас все самые модные обитают 🙂 Я кстати сам носил и ношу достаточно невзрачную одежду, делал это еще до того как это стало модным, тупо что удобно то и одел утром если не какое то особое мероприятие где нужен допустим костюм 🙂
Товарищ А., >Именно, пальто на размер-два больше с толстовкой, широкие джинсы, сумка -мешок. Посмотрите вокруг. Это образ бомжа из голивудского фильма. Ну и инфа из общения с Ж )))
Это самая убогая, но прибыльная идея заработать на не очень симпатичных бабах.
Warak, Поддерживаю. Но всё чуточку сложнее. Третья сторона всегда могла "заблокировать" использование вещи. Купил ты УКВ-приемник. Он работал, работает и будет работать. Но вещание перебралось в FM. Аналогично с аналоговым телевещанием. Могут перестать выпускать расходники. Может еще какая беда случиться.
Институт аренды добавил риски, а не создал их. В целом же, чем сложнее система, тем выше риск ее поломки.
Пончик, не очень симпатичная, но выглядящая как бомж становится симпатичнее?Оо… блин мне почаще нужно на улицу похоже выходить и смотреть по сторонам 🙂 Столько всего интересного пропускаю.
Lecron, Ну да, соглашусь, но во многих случаях такая ситуация хотя бы подразумевалась, это как допустим гос-во может запретить эксплуатацию старых машин или запретить тебе ввезти что то что ты купил, ты изначально понимаешь что такое возможно, покупая софт, причем софт который работает на той или иной ОС возможность потерять к нему доступ несколько более туманен мне кажется… хотя опять же тут все вытекает из того что ты софт не покупаешь.
Товарищ А., "Очень многие люди чувствуют таким образом свободу от общественного мнения" из статьи про бомж стайл… ну да б%ть, свобода от общественного мнения после того как оделся в то что тебе навязали другие 🙂
Но кстати я вижу массу плюсов в такой одежде 🙂
Warak, И сейчас подразумевается. Как всегда, профит прям сейчас, осязаем, а проблемы где-то там, гипотетические. Если на них закрывают глаза, игнорируют, то это проблема наблюдателя, а не явления.
Warak, >не очень симпатичная, но выглядящая как бомж становится симпатичнее?
нет, в такой одежде недостатки фигуры становятся менее заметными, соответственно, эти вещи лучше продаются
Поручикъ Ржевскій, Не, не настолько экстремально. Стоимость разумной камеры не настолько велика, чтобы скатываться в абсурд. Вангую 4-8 Мп.
И да, первая цифровая камера, с которой я познакомился, была 2 Мп. Делала вполне хорошие кадры. Не хуже нынешних мобильников. Вот что значит крупный пиксель. С удовольствием бы разменял нынешнее разрешение на рост качества.
Пончик, Ааа, в этом плане, ну да, наверно.
Товарищ А., Мода проходяща — были и готы с эмо, и стиль под наркош (вспомнить журнал "Птюч"). И эти мешки вымрут, сменятся чем-то другим.
Сегодня отнёс в ремонт свой Любитель2. Фотография всегда была фактом, а теперь стала иллюзией. Конечно, маркетинг и потребительство победит и все будут выпендриваться друг перед другом Луной, Марсом и прочими "шыдеврами". Жаль и грустно от этого. Может когда-нибудь народ прозреет.