Reply to comment
Как из 2.5 стопов сделать 5 и какова будет цена
Submitted by lexa on 15 May, 2008 - 11:50В фотографической среде сложилось понимание шкалы экспозиций как симметричной. Это идет еще от Адамса: есть 5-я зона посередине, от нее отсчитываются 5 зон "вверх" и столько же вниз, причем "верх" и "низ" симметричны: есть по две зоны в каждую сторону с деталями, потом еще по одной со следами текстур, потом еще по одной с градациями и еще по одной совсем слепой. Каждому переходу между зонами соответствует изменение яркости в два раза (или на "один стоп").
Фотографическая и колориметрическая линейность
Фотографическая "зонная" шкала не является зрительно (перцептуально) равномерной.
Если взять в качестве примера шкалу Kodak Q13 (рисунок слева, верхняя шкала), где
шаг между соседними клетками составляет 1/3 стопа, то мы прекрасно видим, что
в светах такой шаг кажется визуально большим, а в тенях - визуально маленьким.
Шкала Q-13 охватывает зоны с первой по 7-ю, самые яркие света ей не передаются
(и ниже мы увидим, что они и не могут быть переданы равномерной шкалой).
На том же рисунке для сравнения приведена шкала с одинаковым шагом по колориметрической шкале L (ось яркости в цветовой системе Lab). Визуально эта шкала куда более равномерна по величине шага, а "стандартный серый" (патч M в обеих шкалах) в ней находится посередине.
Средний тон и динамический диапазон
Наилучшее место для средних тонов (5-й зоны по Адамсу) на отпечатке - это именно средний тон (L=50 в терминах Lab). В этой области яркостей лучше всего читаются детали, что достаточно легко увидев, покрутив любую фотографию в фотошопе.
Визуальная яркость (L) и экспозиция
В пространстве Lab максимальное значение L=100 присваивается наибольшей яркости изображения (точке адаптации), а L=50 всегда соответствует яркости в 5.5 раз меньше. Таким образом, от полутонов (5-й зоны) до максимальных светов (10-й зоны) у нас 5 стопов "по Адамсу" и всего 2.45 стопов (2**2.45=5.5) на выводном устройстве, независимо от его типа. За Адамса проблему сжатия светов решала фотобумага: верхние 3 зоны сжимались в диапазон плотностей около 0.3D за счет плеча характеристической кривой. Для цифрового фотографа все несколько сложнее, автоматического сжатия светов не происходит.
На графике слева показана связь между величиной L (на выводном устройстве) и шагами по экспозиции. Предполагается, что исходные яркости сцены мы передаем линейно и средний тон сцены (18% gray) воспроизводится как средний тон отпечатка (L=50). Из графика мы видим, что:
- Пространство в светах у нас очень невелико: 2.5 стопа и все. Это не ограничение выводного устройства (бумаги, монитора), а свойство человеческого зрения: как только мы адаптировались по белой точке, так сразу мы лучше всего видим детали
в области в 5.5 раза менее яркой.
В практике цифровой фотографии эти свойства зрения лучше всего выражаются в цветовом пространстве Lab, которое специально сконструировано с учетом особенностей зрения так, чтобы быть зрительно равномерным. Даже если пространство Lab не используется явно при редактировании, оно используется как внутреннее рабочее пространство Photoshop и ряда других программ. - Пространство в тенях - понятие растяжимое. В наилучшем случае (хороший монитор, который не ограничивает нас в тенях), мы можем надеяться сохранить видимость чего-то, помимо абстрактных темных пятен до уровня L=10, что соответствует 4-м стопам по экспозиции вниз от среднесерого. При печати на бумаге ограничение наступает примерно на уровне L=20 или 2.5 стопа вниз от середины (которая в этом случае будет уже без кавычек).
Приведенный выше график повторяет колонку 'Centered Exposure' из статьи Ильи Борга, только вот на автора данного текста цифры в таблице не подействовали, а график - подействовал.
Заметим, что мы еще ни разу не произнесли слова "динамический диапазон" и "фотографическая широта". Все написанное выше относится к исключительно к воспроизведению результата: эффективный контраст у нас в лучшем случае 1:100 на мониторе (диапазон яркостей монитора может быть и выше, но тогда теневая область не будет разумно использована), а может быть и вовсе 1:32 на бумаге. Более светлая часть результата просто не воспроизводится, более темная - даже если и воспроизводится, то не считывается зрителем при просмотре.
Феномен оптимального контраста изображения давно известен художникам и кинооператорам. К сожалению,в фотографических текстах в интернете этим понятием оперируют редко, гораздо чаще обсуждают динамический диапазон. В онлайне доступна книга Валентина Железнякова Цвет и контраст к которой я и направляю интересующихся. Железняков же предложил термин "Оптимальный Визуальный Контраст". В двух словах, данный феномен сводится к написанному выше: оптимальный контраст изображения лежит в диапазоне 1:40-1:60, а при большем контрасте происходит потеря деталей и градаций в светах или в тенях или в обоих концах диапазона. Речь идет, естественно, об изображении, которое должно восприниматься как единое целое.
Таким образом, мы пришли к таким тезисам:
- Средний тон исходной сцены должен быть воспроизведен тоже как средний тон.
- Используемый диапазон контраста выходного изображения в лучшем случае 1:100, а часто и меньше.
- Используемый диапазон отпечатка (монитора) определяется не возможностями аппаратуры вывода, а человеческим зрением, расширить его невозможно
Перейдем теперь к цифровым камерам. Светочувствительный элемент в них линеен, поэтому
18%-й серый даст 18-%й сигнал. Другими словами, на света и половину полутонов в этом случае придется 82% всех имеющихся уровней в камере, а на тени и вторую половину полутонов - только 18%. На зеркальных цифровых камерах с 12-битным АЦП
(а таких до недавнего времени было большинство) теням достанется около 700 уровней, что более чем достаточно для целей дальнейшего редактирования.
Конечно, оптимальным распределением количества уровней было бы 2500:1500 или 2250:1750, ибо на света у нас приходится 50 единиц по L, а на тени 30-40, но технологии выбора не оставляют.
Однако формальный динамический диапазон современных DSLR обычно больше, чем 5-7 стопов, а типичная пейзажная или уличная сцена часто имеют в светах гораздо больше, чем 2.5 стопа от середины (т.е. света выше 8-й зоны), отчего у фотографа возникает желание вместить сцену в диапазон сенсора. Для вышеупомянутых уличных и пейзажных сцен это означает 2-3 стопа недодержки средних тонов относительно оптимальной экспозиции.
В результате, на тени и полутона остается 90-180 уровней, а с учетом недоэкспонирования красного канала при дневном свете еще на 1-1.5 ступеней (относительно зеленого), в красном может остаться только 40-50 уровней, что уже совершенно недостаточно для возвращения полутонов в нужную тональность без шумов, постеризации и прочих артефактов.
Для сенсоров с меньшим динамическим диапазоном этот эффект еще более разрушителен. Для слайда попытка вместить 7-8 стопов типичной сцены (измеренные спотметром) в диапазон пленки зачастую приводит к недодержке полутонов на стоп-полтора, что для данного носителя фатально. В результате получается парадоксальная ситуация, когда промер диапазона сцены и "правильное" размещение его в широте материала ведет к худшему результату, чем простой центровзвешенный замер по всему полю кадра.
Вместе с тем, цифровые камеры последних поколений с 14-битным АЦП переносят недодержку в 2-3 стопа достаточно спокойно, по меньшей мере, на минимальных чувствительностях. В частности, попытка автора проиллюстрировать описываемую проблему в пасмурный день в Москве при помощи такой камеры (широта сцены в пределах 8 стопов), дала лишь небольшие, хотя и ясно видимые, отличия в передаче оттенков листвы. Камера предыдущего поколения вела себя в таких условиях много хуже.
Все вышесказанное не относится к камере Fuji S5: второй набор сенсоров в этой камере дает, при условии правильной обработки, запас по светам на 3-4 стопа, что для большинства практических применений достаточно.
Практические выводы
При съемке на цифровую камеру имеет место жестокий компромисс: сдвиг экспозиции для проработки светов приводит к существенному ухудшению воспроизведения полутонов и теней. Этим цифровая фотография резко отличается от пленочной, где экспозицию в пределах линейного участка характеристической кривой пленки можно двигать практически безопасно.
Возможная степень такого компромисса зависит от уровня шумов и степени разбаланса чувствительности по каналам и должна определяться владельцем камеры исходя из приемлемого уровня артефактов в тенях и полутонах. Этот уровень будет разным для разных моделей камер и разных установок чувствительности, а степень приемлемости зависит, в числе прочего, от финального размера отпечатка.
Можно относиться к DSLR как к улучшенному слайду и экспонировать как слайд: в светах есть 2.5 стопа и все. Полутона сразу будут на своем месте, вытягивать тени практически не потребуется. Конечно, на слайде нет такого блюминга, но источники света, дающие блюминг на современных камерах, все равно никакой разумной экспокоррекцией не спасти.Конечно, во многих случаях придется принимать меры по снижению контраста: подсвечивать передний план, ждать смены освещения (например, ухода солнца за облако), применять фильтры. Но для снимающих на слайд этот путь привычен, используется десятки лет и дает отличные результаты.
Еще один потенциально правильный способ съемки навеян той же Fuji S5: один кадр снимается "по объекту", второй - с недодержкой в 2-3 стопа, финальный результат получается заимствованием групп пикселов из недодержаного кадра в те участки нормально экспонированного, где находится пересвет. Автору неизвестно сколько-нибудь распространенное программное решение, позволяющее это делать для произвольной камеры, но это - один из возможных участков приложения программистских усилий. По сути, это аналог "впечатывания неба" - техники, которая давно используется пленочными фотографами. Важно отметить, что речь не идет о смешении нормально экспонированных пикселов с недодержаными (или передержаными), а именно о замене целых участков изображения.
Для смешения кадров c разной экспозицией часто используется техника HDR c последующим tonemapping. У данного метода есть ряд недостатков, часть из которых является неотъемлемым свойством метода, а часть - просто часто встречается:
- При конструировании HDR-значения пиксела из 12-14 битных RAW-данных используются значения не только с оптимально-экспонированных вариантов пиксела, но и недодержаные/передержаные. В результате, вклад шумов (от недодержаных пикселов) и нелинейности сенсора в области высоких значений (от пикселов, близких к переэкспонированию) оказывается достаточно велик, что приводит заметному зашумлению изображения.
- Простой tonemapping, не увеличивающий локальный контраст, часто дает плоские и невыразительные снимки, поэтому снимающие в HDR прибегают к различным техникам, увеличивающим этот локальный контраст. При этом будет увеличена и шумовая составляющая, что приведет к появлению грязных оттенков, которые мы регулярно видими на HDR-снимках.
- Достаточно часто техники увеличения локального контраста используются и в светах/тенях изображения, где деталям не место, ибо на реальной сцене глаз их не видит. Получаемые изображения очень искусственны и их легко выделяет из общей массы даже неподготовленный зритель, не подозревающий об HDR-техниках. В результате HDR-фотография стала отдельным жанром, для которого основную ценность имеет сам технический прием, как это в свое время случилось с кросс-процессом.
"...Однако одно из распространенных заблуждений заключается в предположении, что буквально все объекты, перечисленные в таблице (вплоть до самых контрастных), могут без труда восприниматься нашим зрением, а вот пленке и видеокамере это недоступно. Это верно лишь отчасти, потому что самые контрастные объекты воспринимаются нами лишь после целого ряда единичных актов зрения при разном уровне адаптации каждого единичного сетчаточного образа, где постоянно меняется чувствительность глаза и величина зрачка и где уровень белого (а, значит, и связанный с ним уровень черного) постоянно и автоматически меняется...."