【科普】关于影像世界的GAMMA特性(一)
我在本文把GAMMA特性定义为影像系统或部件输入输出量的函数关系。本文用了些中学水平的数学表达式,而且很多是自己瞎猜,没有经过实验验证,跳过不影响阅读。另外尽量不讨论艺术审美,尽量不讨论人与人之间的主观感受差异,只想和网友们一起把有些东西弄明白,这个话题水点深,一不留神就有有BUG,请大家及时拍砖,避免误导。
1)人类视觉直接观看真实场景: GAMMA特性是非线性的曲线(算术坐标系统,下同)

看到

画面中某一点引起的大脑视觉感受和入射光在视网膜形成的影像里的明暗关系是这样的

例如近处西兰花和杯里的食物处于全黑和亮之间,视觉对这部分的层次很敏感,只要光线有细微的差别,视觉就能把明暗层次区分得很清楚,输入和输出之间是很陡峭增长的关系。装西兰花盘子的边缘、杯子后桌布的漫反射亮处和窗外的太阳光照耀下对面房子的墙壁,如果真正在视网膜成像面用入射光测量装置测量,会发现光线强度是数量级的差别(也就是十倍百倍千倍……的差别)但我们的大脑并不这么认为,仅仅觉得窗外的高光处只比桌布亮处亮一点点,它们位于上图GAMMA曲线的亮到很亮的部分,输入和输出之间是缓慢增长的关系,可以看到视觉对入射光强度的增加不再敏感了。而且人类的视觉还有非常灵活复杂的适应性,这里就不多说了。总之,人的这种视觉特性是物理定律、未知的大脑机制和物种演化过程等共同形成的,有利于我们的基因成功的生存下来。后面我们还将看到,人工影像系统可以巧妙利用这些特性,降低成本。

2)理想的人工影像系统的GAMMA应该是一条直线
不管经过了中间什么环节的折腾,从真实世界输入,到最后给人眼观看还原的影像,理论上应该尽量原汁原味,然而现实世界中几乎所有的影像系统的转换特性都是非线性的,线性只是某个区间的近似,要实现线性的成本很高,有时也没有必要,后面逐渐细谈。


3)现实中人工影像系统技术的局限性,在物理量强度领域能实现线性还原的范围很小。
这是客观物理规律和实际人工系统要考虑到成本造成的,在模拟时代,暗部通常要和系统各处产生的噪声做斗争,这是很费钱的事,亮部当然也是,传感器对付太亮的画面部分也是力不从心,再说各种处理电路,信号动态范围越大成本会急剧飙升,那时候能处理1000倍(60dB)的设备都是天价,如果我们先不考虑各种黑科技,这类系统总的GAMMA特性基本上是:


它和理想状况不同的是,输入量增强到某个阈值,输出量就饱和到了系统最大值不再增加,呈现在影像上就是高光区应该有的层次丢失,例如下图桌布亮处等区域。

在影视界,摆拍的时候布光除了满足艺术上的需求,还有一个重要的技术原因就是控制光比,把被拍摄场景上镜区域的亮区暗区都控制在系统能还原的范围内。但新闻、纪录片等不好摆拍的领域就要看运气了,很多时候都会出现现场光比太大,要么为了保留亮区牺牲暗区层次,要么为了暗区牺牲亮区层次,或者为了中间层次,牺牲两头,真的很为难。
4)现实影像系统案例:多年前笨重的摄像管和显像管时代的一些GAMMA特性。
电视和电脑显示器采用CRT(阴极射线管)显像的时代,CRT的GAMMA特性(输入量:视频信号电压,输出量:荧光粉发光强度)是非线性的幂函数曲线,和人眼的输入输出增长趋势相反,在曲线暗部,屏幕某点亮度随输入电压缓慢增长不灵敏,在曲线亮部,屏幕某点亮度随输入电压快速增长很灵敏。我们后面将看到现在的数字影像很多地方有这个时代的遗产。


如果我们直接给CRT输入真实场景成线性关系的视频信号,CRT荧光屏上就会是这样:

所以为了使整个系统实现2),我们要进行与CRT相反的GAMMA特性校正。通常为了降低整个广播电视广播系统的成本,最合适的是在摄像机环节,而且细心的朋友会发现在此处做校正还有额外的好处就是如果处理得到,相当于在整个系统做了一次压缩扩张算法的降噪处理,降低了摄像机以后的各种环节噪声对人眼敏感的暗部信息的影响,可以说是一箭双雕。

请继续关注第二部分

1)人类视觉直接观看真实场景: GAMMA特性是非线性的曲线(算术坐标系统,下同)

看到

画面中某一点引起的大脑视觉感受和入射光在视网膜形成的影像里的明暗关系是这样的

例如近处西兰花和杯里的食物处于全黑和亮之间,视觉对这部分的层次很敏感,只要光线有细微的差别,视觉就能把明暗层次区分得很清楚,输入和输出之间是很陡峭增长的关系。装西兰花盘子的边缘、杯子后桌布的漫反射亮处和窗外的太阳光照耀下对面房子的墙壁,如果真正在视网膜成像面用入射光测量装置测量,会发现光线强度是数量级的差别(也就是十倍百倍千倍……的差别)但我们的大脑并不这么认为,仅仅觉得窗外的高光处只比桌布亮处亮一点点,它们位于上图GAMMA曲线的亮到很亮的部分,输入和输出之间是缓慢增长的关系,可以看到视觉对入射光强度的增加不再敏感了。而且人类的视觉还有非常灵活复杂的适应性,这里就不多说了。总之,人的这种视觉特性是物理定律、未知的大脑机制和物种演化过程等共同形成的,有利于我们的基因成功的生存下来。后面我们还将看到,人工影像系统可以巧妙利用这些特性,降低成本。

2)理想的人工影像系统的GAMMA应该是一条直线
不管经过了中间什么环节的折腾,从真实世界输入,到最后给人眼观看还原的影像,理论上应该尽量原汁原味,然而现实世界中几乎所有的影像系统的转换特性都是非线性的,线性只是某个区间的近似,要实现线性的成本很高,有时也没有必要,后面逐渐细谈。


3)现实中人工影像系统技术的局限性,在物理量强度领域能实现线性还原的范围很小。
这是客观物理规律和实际人工系统要考虑到成本造成的,在模拟时代,暗部通常要和系统各处产生的噪声做斗争,这是很费钱的事,亮部当然也是,传感器对付太亮的画面部分也是力不从心,再说各种处理电路,信号动态范围越大成本会急剧飙升,那时候能处理1000倍(60dB)的设备都是天价,如果我们先不考虑各种黑科技,这类系统总的GAMMA特性基本上是:


它和理想状况不同的是,输入量增强到某个阈值,输出量就饱和到了系统最大值不再增加,呈现在影像上就是高光区应该有的层次丢失,例如下图桌布亮处等区域。

在影视界,摆拍的时候布光除了满足艺术上的需求,还有一个重要的技术原因就是控制光比,把被拍摄场景上镜区域的亮区暗区都控制在系统能还原的范围内。但新闻、纪录片等不好摆拍的领域就要看运气了,很多时候都会出现现场光比太大,要么为了保留亮区牺牲暗区层次,要么为了暗区牺牲亮区层次,或者为了中间层次,牺牲两头,真的很为难。
4)现实影像系统案例:多年前笨重的摄像管和显像管时代的一些GAMMA特性。
电视和电脑显示器采用CRT(阴极射线管)显像的时代,CRT的GAMMA特性(输入量:视频信号电压,输出量:荧光粉发光强度)是非线性的幂函数曲线,和人眼的输入输出增长趋势相反,在曲线暗部,屏幕某点亮度随输入电压缓慢增长不灵敏,在曲线亮部,屏幕某点亮度随输入电压快速增长很灵敏。我们后面将看到现在的数字影像很多地方有这个时代的遗产。


如果我们直接给CRT输入真实场景成线性关系的视频信号,CRT荧光屏上就会是这样:

所以为了使整个系统实现2),我们要进行与CRT相反的GAMMA特性校正。通常为了降低整个广播电视广播系统的成本,最合适的是在摄像机环节,而且细心的朋友会发现在此处做校正还有额外的好处就是如果处理得到,相当于在整个系统做了一次压缩扩张算法的降噪处理,降低了摄像机以后的各种环节噪声对人眼敏感的暗部信息的影响,可以说是一箭双雕。

请继续关注第二部分

本文为作者 左艺共创 分享,影视工业网鼓励从业者分享原创内容,影视工业网不会对原创文章作任何编辑!如作者有特别标注,请按作者说明转载,如无说明,则转载此文章须经得作者同意,并请附上出处(影视工业网)及本页链接。原文链接 https://cinehello.com/stream/72423
左艺共创
点击了解更多
CREATIVE COMMONS FOR COMMUNISM
开源 互助 共享