2024-10-18 21:22:45

什么是HEIF为什么我们需要10位静止图像和视频

导读 10位视频,10位静止模式和拍摄HEIF文件的能力都是相机中越来越多地添加的功能。但是有什么好处,什么时候应该使用这些模式?我们将研究如何...

10位视频,10位静止模式和拍摄“HEIF”文件的能力都是相机中越来越多地添加的功能。但是有什么好处,什么时候应该使用这些模式?我们将研究如何捕获数据,如何存储数据,以及您应该(和不应该)期望从10位捕获中获得哪些好处。

线性编码

线性编码将一半的值用于最亮的光圈,将四分之一的值用于下一个光圈,依此类推。

现在考虑光子散粒噪声;您捕获的光的随机性。散粒噪声本质上是信号的平方根。因此,图像中非常明亮的部分(您将大部分原始值用于)具有最高的噪声量,因为较大数字的平方根大于较小数字的平方根。它看起来不那么嘈杂,因为嘈杂与信噪比的关系更密切,而不是绝对噪音水平。但这意味着你正在捕捉到很多关于方差非常大的东西的非常精细的细节。

更糟糕的是,人类视觉系统在明亮区域的细节和色彩方面不如在黑暗中那么擅长辨别:你过度编码了一个在视觉上不是特别有意义的嘈杂信号。简而言之:线性编码效率极低。(一些Raw压缩利用了这一点:以一种对图像视觉或编辑灵活性没有有意义的影响的方式压缩过度编码的高亮显示)。

与人类视觉系统不同,相机以线性方式记录光线:两倍的光子击中传感器,产生的信号是两倍大,并且使用两倍大的数字数字进行记录。

这意味着您可用的原始值的一半始终被您捕获的最亮的光照所消耗。这只是基本逻辑:无论您捕获的最亮值是多少,都会捕获一半的光(即:少一挡光)的值。

这样做的结果是,在Raw中,您只能存储与相机位深度大致相同的动态范围档次数。或者,为了以正确的方式获得因果关系:将选择模数转换器,因为它具有足够的位深度来编码来自传感器的信号。这主要是确保您可以捕获并保留从传感器传出的所有信息的问题。将位深度提高到完全编码信号所需的深度不会给你“更微妙的渐变”或“X百万种颜色”,这只意味着生成更大的文件,更详细地记录阴影中的噪声。

那么,我们为什么要记录线性原始文件呢?因为从处理的角度来看,这是最简单的事情,因此可以保留您最初捕获的所有信息*,并且不会受到难以管理的大,因为您通常只在每个像素捕获单个原始值,而不是单独的红色,绿色和蓝色值。

伽玛编码

Gamma 编码是对线性数据应用非线性转换的过程,或者更简单地说:以更节省空间的方式重新分发 Raw 数据。通常,当您打开图像进行查看时,会应用相反的伽玛曲线,以便您返回到看起来像您尝试捕获的原始内容的内容。

伽玛编码 + 音调曲线

由于此编码是非线性的,因此您可以将线性 Raw 文件的部分或全部数据压缩到位深度低得多的文件中。几乎所有现代相机都输出8位JPEG,其中通常包括大约9个DR档位(当使用DR扩展模式和自适应音调曲线时会更多)。原则上,您可能更适合,但除了伽玛编码**之外,通常还会应用“S”曲线,从而提供漂亮的有力图像。

伽玛编码后,“S”形曲线应用于大多数JPEG文件,以提供具有良好对比度的图像。这会将可用 256 个值中的近 70% 分配给中间灰色周围的四个停靠点。这减少了进行更改的范围。

通过巧妙的压缩,JPEG可以很容易地达到原始文件大小的1/6,但仍然可以很好地传达您在拍摄图像时看到的所有内容。或者,至少是 8 位标准动态范围显示屏可以显示的所有内容。但是,由于已处理大量数据,并且由于“S”曲线已经压碎了高光和阴影,因此如果要对其进行重大更改,JPEG提供的灵活性要小得多。

一个 8 位文件的每个颜色通道都有 256 个数据值,当您在九个音阶之间共享这些值时,没有太多的空间来调整这些值而不会出现间隙,并且后期分离会悄悄进入,而不是平滑的色调过渡。不过,这是一个很好的端点,特别是对于SDR显示器。

从广义上讲,决定是否拍摄Raw或JPEG是一个问题,即您是计划编辑结果还是或多或少地呈现它们。原始数据通常是12位或14位,尽管其线性编码效率非常低下,但事实并非如此,因此可以管理。但对于大多数用途,最终图像可以用8位JPEG很好地表示。那么为什么我们需要10位选项呢?

日志编码 - 中间地带

对数编码更均匀地共享其可用值:大多数音阶都被赋予相同数量的数据值,而不是像大多数标准音调曲线那样被显着地加权到高光上,或者像大多数标准音调曲线那样专注于中间音调。

从本质上讲,这是一种在更高效的文件中保留良好程度的可编辑性的聪明方法。您可以看到为什么它将成为一种流行的视频处理方式,您可以在其中保留编辑的灵活性,但仍然可以从为视频开发的非常高效,优化的编解码器和文件类型中受益。

为什么拍摄Raw视频可能不是您期望的游戏规则改变者

从 8 位移动到 10 位意味着您有 1024 个值要共享,因此您可以保留有关您捕获的每个停靠点的四倍信息。反过来,如果您尝试对颜色和对比度进行重大调整,这意味着更大的灵活性,并且色调分离的风险要小得多。

通常,制造商会查看其相机的性能,然后开发一条对数曲线,该曲线可以编码相机的大部分可用动态范围。这就是为什么大多数制造商最终都选择了多条对数曲线:如果相机的输出在11级以上无用嘈杂,则您不希望在14个档次中共享1024值。

但是,对于大多数应用程序,Log 的 10 位编码大大提高了可编辑性,而不会使文件大小变得过于笨拙。

否则为什么我需要 10 位?

因此,10 位拍摄让摄像机能够提供更多可编辑的视频,而无需增加拍摄 Raw 视频时的大小和潜在的兼容性问题(和法律复杂性)。但还有其他用途,这些用途有望为视频和静止图像拍摄者带来好处。

新一代电视现已广泛使用,其动态范围比旧的SDR显示器更宽。越来越多的电影和电视节目正在以HDR拍摄,流媒体服务可以将这些HDR镜头传送到人们的家中。

混合对数伽玛 (HLG) 和感知量化器 (PQ) 是编码 HDR 数据的两种最常见方法。两者都需要10位数据,因为它们试图保留比典型的8位素材更宽的色调范围。不要被名称HLG中的“Log”一词所愚弄:曲线只有一部分是对数的。HLG和PQ都像JPEG一样,被设计成端点,而不是中间体。

越来越多的摄像机可以拍摄HLG或PQ视频,以便在HDR电视上播放。但是,他们提供基于这些标准的10位静止图像也越来越普遍,以便在HDR显示器上播放。

那么10位静止图像适用于逼真的HDR吗?

公平地说,不同相机制造商提供的产品没有太多的一致性。一些相机制造商只允许您在拍摄真正的HDR图像时拍摄10位文件,而其他相机制造商仅在HEIF模式下提供SDR配置文件,而有些制造商则允许您拍摄任何您想要的组合。

从我们的角度来看,传统的SDR曲线没有很多10位静止图像的点拍摄:数据不是以专为编辑而设计的方式存储的,无论如何,Raw仍然是一个更强大的选择,所以你所做的就是捕捉一些最终看起来很像JPEG的东西,但没有得到广泛的支持。

以 10 位拍摄真正的 HDR 图像(HLG 或 PQ)更有意义。当在HDR显示器上显示时,这些看起来非常壮观,高光以传统照片中难以传达的方式闪闪发光。但是,目前,您通常必须使用HDMI引线将相机插入电视才能查看图像,这不太实用。但对于我们来说,这就是10位静止图像的价值所在,在摄影上。

整个成像行业还有很多工作要做,以提高对真实HDR静止图像的支持。我们需要编辑工具来让我们将Raws微调为HDR静止图像,就像我们在制作自己的JPEG时习惯的那样。但最重要的是,我们需要更广泛的支持和交叉兼容性,以便我们可以共享和查看10位文件,而无需将相机连接到显示器。在这个问题得到解决之前,拍摄10位静止图像的能力使用令人失望地有限。