Processing math: 100%

视频编码器评测 - 客观评价指标

客观评价指标

客观质量评价主要分三个方向:

  1. 全参考 (Full-Reference):属于有源评价。
  2. 部分参考 (Reduced-Reference):属于有源评价。
  3. 无参考 (No-Reference):属于无源评价,学术界的研究重点,主要分为传统的特征提取和机器学习。

常见的全参考客观评价指标有:

  • PSNR (Peak Signal-to-Noise Ratio)
  • SSIM (Structural Similarity Index Measure)
  • VMAF (Video Multi-Method Assessment Fusion)

其他不常用的全参考客观评价指标举例:

  • MSE (Mean Square Error)
  • MS-SSIM (Multi Scale Structural Similarity Index)
  • JND (Just Noticeable Difference)

PSNR

峰值信噪比 (PSNR) 表示信号最大功率与影响精度的噪声功率的比值,单位为分贝 (dB) 。一般用的最多,缺点有时候分数与人眼观感差距较大,因为 PSNR 没有考虑亮度、结构等信息对于视频质量的影响,故后续也出现了 HDR-PSNR 等方法。

PSNR=10log10(MAX2IMSE)=20log10(MAXIMSE)=20log10(MAXI1mnm1i=0n1j=0[I(i,j)K(i,j)]2)

PSNR 通过均方误差 (MSE) 计算而来,MAX 为图像所有像素点颜色数值的最大值。其中MSE公式如下:

MSE=1mnm1i=0n1j=0[I(i,j)K(i,j)]2

RGB(彩色)图像的 PSNR 计算公式如下:

PSNR=10log10(MAX2I13mnR,G,Bm1i=0n1j=0[Icolor (i,j)Kcolor (i,j)]2)

SSIM

结构相似性度量 (SSIM),更加接近人眼感知,常常与 PSNR 结合参考使用。
其包含三个分量:

l(x,y)=2μxμy+C1μ2x+μ2y+C1c(x,y)=2σxσy+C2σ2x+σ2y+C2s(x,y)=σxy+C3σxσy+C3

其中,x、y 为需要对比的两张图像。最终 SSIM 是以上三个相乘:

SSIM=l(x,y)×c(x,y)×s(x,y)

VMAF

Netflix 与几个大学实验室合作推出的多方法融合的客观评估指标,基于 Machine Learning。目前业内已经用的很多,算力消耗较大。

VMAF 的计算主要使⽤了3种指标,特征之间融合计算出总分的过程使⽤了训练好的 SVM (Support Vector Machine) 来预测:

  1. Visual Quality Fidelity (VIF):视觉信息保真度,为空域特征。

  2. Detail Loss Measure (DLM):细节损失指标,可以衡量内容可⻅性的细节丢失,针对⼀些特殊情况就不再适⽤,⽐如⿊框;⽐如过度的锐化也会导致计算结果与⼈眼不相符。

  3. Temporal Information (TI):相邻帧的运动向量,简单的使⽤亮度分量的平均绝对像素差来计算得到。

Example

以下是利用 FFmpeg 工具调用 libvmaf 库来计算 vmaf 的命令:

1
ffmpeg -i main.mpg -i ref.mkv -lavfi "[0:v]settb=AVTB,setpts=PTS-STARTPTS[main];[1:v]settb=AVTB,setpts=PTS-STARTPTS[ref];[main][ref]libvmaf=psnr=1:log_fmt=json" -f null -
  • ref 为参考 (reference) 视频,即 Ground-truth
  • main 为需要评价的视频
  • 需要注意的是 [main] [ref] 顺序不能反过来

References

Powered By Valine
v1.5.2
不知道 >_< 本站总访问量13925