视频编码器评测 - 客观评价指标

客观评价指标

客观质量评价主要分三个方向:

  1. 全参考 (Full-Reference):属于有源评价。
  2. 部分参考 (Reduced-Reference):属于有源评价。
  3. 无参考 (No-Reference):属于无源评价,学术界的研究重点,主要分为传统的特征提取和机器学习。

常见的全参考客观评价指标有:

  • PSNR (Peak Signal-to-Noise Ratio)
  • SSIM (Structural Similarity Index Measure)
  • VMAF (Video Multi-Method Assessment Fusion)

其他不常用的全参考客观评价指标举例:

  • MSE (Mean Square Error)
  • MS-SSIM (Multi Scale Structural Similarity Index)
  • JND (Just Noticeable Difference)

PSNR

峰值信噪比 (PSNR) 表示信号最大功率与影响精度的噪声功率的比值,单位为分贝 (dB) 。一般用的最多,缺点有时候分数与人眼观感差距较大,因为 PSNR 没有考虑亮度、结构等信息对于视频质量的影响,故后续也出现了 HDR-PSNR 等方法。

PSNR 通过均方误差 (MSE) 计算而来,MAX 为图像所有像素点颜色数值的最大值。其中MSE公式如下:

RGB(彩色)图像的 PSNR 计算公式如下:

SSIM

结构相似性度量 (SSIM),更加接近人眼感知,常常与 PSNR 结合参考使用。
其包含三个分量:

其中,x、y 为需要对比的两张图像。最终 SSIM 是以上三个相乘:

VMAF

Netflix 与几个大学实验室合作推出的多方法融合的客观评估指标,基于 Machine Learning。目前业内已经用的很多,算力消耗较大。

VMAF 的计算主要使⽤了3种指标,特征之间融合计算出总分的过程使⽤了训练好的 SVM (Support Vector Machine) 来预测:

  1. Visual Quality Fidelity (VIF):视觉信息保真度,为空域特征。

  2. Detail Loss Measure (DLM):细节损失指标,可以衡量内容可⻅性的细节丢失,针对⼀些特殊情况就不再适⽤,⽐如⿊框;⽐如过度的锐化也会导致计算结果与⼈眼不相符。

  3. Temporal Information (TI):相邻帧的运动向量,简单的使⽤亮度分量的平均绝对像素差来计算得到。

Example

以下是利用 FFmpeg 工具调用 libvmaf 库来计算 vmaf 的命令:

1
ffmpeg -i main.mpg -i ref.mkv -lavfi "[0:v]settb=AVTB,setpts=PTS-STARTPTS[main];[1:v]settb=AVTB,setpts=PTS-STARTPTS[ref];[main][ref]libvmaf=psnr=1:log_fmt=json" -f null -
  • ref 为参考 (reference) 视频,即 Ground-truth
  • main 为需要评价的视频
  • 需要注意的是 [main] [ref] 顺序不能反过来

References

不知道 >_< 本站总访问量