裁剪和添加水印,可以过感知哈希(pHash、PDQ、TMK+PDQF)检测吗

裁剪和添加水印,可以过感知哈希(pHash、PDQ、TMK+PDQF)检测吗

搬运视频的时候,裁剪和添加水印的方式,是否可以过感知哈希(pHash、PDQ、TMK+PDQF)的检测。不同感知哈希(pHash、PDQ、TMK+PDQF)在抗裁剪或水印方面哪个更稳健?

抗裁剪对比

pHash基于全局低频DCT特征,局部裁剪会改变整体频谱分布,常导致哈希显著变化,因此对“局部缺失”的鲁棒性较弱,学界也因此提出面向裁剪/旋转鲁棒的改进方向以弥补传统全局哈希不足。
PDQ(图像)对“内容移除/遮挡”类改动更易受影响,作者测试显示对移除型变换并不如对轻微增益类变换(如格式/码率)稳健,裁剪属于“移除”范畴因而不占优。

TMK+PDQF(视频)在裁剪上劣化尤为直观:评测显示若画面裁去超过约20%就难以可靠匹配,甚至建议超过10%时就不要期望稳定命中,凸显其对大幅视野缺失的敏感性。

抗水印对比

pHash对大面积不透明水印敏感,因为水印会改变全局低频结构,传统全局DCT感知哈希通常难以在强水印下保持近似哈希一致性。

PDQ对“轻量水印/小logo”有一定容忍,但在“强不透明、含复杂边缘与色彩变化”的水印条件下,超过一半样本在常用阈值下会被漏检,显示对重度水印的鲁棒性有限。

TMK+PDQF在视频场景对水印与裁剪均被报告为“表现不佳”类变换,相比码率/格式/缩放等保留全局结构的变换,水印叠加会明显拉低匹配置信度。

实务提示

平台侧经验显示:对视频的“格式/码率/缩放”转码类变换鲁棒性较好,但对大幅裁剪或强水印(尤其不透明、覆盖区域大)三类算法均有明显性能下滑,应结合上下游策略(如阈值调优与人工复核)。

若必须提升对裁剪的稳健性,可结合“分块/局部”思想或采用针对裁剪/旋转设计的空间编码方法来弥补传统全局哈希的短板,再与PDQ/TMK等指纹多模态融合以提升召回。实践与研究均指出传统全局感知哈希对裁剪并不鲁棒,从而催生面向裁剪鲁棒的新方法。

对水印场景,PDQ官方资料指出可容忍“轻量水印/小logo”,而强不透明水印会显著影响匹配;视频侧TMK+PDQF也呈相似规律,因此应避免仅依赖单一阈值,必要时引入候选扩展与二阶段核验流程。

重要结论

在“抗裁剪/局部遮挡”和“叠加水印”两类局部改动上,三者总体规律是:PDQ与TMK+PDQF对轻量级水印(如角标/logo)相对更稳健,但对明显裁剪与大面积不透明水印均会显著退化;pHash因偏全球低频特征,对上述局部改动最不稳健。

搬运视频的朋友,这下,你知道应该怎么做了吧。