先说结论:pHash更适合用于图片层面的去重与相似检索;PDQ是面向图片的高比特图像指纹;TMK+PDQF(及其 vPDQ 实现)是面向视频、包含时序信息的指纹算法。
官方文档亦给出音频与视频接口,但视频部分返回帧级哈希序列,本质上是“逐帧图像哈希”,缺少显式时序编码,通常用于轻量筛查而非强鲁棒视频匹配。
pHash
pHash 是开源感知哈希库,长期用于图像相似检索,并提供 DCT 与 Marr 小波等图像哈希实现,适合图片去重与近重复检索场景。
PDQ
PDQ 是 Meta 开源的“photo-hashing”算法,输出 256 位图像指纹,设计面向图片内容的快速、可阈值化匹配,广泛用于内容风控与跨平台共享库中。
在视频场景中,PDQ 可用于“逐帧取指纹”的组件,但官方视频方案更推荐与时序建模结合(见TMK+PDQF/vPDQ)。
TMK+PDQF(含 vPDQ)
TMK+PDQF 是视频相似度算法:对每帧计算 PDQF(浮点版 PDQ)特征后,经时间核构造两层固定长度描述,从而在检索时先比全局层、再比时序层以提升视频级匹配稳健性。
行业基准与文档将 TMK+PDQF(及后续 vPDQ)定位为开源视频指纹方案,面向重编码、分辨率与码率变化下的视频近重复与段落级匹配。