图像视频哈希算法应用场景对比-pHash-PDQ-TMK+PDQF

先说结论：pHash更适合用于图片层面的去重与相似检索；PDQ是面向图片的高比特图像指纹；TMK+PDQF（及其 vPDQ 实现）是面向视频、包含时序信息的指纹算法。

官方文档亦给出音频与视频接口，但视频部分返回帧级哈希序列，本质上是“逐帧图像哈希”，缺少显式时序编码，通常用于轻量筛查而非强鲁棒视频匹配。

pHash

pHash 是开源感知哈希库，长期用于图像相似检索，并提供 DCT 与 Marr 小波等图像哈希实现，适合图片去重与近重复检索场景。

PDQ

PDQ 是 Meta 开源的“photo-hashing”算法，输出 256 位图像指纹，设计面向图片内容的快速、可阈值化匹配，广泛用于内容风控与跨平台共享库中。

在视频场景中，PDQ 可用于“逐帧取指纹”的组件，但官方视频方案更推荐与时序建模结合（见TMK+PDQF/vPDQ）。

TMK+PDQF（含 vPDQ）

TMK+PDQF 是视频相似度算法：对每帧计算 PDQF（浮点版 PDQ）特征后，经时间核构造两层固定长度描述，从而在检索时先比全局层、再比时序层以提升视频级匹配稳健性。

行业基准与文档将 TMK+PDQF（及后续 vPDQ）定位为开源视频指纹方案，面向重编码、分辨率与码率变化下的视频近重复与段落级匹配。