- 在趣图楼能够匹配出完全相同的图片
- 在全站实现搜索相似图片
- 由于大量图片(贴鱼)实际上是来源相同的图片,但由于元数据改变以及可能会有的奇怪压缩,直接使用hash是不可行的。
可以考虑使用利用图片像素信息的
pHash
来进行直接匹配。 - 对于相似图片的搜索,可以使用
OpenCV
的SIFT
等算法进行特征提取,然后使用FLANN
等进行特征匹配。
pHash
等算法会先对图片进行压缩,较为相似的图片可能被压缩为相同结果造成误判。- 趣图的图片类型大体为meme和生活图片,而
SIFT
等特征提取对前者的文字效果不好。