用Python构建图片处理搜索引擎

36大数据 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

用Python构建图片处理搜索引擎

译者：诗书塞外

有很多顶级的科技公司把RIQ用得很好。例如，Pinterest 2014年第一次实现视觉搜索。随后2015年它发布了一个白皮书，揭示了视觉搜索的结构。反向图片搜索使得Pinterest能够从时尚的东西中提取视觉元素，然后给消费者推荐类似的产品。

众所周知，Google图片使用反向图片搜索技术，它允许用户上传一张图片然后搜索相关的图片。上传的图片通过算法分析，制作出一个数学模型，然后跟Google数据库中成千上万的图片进行比较，知道找到匹配的或者相似的图片。

这是OpenCV2.4.9特性体验报告的一张图

在我们动手之前，让我们大致看一下构建一个图片搜索需要哪些Python元素。

SIFT(尺度不变特征变换)

SURF(加速鲁棒特征)算法

SURF和SIFT一样也是不收费的专利算法，可以说是加速版的SIFT。与SIFT不同的是，SURF使用盒过滤器近似高斯拉普拉斯算子。
SURF使用Hessian矩阵来判断图像的位置和大小。
在许多应用中，旋转不变性都不是一个必要条件，所以不用寻找方向的话算法速度会快很多。
SURF包含了几个特性使得计算的每一个步骤都得到了速度上的提升。图片经过旋转和模糊之后，SURF依旧工作的很好，而且比SIFT快3倍。不过在光源和视角变换方面SURF不太行。
OpenCV提供了SURF功能，SURF.compute和SURF.detect可以用来找到描述符和关键点。

KAZE算法

AKAZE(加速KAZE)算法

从名字可以猜到，这个算法更快，它能快速找到两个图片之间匹配的关键。AKAZE使用一个二进制描述符和非线性尺度空间来平衡准确度和速度。

BRISK(二进制鲁棒尺度不变关键点)算法

FREAK(快速视网膜关键点)算法

这是一个由人眼启发的新的关键点描述符。根据图像强度的比较有效地计算出一个二进制级联字符串。相比于BRISK, SURF 和 SIFT，FREAK计算更快，更省内存。

ORB(原生的FAST和旋转的BRIEF)

ORB是一个二进制描述符，它能够抗噪声并具有旋转不变性。ORB基于FAST关键点探测和BRIEF描述符，这两者共同造就了它的低消耗和高性能。

除了快速和准确的方向组件，计算原生BRIEF，分析变化以及与原生BRIEF的关系，是ORB的另一大特色。

OpenCV

OpenCF分学术使用版本和商用版本。作为一个开源机器学习和机器视觉库，OpenCV使得各类机构能够很容易地基于OpenCV构建自己的版本。
超过2500个优化的算法，包含目前最先进的机器学习和机器视觉算法，能够处理各类需求：人脸检测、物体鉴定、相机移动跟踪、寻找相似图片，眼球跟踪，场景识别等。
顶级公司像Google, Yahoo, IBM, Sony, Honda, Microsoft 和 Intel 都大量使用OpenCV库。
OpenCV使用Python, Java, C, C++ 和 MATLAB做编程接口，同时支持Windows, Linux, Mac OS 和 Android平台。

Python Imaging Library(PIL)