Duxy's

a digged hole

图像识别中的一些重要模型

记录一下论文中提到的一些重要概念,以备查。

  • SIFT SIFT特征 (Scale-invariant feature transform,尺度不变特征转换)于1999年提出,2004年完善,是一种计算机视觉的算法,用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量。
    一个比较好的sift库是Rob Hess维护的http://blogs.oregonstate.edu/hess/code/sift/
    SIFT的特点就是比较慢。对密集物体的检测,可以使用Dense SIFT。对行为变化不大的物体检测,可以使用PCA-SIFT降维处理。

  • HOG HOG特征是利用方向梯度建立直方图,用于检测对象(特别是人)。它得到的描述子保持了几何和光学转化不变性,但是尺度不变性和旋转不变性没那么强,所以在行人检测中起到了较大的作用。并且计算简单,效率较高。

  • HMAX HMAX模型 1999年Riesenhuber, M. & Poggio, T提出了一个5层object recognition模型,其理念是模仿人的认知,由点到线到面逐级抽象,还原高级模型。还可以解析图片中的轮廓。包含S1 (Gabor Filter) Layers、C1 (Local Invariance) Layers、S2 (Intermediate Feature) Layers、C2 (Global Invariance) Layers以及最终的VTU Layer层。

  • LabelMe 一个在线的物体轮廓标注平台,有开源代码可以用。网址:http://labelme.csail.mit.edu/

git clone https://github.com/CSAILVision/LabelMeAnnotationTool.git