当前位置：首页 > news >正文

传知代码-一键找出图像中物体的角点（论文复现）

news 2025/6/29 3:53:32

代码以及视频讲解

本文所涉及所有资源均在传知代码平台可获取

概述

本文复现论文A COMBINED CORNER AND EDGE DETECTOR中提出的图像中的物体角点检测算法,也称Harris算法。原文连接https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=88cdfbeb78058e0eb2613e79d1818c567f0920e2

该论文所提出的角点检测算法是计算机视觉领域的经典算法，至今仍在计算机视觉领域有着广泛的应用。

该方法对算力几乎没有任何要求，依据图像邻域内灰度值的分布特点来对图像中各区域的角点进行判断。不像深度学习需要依靠大量数据的训练且对数据集分布有依赖性，所以时至今日依然在工业界有着很高的应用价值。

算法原理

正如边缘在灰度图像中在某一个方向上会出现明显的灰度变化，角点在图像中往往是在两个方向上都出现明显的灰度变化。
在这里插入图片描述

如在此图中，红点标注处的角点在两个箭头方向的垂直方向上都有明显的灰度变化，两个红色箭头标注出了它的两个灰度变换边缘。

假设我们现在要检测的图片为 $I$ ,在图像处理中，能够充分体现图像灰度变化特征的是它的方向导数， $I_{x}$ 与 $I_{y}$ ,分别代表图像 $I$ 的水平方向导数与竖直方向导数。

$I_{x}(i, j)=\frac{I(i, j+1)-I(i, j-1)}{2}$
$I_{y}(i, j)=\frac{I(i-1, j)-I(i+1, j)}{2}$
Harris算法就是利用图像的方向导数制定了一个响应指标:
$R=det(M)-k\cdot trace(M)^2$
个人感觉原文的公式不太好理解，以下我将按照我的理解对公式进行适当的改变。
对于R，实际上是一个R图，其尺寸与我们要检测的图像 $I$ 一致，于是上面的相应指标实际上是每个像素都有一个相应指标，即：
$R(i,j)=det(M(i,j))-k\cdot trace(M(i,j))^2$
其中
$M(i,j)=\left[\begin{array}{ll} A(i,j) & B(i,j) \\ B(i,j) & C(i,j) \end{array}\right]$
在用3X3邻域内的数据进行操作时，A(i,j)、B(i,j)、C(i,j)在原文中对应的定义应该是这样的:
$j)=\sum_{m=-1}^{1} \sum_{n=-1}^{1} \omega (m,n)I_{x}^{2}(i+m, j+n) \\ B(i, j)=\sum_{m=-1}^{1} \sum_{n=-1}^{1} \omega (m,n)I_{x}(i+m, j+n) \times I_{y}(i+m, j+n) \\ C(i, j)=\sum_{m=-1}^{1} \sum_{n=-1}^{1} \omega (m,n)I_{y}^{2}(i+m, j+n)$
即对 $I_x^2$ 、 $I_y^2$ 和 $I_xI_y$ 三个方向导数图在3X3邻域内进行卷积得到A、B和C。
其中 $\omega$ 是高斯平滑核，主要是为了减少噪声对方向导数的影响。大多数情况下， $\omega$ 取一个全一矩阵就好。本方法也是采用了全一矩阵，所以以上定义可以修改为:
$j)=\sum_{m=-1}^{1} \sum_{n=-1}^{1} I_{x}^{2}(i+m, j+n) \\ B(i, j)=\sum_{m=-1}^{1} \sum_{n=-1}^{1} I_{x}(i+m, j+n) \times I_{y}(i+m, j+n) \\ C(i, j)=\sum_{m=-1}^{1} \sum_{n=-1}^{1} I_{y}^{2}(i+m, j+n)$
所以 $R$ 指标的最终定义可以改为：
$R(i,j)=\operatorname{Det}(M(i,j))-k(\operatorname{Tr}(M(i,j)))^{2}=\left(A(i,j) C(i,j)-B(i,j)^{2}\right)-k \times(A(i,j)+C(i,j))^{2}$
其中k是一个经验参数，本算法中取0.02，当然也可以根据具体情况进行调整，通常来说k越大，算法对角点的判别就越严格，会有更少的点被判别为角点；k越小，算法的判别就越松一些，会有更多的点被判别为角点。

得到R图后，将R图中最大值 $R_max$ 的0.2倍作为阈值。将R图中小于 $0.2R_max$ 的像素坐标判别为是角点坐标，其余的则为非角点坐标，最终得到我们的结果图。

演示效果

在这里插入图片描述

核心逻辑

def HarrisCornerDetector(image,k=0.02):
# 读取图像# 将图像转换为numpy数组I= imageI=np.array(I)sobel_x = np.array([[0, 0, 0], [-0.5, 0, 0.5], [0, 0, 0]])sobel_y=np.array([[0,0.5,0],[0,0,0],[0,-0.5,0]])# 对图像进行水平方向的卷积I_x = convolve2d(I, sobel_x, mode="same", boundary="symm")I_y=convolve2d(I,sobel_y,mode='same',boundary='symm')I2_x=I_x**2I2_y=I_y**2Ix_Iy=I_x*I_ysobel=np.array([[1,1,1],[1,1,1],[1,1,1]])A=convolve2d(I2_x,sobel,mode="same",boundary="symm")B=convolve2d(Ix_Iy,sobel,mode="same",boundary="symm")C=convolve2d(I2_y,sobel,mode="same",boundary="symm")R=(A*C-B**2)-k*(A+C)**2R_max=np.max(R[1:-1,1:-1])C=RC[C<=(0.2*R_max)]=0C[C>(0.2*R_max)]=1return C