当前位置：首页 > news >正文

【机器学习】3. 欧式距离，曼哈顿距离，Minkowski距离，加权欧式距离

news 2025/11/24 8:10:35

Euclidean - L2 norm L2范数

$\sqrt{(a_1-b_1)^2+(a_2-b_2)^2 + ...}$

Manhattan

$\sqrt{|a_1-b_1|+|a_2-b_2| + ...}$

Euclidean欧式距离是直接距离， Manhattan不能走斜线，只能走直线，所以是绝对值的和。

由于 Manhattan distance可以看成是直角三角形的直角边，Euclidean distance可以看成是斜边，所以Manhattan distance >= Eculidean distance.

在这里插入图片描述

Minkowski distance

$D(A,B) = ((a_1-b_1)^q+(a_2-b_2)^q + ...)^{1/q}$
Minkowski distance 是上面两种距离的变型。

Weighted Euclidean

$\sqrt {w_1(a_1-b_1)^2+w_2(a_2-b_2)^2 + ...}$

Weighted Distance

权重对比，比如权重取:
$\frac{1}{d^2}$
为什么需要权重呢？这里举一个KNN的例子，在KNN中，我们将距离最近的几个数据中的众数作为最终结果。如果直接使用欧氏距离，会有一个弊端，如下图。
在这里插入图片描述
假设我们求黑点的预测值，K是3，1，2，3代表了最近的三个点。根据我们肉眼判断，黑点应该属于蓝色更加合理，但是传统KNN判断最近的是2个红色，一个蓝色，会将这个黑点划分到红点中。