当前位置: 首页 > news >正文

【机器学习】3. 欧式距离,曼哈顿距离,Minkowski距离,加权欧式距离

Euclidean - L2 norm L2范数

D ( A , B ) = ( a 1 − b 1 ) 2 + ( a 2 − b 2 ) 2 + . . . D(A,B) = \sqrt{(a_1-b_1)^2+(a_2-b_2)^2 + ...} D(A,B)=(a1b1)2+(a2b2)2+...

Manhattan

D ( A , B ) = ∣ a 1 − b 1 ∣ + ∣ a 2 − b 2 ∣ + . . . D(A,B) = \sqrt{|a_1-b_1|+|a_2-b_2| + ...} D(A,B)=a1b1+a2b2+...

Euclidean欧式距离 是直接距离, Manhattan不能走斜线,只能走直线,所以是绝对值的和。

由于 Manhattan distance可以看成是直角三角形的直角边,Euclidean distance可以看成是斜边,所以Manhattan distance >= Eculidean distance.

在这里插入图片描述

Minkowski distance

D ( A , B ) = ( ( a 1 − b 1 ) q + ( a 2 − b 2 ) q + . . . ) 1 / q D(A,B) = ((a_1-b_1)^q+(a_2-b_2)^q + ...)^{1/q} D(A,B)=((a1b1)q+(a2b2)q+...)1/q
Minkowski distance 是上面两种距离的变型。

Weighted Euclidean

D ( A , B ) = w 1 ( a 1 − b 1 ) 2 + w 2 ( a 2 − b 2 ) 2 + . . . D(A,B) = \sqrt {w_1(a_1-b_1)^2+w_2(a_2-b_2)^2 + ...} D(A,B)=w1(a1b1)2+w2(a2b2)2+...

Weighted Distance

权重对比,比如权重取:
1 d 2 \frac{1}{d^2} d21
为什么需要权重呢?这里举一个KNN的例子,在KNN中,我们将距离最近的几个数据中的众数作为最终结果。如果直接使用欧氏距离,会有一个弊端,如下图。
在这里插入图片描述
假设我们求黑点的预测值,K是3,1,2,3代表了最近的三个点。 根据我们肉眼判断,黑点应该属于蓝色更加合理,但是传统KNN判断最近的是2个红色,一个蓝色,会将这个黑点划分到红点中。

而权重很好的解决了这个问题,距离更近的权重越大。
例如,黑点到蓝点的距离是1,到两个红点的距离是3。
1/ 1^2 > 1/3^2 + 1/3^2
最后结果是这样的,由于1 > 2/9, 结果判断为蓝色。


http://www.mrgr.cn/news/8245.html

相关文章:

  • Spring声明式事务
  • Json-TypeFactory和TypeReference和JavaType
  • Mac apache 配置
  • 大型物流运输无人机技术详解
  • 前端理论总结(js)——原型链 // 原型 // 浅拷贝和深拷贝
  • Vue3 组件 10
  • 数字化技术分别有哪些,数字化技术特点和优势是什么?
  • [NeurIPS 2024] Self-Refine: Iterative Refinement with Self-Feedback
  • HTML 标签大合集:一文入门
  • 【Linux】自动化构建工具makefile
  • 【lua实战】lua中pairs和ipairs的区别
  • 末代皇帝Intel核显黑苹果,NUC10的性能到底有多强
  • 【系统架构设计师】论文:论软件开发平台的选择与应用
  • 01-开篇:重新认识 bpmn.js 与 BPMN 规范
  • Add and Multiply Queries
  • 云计算第二阶段---DBA Day05-DAY07
  • 【Material-UI】深入探讨Radio Group组件的自定义功能
  • 算法刷题笔记 筛质数(详细注释的C++实现,同时包含朴素筛法、埃氏筛法和线性筛法详细介绍)
  • JavaScript 数据结构 ==== 二叉树
  • 「蓝桥·算法双周赛」第十七场分级赛——小白入门赛 ——前四道题