深入刨析 mysql 底层索引结构B+树

news/2024/5/18 22:39:49

文章目录

  • 前言
  • 一、什么是索引?
  • 二、不同索引结构对比
    • 2.1 二叉树
    • 2.2 平衡二叉树
    • 2.3 B-树
    • 2.4 B+树
  • 三、mysql 的索引
    • 3.1 聚簇索引
    • 3.2 非聚簇索引


前言

很多人看过mysql索引的介绍:hash表、B-树、B+树、聚簇索引、主键索引、唯一索引、辅助索引、二级索引、联合索引、倒排索引、普通索引。。。等等。好像都知道,但是却分不清,本系列为大家系统分享介绍一下mysql的各种索引知识,将不同知识点串起来。


一、什么是索引?

MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。

二、不同索引结构对比

数据结构查找时间复杂度缺点优点
hash表O(1)- hash冲突; - 无法范围查随机查找效率高
二叉树O(logN)线性增加数据会退化成O(N);数据量较大时,树会变高;每个节点只能存储一个数据,IO次数多
平衡二叉树O(logN)- 数据量较大时,树会变高;- 每个节点只能存储一个数据,IO次数多- 线性增加数据不会退化成O(N);
b-树O(logN)- 范围查询时效率低; - 数据分散在非叶子节点,当数据量大时,树的高度也不低- 叶子节点和非叶子节点都可以存储数据; - m叉分裂,可以降低树的高度
b+树O(logN)- 非叶子节点只存key,不存data,大大降低了树的高度;- 叶子节点设计为链表,很好的支持了范围查询

2.1 二叉树

在这里插入图片描述

2.2 平衡二叉树

在这里插入图片描述

2.3 B-树

在这里插入图片描述

2.4 B+树

在这里插入图片描述
总结
1.索引为排好序的一种数据结构,用于提升数据库的查找速度。
2.Hash索引时间复杂度为O(1),树索引是O(log(n))。Hash 底层是哈希表实现,等值查询,可以快速定位数据。但不支持范围查询,无法用于排序分组,无法模糊查询等操作。
3.B+树作为索引优势:

  • 叶子节点存储实际记录行,记录行相对比较紧密的存储,适合大数据量磁盘存储;
  • 非叶子节点存储记录的PK(KEY数据小,相同内存情况下,节点可以多存KEY,增大了节点广度(B+树出度更大,进而树高更矮,磁盘IO次数更少))用于查询加速,适合内存存储;
  • 叶子之间,增加了链表。可以很好的支持范围查询,并且获取所有节点,不再需要中序遍历;
  • 更少查询次数:B+树出度更大,树高更低,查询次数更少;
  • 很适合磁盘存储,能够充分利用局部性原理,磁盘预读(为了减少IO操作,往往不严格按需读取,而是预读。B+树叶子结点存储相临,读取会快一些

三、mysql 的索引

3.1 聚簇索引

聚簇索引并不是一种单独的索引类型。而是一种数据存储方式(所用的用户记录都保存在页子节点)也就是所谓的索引即数据,数据即索引。

聚簇索引默认是主键,如果表中没有定义主键,InnoDB 会选择一个非空唯一索引代替。如果没有,InnoDB 会使用隐藏的_rowid 列来作为聚簇索引。

在这里插入图片描述
如下图所示,一张表 聚簇索引和非聚簇索引的关系:
在这里插入图片描述
特点:

  • 使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:
    • 页内 的记录是按照主键的大小顺序排成一个 单向链表 。
    • 各个存放 用户记录的页 也是根据页中用户记录的主键大小顺序排成一个 双向链表 。
    • 存放 目录项记录的页 分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个 双向链表 。
  • B+树的 叶子节点 存储的是完整的用户记录。
    所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。

优点:

  • 数据访问更快 ,因为聚簇索引将索引和数据保存在同一个B+树中,因此从聚簇索引中获取数据比非聚簇索引更快
  • 聚簇索引对于主键的 排序查找 和 范围查找 速度非常快
  • 按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以 节省了大量的io操作 。

缺点:

  • 插入速度严重依赖于插入顺序 ,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义一个自增的ID列为主键
  • 更新主键的代价很高 ,因为将会导致被更新的行移动。因此,对于InnoDB表,我们一般定义主键为不可更新
  • 二级索引访问需要两次索引查找 ,第一次找到主键值,第二次根据主键值找到行数据。(也就是常说的回表,但是并不是一定会回表)

限制:

  • 对于mysql数据库中只有InnoDB支持聚簇索引,而MyISAM不支持聚簇索引。
  • 由于数据物理存储方式只能有一种,而每个mysql的表只能有一个聚簇索引,一般情况下就是该表的主键。
  • 如果没有定义主键,InnoDB会选择非空的唯一索引代替,如果没有这样的索引,InnoDB会隐式的定义一个主键来作为聚簇索引。
  • 为了充分利用聚簇索引的聚簇的特性,索引InnoDB表的主键列尽量选用有序的id,而不建议使用无需的id,比如uuid,md5,hash,字符串作为主键将无法保证数据的顺序增常。

3.2 非聚簇索引

非聚簇索引:不是根据主键构建的索引叫做非聚集索引或者二级索引或者辅助索引。

二级索引中如果将多个列作为索引,就叫做联合索引
如果索引类型为唯一索引,索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一

可视化数据结构的网址 https://www.cs.usfca.edu/~galles/visualization/Algorithms.html


http://www.mrgr.cn/p/18761401

相关文章

计算机为什么需要中断?

// generated by ChatGPT-3.5 & hk416hasu中断是计算机系统中一种重要的机制,它允许系统在执行过程中临时中止当前任务,转而处理其他优先级更高或更紧急的任务,然后再返回原来的任务。以下是一些计算机需要中断的原因:1. 响应外部事件:计算机系统需要能够响应各种外部…

SpringCloud之负载均衡Ribbon

Ribbon 是一个客户端负载均衡工具,主要功能是将面向服务的Rest模板(RestTemplate)请求转换成客户端负载均衡的服务调用。通过Ribbon,开发人员可以在客户端实现请求的负载均衡,而无需单独部署负载均衡器。Ribbon支持多…

Linux实现文件共享

#nfs-utils、rpcbind 软件包来提供 NFS 共享服务 #客户端创建共享文件夹: nmcli c reload nmcli c up ens160 systemctl stop firewalld systemctl disable firewalld rpm -q nfs-utils rpcbind #查看是否安装 systemctl enable rpcbind systemctl enable nfs…

OpenHarmony网络协议通信—libevent [GN编译] - 事件通知库

libevent主要是用C语言实现了事件通知的功能 下载安装 直接在OpenHarmony-SIG仓中搜索libevent并下载。 使用说明 以OpenHarmony 3.1 Beta的rk3568版本为例 库代码存放路径:./third_party/libevent 修改添加依赖的编译脚本 在/developtools/bytrace_standard/…

【爆款推荐】初中中考阅读理解难题一网打尽!句子结构深度解析+答案揭秘,助你轻松冲刺高分!-011

PDF格式公众号回复关键字:ZKYDT011原文1 The writer lost her father at the age of four, didn’t she? 解析 1 The writer 这位作者, lost 失去, her father 她的父亲, at the age of four 在4岁的时候, didn’t she?不是吗? 这位作家四岁时失去了父亲,不是吗? 2 Eve…

Laravel 6 - 第十三章 请求

​ 文章目录 Laravel 6 - 第一章 简介 Laravel 6 - 第二章 项目搭建 Laravel 6 - 第三章 文件夹结构 Laravel 6 - 第四章 生命周期 Laravel 6 - 第五章 控制反转和依赖注入 Laravel 6 - 第六章 服务容器 Laravel 6 - 第七章 服务提供者 Laravel 6 - 第八章 门面 Laravel 6 - …

关于双向循环列表的插入、删除、遍历

目录 双向循环链表公式初始化双向循环链表 构建双向循环链表结构体 // 双向循环链表节点定义 typedef struct double_loop_node { char data[DATA_LEN]; // 数据域,存储数据长度 struct double_loop_node *next; …

02-属性事件过滤双向绑定

es6的对象写法 // 正常的写法 let arr = [逃课, 打游戏, 欺负小满] let hobbyDetail = {name: "大乔",age: 4,hobby: arr } console.log(hobbyDetail)// 简写 // 正常的写法 let arr = [逃课, 打游戏, 欺负小满] let hobbyDetail = {name: "大乔",age: 4,h…

学习笔记447—本地部署 Llama3 – 8B/70B 大模型!最简单的方法: 支持CPU /GPU运行 【3种方案】

本地部署 Llama3 – 8B/70B 大模型!最简单的方法: 支持CPU /GPU运行 【3种方案】目前在开源大模型领域,Llama3 无疑是最强的!这次Meta不仅免费公布了 8B和70B两个性能强悍的大模型,400B也即将发布,这是可以和GPT-4对打的存在!今天我们就来介绍3各本地部署方法,简单易懂…

01 线段树

目录线段树简介节点加法线段树1. 准备变量2. 上拉操作3. 建树4. 懒标记5. 下放操作6. 区间修改updata异或线段树pushupupdata最值线段树updatapushup 线段树 简介线段树(一个二叉树)是一个非常重要的数据结构,利用分治的思想。可以用于维护一些满足结合律区间的信息,例如区间…

最新windows版本erlang26.0和rabbitmq3.13下载

Erlang下载 官网下载:https://www.erlang.org/patches/otp-26.0 百度网盘:https://pan.baidu.com/s/1xU4syn14Bh7QR-skjm_hOg 提取码:az1t RabbtitMQ下载 官网下载:https://www.rabbitmq.com/docs/install-windows 百度网盘…

http是什么?http的基础知识教程详解(2024-04-24)

1、http的概念 HTTP(超文本传输协议,HyperText Transfer Protocol)是一种用于分布式、协作式、超媒体信息系统的应用层协议。 HTTP 是万维网(WWW)的数据通信的基础,设计目的是确保客户端与服务器之间的通…

深度优先搜索 Depth First Search (DFS)

本篇篇幅较长,请做好心理准备!目前三章节: 1.深搜入门(一维方向 数字选数类) 2.深搜入门(二维方向 迷宫类) 3.深搜进阶(迷宫类问题--最少步数和输出路径)(待开放)第一章:深搜入门(一维方向 数字选数类) 前置知识:函数、递归 为了保证学习效果,请保证已经掌握前置知识…

利用云服务器搭建自己的微信聊天机器人

本次部署使用的是LinkAI提供的接口,不需要魔法 选择比较简单的docker部署,其他的部署方式可以参考官方文档:https://docs.link-ai.tech/cow/quick-start 0、前置 租一台云服务器,因为是调用的其他平台的大模型api,所以配置不用太高 注册并登陆LinkAI平台(https://link-ai…

vue集成百度地图vue-baidu-map

文章目录 vue集成百度地图vue-baidu-map1. Vue Baidu Map文档地址2. 设置npm数据源3. 安装vue-baidu-map4. 配置vue-baidu-map4.1 main.js全局注册4.2 vue页面设置4.3 效果 vue集成百度地图vue-baidu-map 1. Vue Baidu Map文档地址 https://dafrok.github.io/vue-baidu-map/#…

华为机考入门python3--(16)牛客16-购物单最大满意度

分类:动态规划,组合,最大值,装箱问题 知识点: 生成递减数 100, 90, 80, ..., 0 range(100, -1, -10) 访问列表的下标key for key, value in enumerate(my_list): 动态规划-捆绑装箱问题 a. 把有捆绑约束的物…

LLM应用实战:当KBQA集成LLM(二)

本文主要是针对KBQA方案基于LLM实现存在的问题进行优化,主要涉及到图谱存储至Es,且支持Es的向量检索,还有解决了一部分基于属性值倒查实体的场景,且效果相对提升。1. 背景 又两周过去了,本qiang~依然奋斗在上周提到的项目KBQA集成LLM,感兴趣的可通过传送门查阅先前的文章…

2024年成都市非物质文化遗产代表性项目申报条件程序、材料时间安排

一、申报(推荐)条件 申报(推荐)列入市级非物质文化遗产代表性项目名录的项目应符合下列标准: (一)体现中华民族优秀传统文化,具有历史、文学、艺术、科学价值; &#…

Esko Ukkonen: On-line Construction of Suffix Trees

Esko Ukkonen: On-line Construction of Suffix Trees 文章目录 Esko Ukkonen: On-line Construction of Suffix Trees一、后缀树的概念及应用【详见刘方州同学报告】1.1 字典树 Trie1.2 后缀树 Suffix Tree2 后缀树的应用 二、朴素后缀树构造方法及问题三、线性时间内后缀树在…

计算机组成原理—数据的表示和运算

没有负值:无符号 前面最高符号 后面数字 有符号位 带符号数用什么编码形式表达 1.原码表示 如果是整数负数 那么1表示负值 后面用0补位 1表示2的n次方 2的n次方x的绝对值 表示数值大小 让加减法简单 改编码规则—补码