网上看到了一些知识点,这里做个笔记记录一下。

1、二叉排序树的特点

    a、树的左边节点比根节点小,右边节点比根节点大。

    b、左右子树也都是二叉排序树。

 二叉树红黑树和B+树-LMLPHP

但是,在一些特殊情况下,比如插入数据是有序的,就会发生退化情况。

二叉树红黑树和B+树-LMLPHP

有序序列,二叉排序树退化成链表。

2、为了保证树的平衡,引入了平衡树。在插入数据的时候,同时调整这棵树,让它的节点尽可能均匀分布。

红黑树就是平衡树的一种。

之所以要保证树的平衡性,是因为树的查找性能取决于树的高度,让树尽可能平衡,就是为了降低树的高度。

jdk内置的TreeSet底层就是用的红黑树。

3、B树

B树是一种多路搜索树,他的每个节点可以拥有多余两个孩子节点。M路的B树最多能拥有M个孩子节点。

这种多路的设计,可以进一步降低树的高度。

路数越多,树的高度越低。如果设计成无限多路,B树就退化成有序数组了。

B树一般用于文件系统索引。文件系统和数据库索引一般都存储在硬盘上的,如果数据量大的话,不一定能一次性加载到内存中。

如果一棵树无法一次性加载进内存,这时候B树的多路存储能力就出来了,可以每次加载B树的一个节点,然后一步步往下找。

如果在内存中,红黑树比B树效率更高,但是涉及到磁盘操作,B树就更优了。

4、B+树

B+树是在B树的基础上进行改造,数据都在叶子节点上,同时叶子节点之间还加了指针形成链表。

B+树一般应用在数据库索引中,这是由应用场景决定的。

select数据不一定只选一条,很多时候会选多条。

如果多条的话,B树需要做局部的中序遍历,可能要跨层访问。而B+树所有数据都在叶子节点,不用跨层。

同时由于有链表结构,只需要找到首尾,通过链表就能把所有数据取出。

问题:

B+树的查找和插入时间复杂度跟树的高度有关,大概是O(logN)

hash平均时间复杂度是O(1)

hash比B+树更快,为什么mysql为什么还用B+树来存索引呢?

这是由业务场景决定的,如果只选一条数据,确实hash更快。但是数据库中经常会选择多条,这时候由于B+树中索引有序,

并且又有链表相连,它的查询效率就比hash快很多了。

另外,数据库中的索引一般是存储在磁盘上,数据量大的情况可能无法一次装载入内存,B+树的设计可以允许数据分批加载,

同时树的高度较低,提高查询效率。

12-22 10:25