MySQL索引定義:索引(Index) 是幫助MySQL高效獲取數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。 提取句子主干, 就可以得到索引的本質(zhì): 索引是數(shù)據(jù)結(jié)構(gòu)。
大部分數(shù)據(jù)庫系統(tǒng)及文件系統(tǒng)都采用B-Tree或其變種B+Tree作為索引結(jié)構(gòu)
數(shù)據(jù)結(jié)構(gòu)具體應用場景:
數(shù)據(jù)庫是如何做到快速檢索的功能。
特別有意思的小例子。
mysql索引原理的理解和數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)結(jié)構(gòu)
B+樹(為什么使用B+數(shù))
- 所有數(shù)據(jù)都存儲在磁盤中,讀取數(shù)據(jù)由于IO問題會讀取慢,如何加快IO速度
IO
- 量:減少IO量
*禁止使用slect ,避免增加不必要的量 - 次數(shù):減少IO次數(shù)
相關(guān)知識點
- 加入索引(加快查詢速度)
- 數(shù)據(jù)結(jié)構(gòu)設計:key、文件編號、當前文件的offset(存在問題:當數(shù)據(jù)量特別大時,索引所占用的存儲空間也特別大。)
- 解決方法:索引的數(shù)據(jù)文件也需要持久化存儲到磁盤中,當需要使用時直接讀取到內(nèi)存中,加快數(shù)據(jù)的訪問(分而治之:分塊讀取)
- 操作系統(tǒng)基本概念:
1.局部性原理:數(shù)據(jù)和程序都有聚集成群的傾向,之前被查詢過的數(shù)據(jù)很快會再次被查詢。冷熱數(shù)據(jù)(一級緩存,二級緩存的意思)
2.磁盤預讀:在數(shù)據(jù)交換時,會有一個基本邏輯單位頁,一般占用空間是4k,每次在進行數(shù)據(jù)獲取時可以獲取整頁的整數(shù)倍。(mysql中innodb的存儲引擎讀取數(shù)據(jù)會讀取16k show variables like ‘%innodb’)
ket-value格式數(shù)據(jù)結(jié)構(gòu)存儲:
- 哈希表
- 樹(二叉樹、BST、AVL、紅黑樹、B樹、B+樹)
二分支的缺點:深度太深,解決方法:B樹(多叉樹)
B樹
- 搜索樹
- 多節(jié)點多分支的數(shù)
問題:假設磁盤塊存放16條數(shù)據(jù),如果是三層樹,最多存放的數(shù)據(jù):161616=4096,即48k才存放4096條數(shù)據(jù)
B數(shù)存在問題:存放了數(shù)據(jù),依然占用空間,如何減少數(shù)據(jù),需要用到B+數(shù)
B+樹
- 最下面的葉子節(jié)點存放的是順序全量數(shù)據(jù)
- 非葉子節(jié)點可以不用存放data
- 問題:讀取數(shù)據(jù),假設三層樹48k磁盤塊,1000字節(jié)為1kb,指針和鍵值占10字節(jié),1行記錄1k 161000/10=160016001600=40960000的數(shù)據(jù)范圍,即Key鍵值,最下面的只存放一遍數(shù)據(jù)*
- 建索引時,key要盡可能少的占用空間
索引技術(shù)名詞
**回表:**從非聚簇索引跳轉(zhuǎn)到聚簇索引中查找數(shù)據(jù)的過程(避免回表操作select * from table )
索引覆蓋當非聚簇索引的葉子節(jié)點中包含了查詢需要的所有字段時,不需要回表的過程(推薦使用select id,name from table )
最左匹配:、索引下推