HBase分布式存儲(chǔ)系統(tǒng)應(yīng)用(第二版)

-
【作 者】主編 林徐 陳恒 孫帥
【I S B N 】978-7-5226-1112-9
【責(zé)任編輯】魏淵源
【適用讀者群】本專通用
【出版時(shí)間】2023-02-08
【開(kāi) 本】16開(kāi)
【裝幀信息】平裝(光膜)
【版 次】第2版第1次印刷
【頁(yè) 數(shù)】192
【千字?jǐn)?shù)】300
【印 張】12
【定 價(jià)】¥42
【叢 書(shū)】普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材
【備注信息】
簡(jiǎn)介
本書(shū)特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書(shū)
內(nèi) 容 提 要
本書(shū)通過(guò)原理加案例的方式系統(tǒng)講解了HBase分布式存儲(chǔ)系統(tǒng)應(yīng)用,精心安排了HBase原理和架構(gòu)分析、環(huán)境搭建、案例開(kāi)發(fā)、優(yōu)化策略等環(huán)節(jié),使讀者對(duì)解決相關(guān)問(wèn)題有清晰的思路。
全書(shū)共8章:前7章系統(tǒng)講解HBase模型和系統(tǒng)架構(gòu)、數(shù)據(jù)讀寫(xiě)流程、環(huán)境搭建、HBase Shell、程序開(kāi)發(fā)、高級(jí)特性;第8章是HBase MapReduce實(shí)例,通過(guò)實(shí)例幫助讀者進(jìn)一步理解HBase應(yīng)用和MapReduce編程。全書(shū)脈絡(luò)清晰,實(shí)例新穎實(shí)用,內(nèi)容詳實(shí)。
本書(shū)可作為普通高校大數(shù)據(jù)相關(guān)專業(yè)的HBase教材,可供深入了解HBase編程的讀者參考,還可作為相關(guān)培訓(xùn)班的培訓(xùn)教材。
內(nèi)容實(shí)用——理論與實(shí)踐結(jié)合,重點(diǎn)突出應(yīng)用
體系完善——構(gòu)建完整的大數(shù)據(jù)專業(yè)解決方案
產(chǎn)教融合——高校企業(yè)共參與,對(duì)標(biāo)行業(yè)標(biāo)準(zhǔn)
資源豐富——微課、課件、教案、源碼、答案
再版前言
大數(shù)據(jù)帶來(lái)了各種各樣繁雜的數(shù)據(jù),我們不僅要呈現(xiàn)世界,更重要的是通過(guò)呈現(xiàn)來(lái)處理更龐大的數(shù)據(jù),理解各種各樣的數(shù)據(jù)集合,表現(xiàn)多維數(shù)據(jù)之間的關(guān)聯(lián)。換句話說(shuō),就是歸納數(shù)據(jù)內(nèi)在的模式、關(guān)聯(lián)和結(jié)構(gòu)。
由于大數(shù)據(jù)的存儲(chǔ)量極大,因此其存儲(chǔ)設(shè)備需要具有高擴(kuò)展性、高可用性、自動(dòng)容錯(cuò)和低成本等特點(diǎn)。常見(jiàn)的存儲(chǔ)形式有分布式文件系統(tǒng)和分布式數(shù)據(jù)庫(kù),分布式文件系統(tǒng)采用大規(guī)模的分布式存儲(chǔ)節(jié)點(diǎn)來(lái)滿足存儲(chǔ)大量文件的需求,而分布式的非關(guān)系型數(shù)據(jù)庫(kù)則為大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)的處理和分析提供支持。
目前常見(jiàn)的非關(guān)系型數(shù)據(jù)庫(kù)主要有Redis、Tokyo Cabinet、MongoDB、CouchDB、Cassandra、Voldemort和HBase等。本書(shū)將對(duì)HBase進(jìn)行深入研究和探討,其他非關(guān)系型數(shù)據(jù)庫(kù)可以參考相關(guān)書(shū)籍。
本書(shū)共8章,具體內(nèi)容如下。
第1章介紹關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別、HBase的使用場(chǎng)景。
第2章介紹HBase的邏輯模型、物理模型和系統(tǒng)架構(gòu)。
第3章詳細(xì)講解HRegionServer、HRegion和HBase數(shù)據(jù)讀寫(xiě)流程。
第4章介紹HBase的分布式環(huán)境搭建。
第5章介紹如何通過(guò)HBase Shell完成表的管理、數(shù)據(jù)的增刪改查和數(shù)據(jù)遷移。
第6章介紹創(chuàng)建表、數(shù)據(jù)插入、數(shù)據(jù)查詢等基本操作,然后對(duì)Scan查詢、Filter過(guò)濾、行數(shù)統(tǒng)計(jì)、NameSpace開(kāi)發(fā)、計(jì)數(shù)器、協(xié)處理器和HBase快照等高級(jí)應(yīng)用進(jìn)行介紹。
第7章介紹HBase表設(shè)計(jì)、列族設(shè)計(jì)優(yōu)化、讀寫(xiě)性能優(yōu)化策略、HBase集群規(guī)劃。
第8章講解HBase MapReduce編程實(shí)例。
本書(shū)第一版出版以來(lái)得到了上百所院校的使用,收到很多老師的意見(jiàn)反饋,在此表示衷心感謝。本次改版除了對(duì)部分內(nèi)容修訂外,對(duì)軟件版本也進(jìn)行了升級(jí),并增加了課后習(xí)題和微課資源。
本書(shū)由林徐、陳恒、孫帥擔(dān)任主編,馬憲敏、卓雪雪、李紫薇擔(dān)任副主編,參與編寫(xiě)的還有李偉。本書(shū)的編寫(xiě)得到北京百知教育科技有限公司和中國(guó)水利水電出版社的大力支持,在此表示感謝。
由于時(shí)間倉(cāng)促及編者水平有限,書(shū)中難免有疏漏甚至錯(cuò)誤之處,懇請(qǐng)廣大讀者批評(píng)指正。
編 者
2022年9月
第1章 HBase介紹 1
1.1 面向行和面向列存儲(chǔ)對(duì)比 1
1.1.1 面向行存儲(chǔ)的數(shù)據(jù)庫(kù) 1
1.1.2 面向列存儲(chǔ)的數(shù)據(jù)庫(kù) 2
1.1.3 兩種存儲(chǔ)方式的對(duì)比 2
1.2 HDFS分布式存儲(chǔ)的特點(diǎn) 3
1.3 HBase的使用場(chǎng)景 4
本章小結(jié) 6
習(xí)題1 6
第2章 HBase模型和系統(tǒng)架構(gòu) 7
2.1 HBase的相關(guān)概念 7
2.2 HBase的邏輯模型 8
2.3 HBase的物理模型 10
2.4 HBase的特點(diǎn) 10
2.5 HBase的系統(tǒng)架構(gòu) 11
2.5.1 Client 11
2.5.2 ZooKeeper 11
2.5.3 HMaster 12
2.5.4 HRegionServer 13
2.5.5 HRegion 13
本章小結(jié) 13
習(xí)題2 13
第3章 HBase數(shù)據(jù)讀寫(xiě)流程 15
3.1 HRegionServer詳解 15
3.1.1 WAL 16
3.1.2 MemStore 17
3.1.3 BlockCache 18
3.1.4 HFile 18
3.1.5 HRegionServer的恢復(fù) 23
3.1.6 HRegionServer的上線下線 23
3.2 HRegion 24
3.2.1 HRegion分配 24
3.2.2 HRegion Split 24
3.2.3 HRegion Compact 25
3.3 HMaster上線 25
3.4 數(shù)據(jù)讀流程 26
3.4.1 傳統(tǒng)的數(shù)據(jù)讀流程 26
3.4.2 數(shù)據(jù)讀流程的改進(jìn) 27
3.5 數(shù)據(jù)寫(xiě)流程 28
3.6 刪除數(shù)據(jù)流程 28
本章小結(jié) 28
習(xí)題3 29
第4章 HBase環(huán)境搭建 30
4.1 ZooKeeper的安裝 30
4.2 HBase的安裝 31
本章小結(jié) 34
習(xí)題4 35
第5章 HBase Shell 36
5.1 HBase Shell啟動(dòng) 36
5.2 表的管理 37
5.3 表數(shù)據(jù)的增刪改查 44
5.4 HBase數(shù)據(jù)遷移的importtsv的使用 48
本章小結(jié) 49
習(xí)題5 49
第6章 HBase程序開(kāi)發(fā) 53
6.1 表的相關(guān)操作 53
6.2 創(chuàng)建Configuration對(duì)象 57
6.3 創(chuàng)建表 57
6.3.1 開(kāi)發(fā)環(huán)境配置 58
6.3.2 創(chuàng)建表 61
6.4 數(shù)據(jù)插入 63
6.5 數(shù)據(jù)查詢 69
6.6 數(shù)據(jù)刪除 73
6.7 Scan查詢 76
6.8 Filter過(guò)濾 85
6.9 行數(shù)統(tǒng)計(jì) 105
6.10 NameSpace開(kāi)發(fā) 107
6.11 計(jì)數(shù)器 110
6.12 協(xié)處理器 114
6.13 HBase快照 124
本章小結(jié) 129
習(xí)題6 129
第7章 HBase高級(jí)特性 132
7.1 HBase表設(shè)計(jì) 132
7.2 列族設(shè)計(jì)優(yōu)化 136
7.3 寫(xiě)性能優(yōu)化策略 138
7.4 讀性能優(yōu)化策略 139
7.4.1 HBase客戶端優(yōu)化 139
7.4.2 HBase服務(wù)器端優(yōu)化 140
7.4.3 HDFS相關(guān)優(yōu)化 141
7.5 HBase集群規(guī)劃 142
7.5.1 集群業(yè)務(wù)規(guī)劃 142
7.5.2 集群容量規(guī)劃 143
7.5.3 Region規(guī)劃 144
7.5.4 內(nèi)存規(guī)劃 145
本章小結(jié) 149
習(xí)題7 149
第8章 MapReduce On HBase 151
8.1 HBase MapReduce 151
8.2 編程實(shí)例 152
8.2.1 使用MapReduce操作HBase 152
8.2.2 從HBase獲取數(shù)據(jù)上傳至HDFS 155
8.2.3 MapReduce生成HFile入庫(kù)到HBase 157
8.2.4 同時(shí)寫(xiě)入多張表 161
8.2.5 從多個(gè)表讀取數(shù)據(jù) 164
8.2.6 通過(guò)讀取HBase表刪除HBase數(shù)據(jù) 166
8.2.7 通過(guò)讀取HBase表數(shù)據(jù)復(fù)制到另外一張表 168
8.2.8 建立HBase表索引 170
8.2.9 將MapReduce輸出結(jié)果到MySQL 173
8.2.10 利用MapReduce完成MySQL數(shù)據(jù)讀寫(xiě) 178
本章小結(jié) 181
習(xí)題8 181
附錄1 MySQL安裝 183
附錄2 Python連接HBase 185
- 零基礎(chǔ)玩轉(zhuǎn)國(guó)產(chǎn)大模型DeepSeek [徐永冰 張帥 編著]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統(tǒng)項(xiàng)目管理師考試32小時(shí)通關(guān)(適用第4版考綱) [薛大龍]
- 信息系統(tǒng)管理工程師考試32小時(shí)通關(guān)(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測(cè)實(shí)訓(xùn) [洪曉江 達(dá)則曉麗 錢波]
- 科技信息檢索與論文寫(xiě)作實(shí)用教程 [李振華]
- 傳統(tǒng)山水畫(huà)論解讀與實(shí)踐 [陳鈉 著]
- Python數(shù)據(jù)庫(kù)編程 [主編 殷樹(shù)友 邢 翀]
- 計(jì)算機(jī)基礎(chǔ)實(shí)訓(xùn)指導(dǎo) [主編 袁春萍 朱妮]
- 嵌入式人工智能技術(shù)應(yīng)用(數(shù)字教材) [主編 胡娜 楊國(guó)勇 晏廷榮]
- Vienna整流器技術(shù) [桂存兵 著]
- 變頻器與伺服應(yīng)用 [陳剛 葉云飛]
- 物聯(lián)網(wǎng)工程設(shè)計(jì)與實(shí)踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運(yùn)營(yíng)與管理 [鐘肖英 陳瀟]
- Java面向?qū)ο蟪绦蛟O(shè)計(jì) [主編 姜春磊 陳虹潔]
- 信息技術(shù)基礎(chǔ)(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應(yīng)用 [主編 陳 萍 劉培培 陳孟軍]
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo) [主編 劉志堅(jiān)]
- 高級(jí)辦公應(yīng)用項(xiàng)目教程 [主編 屈晶 趙成麗]
- 微信小程序開(kāi)發(fā)項(xiàng)目實(shí)戰(zhàn)(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業(yè)檔案工作實(shí)戰(zhàn)寶典百問(wèn)百答 [華俊 盧秀英 邵甜甜 著]
- 計(jì)算機(jī)網(wǎng)絡(luò)原理及應(yīng)用 [主編 唐繼勇 葉坤 孫夢(mèng)娜]
- 大學(xué)生創(chuàng)業(yè)基礎(chǔ) [主編 王麗莉 王 楊]
- 船舶輔機(jī) [主編 王連海 于洋 姜淑翠]
- 大學(xué)生就業(yè)指導(dǎo) [主編 王麗莉 董宴廷]
- 系統(tǒng)架構(gòu)設(shè)計(jì)師章節(jié)習(xí)題與考點(diǎn)特訓(xùn) [主編 薛大龍 鄒月平]
- 高校學(xué)生工作探索與實(shí)踐 [郭亮 著]
- 大學(xué)生情商管理 [方雄 著]
- 2023年長(zhǎng)沙市會(huì)展業(yè)發(fā)展報(bào)告 [主編 周棟良]
- 生活經(jīng)管more>>
- 云計(jì)算原理
- Python數(shù)據(jù)分析
- 大數(shù)據(jù)技術(shù)導(dǎo)論
- HBase分布式存儲(chǔ)系統(tǒng)應(yīng)用(第二版)
- Hive編程技術(shù)與應(yīng)用(第二版)
- Python 語(yǔ)言程序設(shè)計(jì)實(shí)踐指導(dǎo)
- Spark大數(shù)據(jù)處理技術(shù)
- 數(shù)據(jù)清洗
- R語(yǔ)言基礎(chǔ)及應(yīng)用
- 數(shù)據(jù)庫(kù)原理及應(yīng)用(MySQL版)
- 大數(shù)據(jù)導(dǎo)論
- 大數(shù)據(jù)可視化技術(shù)
- Python語(yǔ)言程序設(shè)計(jì)
- Java編程基礎(chǔ)
- Java編程基礎(chǔ)實(shí)踐指導(dǎo)
- 深度學(xué)習(xí)—卷積神經(jīng)網(wǎng)絡(luò)算法原理與應(yīng)用