SQL Server數(shù)據(jù)挖掘與商業(yè)智能基礎(chǔ)及案例實戰(zhàn)

簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書全面介紹了數(shù)據(jù)挖掘與商業(yè)智能的基本概念與原理,包括經(jīng)典理論與趨勢發(fā)展,并深入敘述了各種數(shù)據(jù)挖掘的技術(shù)與典型應(yīng)用。通過本書的學(xué)習(xí),讀者可以對數(shù)據(jù)挖掘與商業(yè)智能的整體結(jié)構(gòu)、概念、原理、技術(shù)和發(fā)展有深入的了解和認(rèn)識。
本書共四部分:第一部分介紹數(shù)據(jù)倉庫、數(shù)據(jù)挖掘與商業(yè)智能之間的關(guān)系;第二部分對Microsoft SQL Server的整體架構(gòu)進(jìn)行介紹,并詳細(xì)闡述直接與數(shù)據(jù)挖掘相關(guān)的兩個服務(wù):分析服務(wù)和報表服務(wù);第三部分逐一闡述Microsoft SQL Server中包含的九種數(shù)據(jù)挖掘模型;第四部分提供四個數(shù)據(jù)挖掘的案例以及數(shù)據(jù)挖掘模型的評估,通過模仿練習(xí),讀者可獲得實際的數(shù)據(jù)挖掘經(jīng)驗,稍加修改就能在自己所處的領(lǐng)域中加以應(yīng)用。
本書配有案例的相關(guān)素材文件,讀者可以從萬水書苑以及中國水利水電出版社網(wǎng)站下載,網(wǎng)址為:http://www.hzxbc.cn和http://www.waterpub.com.cn/softdown/。
本書為經(jīng)臺灣碁峰資訊股份有限公司獨(dú)家授權(quán)發(fā)行的中文簡體版。本書中文簡體字版在中國大陸之專有出版權(quán)屬中國水利水電出版社所有。在沒有得到本書原版出版者和本書出版者書面許可時,任何單位和個人不得擅自摘抄、復(fù)制本書的一部分或全部以任何方式包括(資料和出版物)進(jìn)行傳播。本書原版版權(quán)屬碁峰資訊股份有限公司。版權(quán)所有,侵權(quán)必究。
Microsoft商業(yè)智能中一項重要的技術(shù)為數(shù)據(jù)挖掘的分析技術(shù),主要是在大量數(shù)據(jù)庫中尋找有意義或有價值的信息的過程。透過機(jī)器學(xué)習(xí)技術(shù)或是統(tǒng)計分析方法論,根據(jù)整合的資料加以分析探索,發(fā)掘出隱含在數(shù)據(jù)中的特性,通過專業(yè)領(lǐng)域知識(Domain Know-how)整合及解釋,從中找出合理且有用的信息,經(jīng)過相關(guān)部門針對該模型的評估后,再提供給相關(guān)決策單位加以運(yùn)用。
近年來,數(shù)據(jù)量的增加速度越來越快,加上商業(yè)智能的運(yùn)用早已受到企業(yè)的重視。將企業(yè)累積的數(shù)據(jù)庫,透過大量的信息與相關(guān)信息的分析,更能找出顧客區(qū)分、消費(fèi)行為、業(yè)務(wù)成本與效率等對企業(yè)極為重要的信息。通過商業(yè)智能的應(yīng)用,使之更深入了解客戶,并可協(xié)助業(yè)務(wù)的開發(fā)以及增加在顧客管理上的有效性。
隨著知識經(jīng)濟(jì)時代來臨,企業(yè)間的競爭模式從傳統(tǒng)的采用壓低成本與價格的殺價流血競爭,到近來倡導(dǎo)以創(chuàng)新為核心競爭力。不論哪一種策略模式,都是不斷在技術(shù)研發(fā)、制造生產(chǎn)、營銷銷售、客戶服務(wù)或資源分配等相關(guān)問題上,尋求問題的發(fā)生原因并嘗試找出解決方案。在不同運(yùn)營階段,陸續(xù)累積的龐大數(shù)據(jù),往往就是答案的隱身之所。因此,如何善用數(shù)據(jù),從運(yùn)營的歷史記錄中,挖掘出深藏其中的寶貴經(jīng)驗(金礦),就是數(shù)據(jù)挖掘(Data Mining)的目的。
相對于其他數(shù)據(jù)庫系統(tǒng)或數(shù)據(jù)挖掘軟件,微軟最新推出的數(shù)據(jù)庫系統(tǒng)Microsoft SQL Server 2014可為您的關(guān)鍵任務(wù)應(yīng)用程序提供突破性的性能、可用性和可管理性。SQL Server 2014 還針對在線事務(wù)處理(OLTP)和數(shù)據(jù)倉庫提供了把核心數(shù)據(jù)庫內(nèi)置于內(nèi)存中 (In-Memory)的新功能,完善了現(xiàn)有數(shù)據(jù)倉庫和商業(yè)智能的功能。借助這些功能,極大提升了企業(yè)在商業(yè)智能處理方面的性能與效率。然而如何充分發(fā)揮Microsoft SQL Server在商業(yè)智能應(yīng)用中的效力,則需要一定的專業(yè)知識和學(xué)習(xí)過程。針對業(yè)界實務(wù)上的需求,我們編寫了這本教程,以期在實務(wù)應(yīng)用和理論方法之間搭建一座橋梁。讓讀者迅速掌握現(xiàn)代商業(yè)智能應(yīng)用的主要內(nèi)容。
Chapter 1 緒論 2
1-1 商業(yè)智能 3
1-1-1 什么是商業(yè)智能 3
1-1-2 商業(yè)智能作用及意義 3
1-1-3 商業(yè)智能架構(gòu) 4
1-1-4 商業(yè)智能中的挑戰(zhàn) 6
1-2 數(shù)據(jù)挖掘 7
1-3 大數(shù)據(jù) 9
1-3-1 何謂大數(shù)據(jù) 9
1-3-2 大數(shù)據(jù)的應(yīng)用 9
1-4 云計算 10
Chapter 2 數(shù)據(jù)倉庫 13
2-1 數(shù)據(jù)倉庫定義 14
2-2 數(shù)據(jù)倉庫特性 14
2-3 數(shù)據(jù)倉庫架構(gòu) 15
2-4 創(chuàng)建數(shù)據(jù)倉庫的目的 17
2-5 數(shù)據(jù)倉庫的運(yùn)用 18
2-6 數(shù)據(jù)倉庫的管理 19
2-7 No SQL數(shù)據(jù)庫 19
2-7-1 Key-Value型數(shù)據(jù)庫 20
2-7-2 內(nèi)存數(shù)據(jù)庫(In-memory Database) 20
2-7-3 文件數(shù)據(jù)庫(Document Database) 20
2-7-4 圖形數(shù)據(jù)庫(Graph Database) 20
2-8 Hadoop 21
Chapter 3 數(shù)據(jù)挖掘簡介 22
3-1 數(shù)據(jù)挖掘的定義 23
3-2 數(shù)據(jù)挖掘的重要性 23
3-3 數(shù)據(jù)挖掘的功能 23
3-4 數(shù)據(jù)挖掘的步驟 24
3-5 數(shù)據(jù)挖掘建模的標(biāo)準(zhǔn)CRISP-DM 25
3-6 數(shù)據(jù)挖掘的應(yīng)用 27
3-7 數(shù)據(jù)挖掘軟件介紹 28
3-8 數(shù)據(jù)挖掘與Excel 30
Chapter 4 數(shù)據(jù)挖掘的主要方法 31
4-1 回歸分析(Regression Analysis) 32
4-1-1 簡單線性回歸分析(Simple Linear
Regression Analysis) 32
4-1-2 多元回歸分析(Multiple Regression
Analysis) 32
4-1-3 脊回歸分析(Ridge Regression
Analysis) 32
4-1-4 邏輯回歸分析(Logistic Regression
Analysis) 34
4-2 關(guān)聯(lián)規(guī)則(Association Rule) 34
4-3 聚類分析(Cluster Analysis) 34
4-4 判別分析(Discriminant Analysis) 36
4-5 神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network) 37
4-6 決策樹(Decision Tree) 39
4-7 其他分析方法 40
Chapter 5 數(shù)據(jù)挖掘與相關(guān)領(lǐng)域的關(guān)系 42
5-1 數(shù)據(jù)挖掘與統(tǒng)計分析 43
5-2 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫 43
5-3 數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(KDD) 44
5-4 數(shù)據(jù)挖掘與OLAP 45
5-5 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) 46
5-6 數(shù)據(jù)挖掘與Web數(shù)據(jù)挖掘 46
5-7 數(shù)據(jù)挖掘、云計算與大數(shù)據(jù) 47
PART II Microsoft SQL Server概述
Chapter 6 Microsoft SQL Server中的商業(yè)智能 49
6-1 Microsoft SQL Server入門 50
6-2 關(guān)系數(shù)據(jù)倉庫 50
6-3 SQL Server 2014概述 51
6-4 SQL Server 2014技術(shù) 52
6-5 SQL Server 2014新增功能 54
Chapter 7 Microsoft SQL Server中的
數(shù)據(jù)挖掘功能 56
7-1 創(chuàng)建商業(yè)智能應(yīng)用程序 57
7-2 Microsoft SQL Server數(shù)據(jù)挖掘功能
的優(yōu)勢 59
7-2-1 易于使用 59
7-2-2 簡單而豐富的API 59
7-2-3 可伸縮性 60
7-2-4 數(shù)據(jù)挖掘算法 60
7-3 Microsoft SQL Server數(shù)據(jù)挖掘算法 61
7-4 Microsoft SQL Server可擴(kuò)展性 62
7-5 Microsoft SQL Server是數(shù)據(jù)挖掘與
商業(yè)智能的結(jié)合 62
7-5-1 數(shù)據(jù)分析 62
7-5-2 報告 63
7-6 使用數(shù)據(jù)挖掘可以解決的問題 63
7-6-1 構(gòu)建挖掘模型 63
7-6-2 構(gòu)建數(shù)據(jù)挖掘應(yīng)用程序 64
7-6-3 DMX范例 65
Chapter 8 Microsoft SQL Server的分析服務(wù)
(Analysis Services) 67
8-1 創(chuàng)建多維數(shù)據(jù)集的結(jié)構(gòu) 68
8-2 建立和部署多維數(shù)據(jù)集 69
8-3 從模板創(chuàng)建自定義的數(shù)據(jù)庫 69
8-4 統(tǒng)一維度模型 70
8-5 基于屬性的維度 71
8-6 維度類型 72
8-7 量度組和數(shù)據(jù)視圖 72
8-8 計算效率 73
8-9 MDX腳本 74
8-10 存儲過程 75
8-11 關(guān)鍵績效指標(biāo)(KPI) 75
8-12 實時商業(yè)智能 76
Chapter 9 Microsoft SQL Server的報表服務(wù)
(Reporting Services) 78
9-1 為何使用報表服務(wù) 79
9-2 報表服務(wù)的功能 80
9-2-1 制作報表 80
9-2-2 管理報表 80
9-2-3 提交報表 81
Chapter 10 Microsoft SQL Server的整合服務(wù) 83
10-1 SSIS介紹 84
10-1-1 DTS與SSIS 84
10-1-2 DTS升級到Integration Services
重點(diǎn) 84
10-1-3 SSIS版本 85
10-1-4 SSIS(SQL Server Integration
Service)架構(gòu)圖 85
10-1-5 Integration Service數(shù)據(jù)流 85
10-1-6 SSIS Designer 87
10-1-7 數(shù)據(jù)流 87
10-1-8 控制流 88
10-2 操作示例 92
10-2-1 將Excel數(shù)據(jù)表導(dǎo)入SQL數(shù)據(jù)庫
中的數(shù)據(jù)表 92
10-2-2 對數(shù)據(jù)進(jìn)行抽樣 103
Chapter 11 Microsoft SQL Server的
DMX語言 114
11-1 DMX語言介紹 115
11-2 DMX函數(shù) 117
11-2-1 模型建立 117
11-2-2 模型訓(xùn)練 118
11-2-3 模型使用(預(yù)測) 118
11-2-4 其他函數(shù)語法 119
11-3 DMX語法 122
11-3-1 決策樹 123
11-3-2 貝葉斯概率分類 124
11-3-3 關(guān)聯(lián)規(guī)則 125
11-3-4 聚類分析 126
11-3-5 時序聚類分析 127
11-3-6 線性回歸分析 127
11-3-7 邏輯回歸 128
11-3-8 神經(jīng)網(wǎng)絡(luò) 129
11-3-9 時序 130
11-4 DMX操作實例 131
11-4-1 分類(classification) 132
11-4-2 評估(estimation) 133
11-4-3 預(yù)測(prediction) 134
11-4-4 關(guān)聯(lián)分組(affinity grouping) 135
11-4-5 聚類分組(clustering) 136
PART III Microsoft SQL Server 中的數(shù)據(jù)挖掘模型
Chapter 12 決策樹模型 138
12-1 基本概念 139
12-2 決策樹與判別函數(shù) 139
12-3 計算方法 140
12-4 操作范例 142
Chapter 13 貝葉斯分類器 152
13-1 基本概念 153
13-2 操作范例 155
Chapter 14 關(guān)聯(lián)規(guī)則 166
14-1 基本概念 167
14-2 關(guān)聯(lián)規(guī)則的種類 168
14-3 關(guān)聯(lián)規(guī)則的算法:Apriori算法 168
14-4 操作范例 169
Chapter 15 聚類分析 179
15-1 基本概念 180
15-2 層級聚類法與動態(tài)聚類法 180
15-3 操作范例 185
Chapter 16 時序聚類 197
16-1 基本概念 198
16-2 主要算法 198
16-3 操作示例 200
Chapter 17 線性回歸模型 210
17-1 基本概念 211
17-2 一元回歸模型 212
17-2-1 模型假設(shè)及推估 212
17-2-2 回歸模型測試 215
17-3 多元回歸模型 216
17-3-1 回歸效果的評估 216
17-3-2 回歸變量的選擇 218
17-4 操作范例 219
Chapter 18 邏輯回歸模型 228
18-1 基本概念 229
18-2 logit變換與logistic分布 229
18-3 邏輯回歸模型 231
18-4 操作范例 232
Chapter 19 人工神經(jīng)網(wǎng)絡(luò)模型 242
19-1 基本概念 243
19-2 神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn) 245
19-3 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)劣比較 245
19-4 操作范例 247
Chapter 20 時序模型 257
20-1 基本概念 258
20-2 時序的構(gòu)成 260
20-3 簡單時序的預(yù)測 266
20-4 包含趨勢與季節(jié)成分的時序預(yù)測 268
20-5 參數(shù)化的時序預(yù)測模型 270
20-6 操作范例 274
PART IV Microsoft SQL Server數(shù)據(jù)挖掘應(yīng)用實例
Chapter 21 決策樹模型實例 285
Chapter 22 邏輯回歸模型實例 293
22-1 回歸模型實例一:腎細(xì)胞癌轉(zhuǎn)移
的回歸模型 294
22-2 回歸模型實例二:高中升學(xué)數(shù)據(jù)
的回歸模型 300
22-3 回歸模型實例三 306
Chapter 23 神經(jīng)網(wǎng)絡(luò)模型實例 312
23-1 實例一:腎細(xì)胞癌轉(zhuǎn)移的神經(jīng)
網(wǎng)絡(luò)模型 313
23-2 實例二:電信行業(yè)神經(jīng)網(wǎng)絡(luò)模型 319
Chapter 24 時序模型實例 332
24-1 實例一:電力負(fù)載的時序模型 333
24-2 實例二:進(jìn)出品貨物價值的
時序模型 338
Chapter 25 如何評估數(shù)據(jù)挖掘模型 344
25-1 評估圖節(jié)點(diǎn)Evaluation Chart
Node介紹 345
25-2 在SQL Server中如何評估模型 348
25-3 規(guī)則度量:支持度與可信度 353
25-4 結(jié)論 355
- 信息技術(shù)基礎(chǔ)(麒麟操作系統(tǒng)+WPS Office) [主編 芮雪 蔣莉 王亮亮]
- Office高級應(yīng)用項目式教程(第2版) [主編 李觀金 張倩文 黎夏克 ]
- 巧用翻譯學(xué)英語:英漢互譯500例 [王學(xué)文 著]
- 高等教育多維評價體系構(gòu)建與高質(zhì)量發(fā)展研究 [張妍 著]
- 系統(tǒng)規(guī)劃與管理師章節(jié)習(xí)題與考點(diǎn)特訓(xùn)(第二版) [主編 薛大龍]
- 計算機(jī)操作系統(tǒng)實踐指導(dǎo)(openEuler版) [主編 秦光 曾陳萍 岳付強(qiáng)]
- 信息系統(tǒng)管理工程師真題及模考卷精析(適用機(jī)考) [主 編 薛大龍 程 剛 上官緒]
- 航海類院校體育教育教學(xué)研究 [張利超 李寧 著]
- 新時代背景下我國職業(yè)教育產(chǎn)教融合長效機(jī)制建設(shè)研究 [王玉賢 著]
- 電路分析 [主編 李飛 毛先柏]
- 信息系統(tǒng)管理工程師(適用第2版大綱)一站通關(guān) [指尖瘋 編著]
- 傳統(tǒng)山水畫論解讀與實踐 [陳鈉 著]
- 網(wǎng)絡(luò)工程師備考一本通(適配第6版考綱) [夏杰 編著]
- 陳孝云的職教理想與情懷 [祝吉太 江傳瑞 張義廷 著]
- 地方本科院校電子信息學(xué)科課程思政案例集 [王甫]
- Excel數(shù)據(jù)處理與分析(第二版) [主編 張志明 鄒 蕾]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 倉儲管理實務(wù)(第二版) [周寧武 編著]
- 基于AE與C#的地理信息系統(tǒng)二次開發(fā) [李小根 賈艷昌 喬翠平 姜彤 ]
- 2023年長沙市文化和旅游業(yè)發(fā)展報告 [主編 陳莉]
- 舞臺化妝造型設(shè)計 [主編 劉思彤 張 濤 張憶雨]
- 產(chǎn)教融合視角高校體育專業(yè)實踐教學(xué)體系構(gòu)建研究 [楊柳青 葉華兵 著]
- 知識圖譜及應(yīng)用案例 [張善文 黃文準(zhǔn) 于長青 陳明淑]
- Python程序設(shè)計案例教程(微課版) [主編 石利平 田輝平 余以勝]
- 皓月繁星:青少年兒童心理成長手冊 [主 編 林贊歌 副主編 杜志南]
- 材料力學(xué) [章寶華 趙新勝 徐斌]
- 系統(tǒng)集成項目管理工程師考試32小時通關(guān)(第3版) [主編 薛大龍 副主編 上官緒陽]
- 軟考論文高分特訓(xùn)與范文10篇——系統(tǒng)分析師(第二版) [薛大龍 鄒月平 施游]
- 黃河海勃灣水利樞紐防凌安全運(yùn)行 [王戰(zhàn)領(lǐng) 王叢發(fā) 范瑜彬 著]
- 大學(xué)生心理健康教育 [方雄 著]