R語言基礎(chǔ)及應用

-
【作 者】主 編 涂旭東 黃源
【I S B N 】978-7-5170-9567-5
【責任編輯】石永峰
【適用讀者群】本專通用
【出版時間】2021-05-22
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數(shù)】240
【千字數(shù)】374
【印 張】15
【定 價】¥45
【叢 書】普通高等教育數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)教材
【備注信息】
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書以理論與實踐操作相結(jié)合的方式深入講解R語言的基本理論和實現(xiàn)方法,在內(nèi)容設計上既有上課時老師講述的部分(包括詳細的理論與典型的案例),又有最新的實訓案例分析,雙管齊下,極大地激發(fā)了學生的學習積極性和主動創(chuàng)造性,增加了趣味性,讓學生在課堂上跟上老師的思維,從而學到更多的知識和技能。
本書的編寫目的是向讀者介紹R語言的基本概念與應用。本書共9章:R語言簡介、數(shù)據(jù)類型與數(shù)據(jù)對象、控制語句與函數(shù)、數(shù)據(jù)的讀寫與預處理、R語言基本圖形、ggplot2繪圖基礎(chǔ)和R語言高級繪圖、R語言數(shù)據(jù)分析基礎(chǔ)、R語言機器學習基礎(chǔ)、R語言訪問SQL數(shù)據(jù)庫。
本書可作為大數(shù)據(jù)專業(yè)、人工智能專業(yè)、云計算專業(yè)的教材,也可作為大數(shù)據(jù)愛好者的參考書。
內(nèi)容實用——理論與實踐結(jié)合,重點突出應用
體系完善——構(gòu)建完整的大數(shù)據(jù)專業(yè)解決方案
產(chǎn)教融合——高校企業(yè)共參與,對標行業(yè)標準
資源豐富——微課、課件、教案、源碼、答案
大數(shù)據(jù)作為新一輪工業(yè)革命中最為活躍的技術(shù)創(chuàng)新要素正在對全球競爭、國家治理、經(jīng)濟發(fā)展、產(chǎn)業(yè)轉(zhuǎn)型、社會生活等產(chǎn)生全面而深刻的影響;移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡、數(shù)字家庭、電子商務等新一代信息技術(shù)的應用每天都在源源不斷地產(chǎn)生大量的數(shù)據(jù),對大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應用的結(jié)合點。而靈活性、開放性、優(yōu)秀的統(tǒng)計分析能力和卓越的繪圖功能、收錄超過1.4萬個數(shù)據(jù)分析工具包、幾乎涵蓋各個行業(yè)數(shù)據(jù)分析中的所有方法使R語言成為大數(shù)據(jù)時代的新寵,越來越被學界和業(yè)界所重視,多種大數(shù)據(jù)架構(gòu)平臺上已經(jīng)提供基于R語言的擴展和插件。借助R語言的高效性,大數(shù)據(jù)分析可實現(xiàn)事半功倍。
本書以理論與實踐操作相結(jié)合的方式深入講解R語言的基本理論和實現(xiàn)方法,在內(nèi)容設計上既有上課時老師講述的部分(包括詳細的理論與典型的案例),又有最新的實訓案例分析,雙管齊下,極大地激發(fā)了學生的學習積極性和主動創(chuàng)造性,增加了趣味性,讓學生在課堂上跟上老師的思維,從而學到更多的知識和技能。
本書特色如下:
(1)采用“理實一體化”教學方式:課堂上既有老師的講述內(nèi)容又有學生獨立思考、上機操作的內(nèi)容。
(2)豐富的教學案例:包含教學課件、習題答案等多種教學資源。
(3)緊跟時代潮流,關(guān)注最新技術(shù)和前沿熱點,書中既包含最新熱點數(shù)據(jù)的案例分析,又包含唯美的數(shù)據(jù)可視化技術(shù)。
(4)編寫本書的老師都具有多年教學經(jīng)驗,做到重難點突出,能夠激發(fā)學生的學習熱情。
(5)配有微課視頻:對本書中的重難點進行細致講解,方便學生課后學習。
本書可作為大數(shù)據(jù)專業(yè)、人工智能專業(yè)、云計算專業(yè)的教材,也可作為大數(shù)據(jù)愛好者的參考書。
本書建議學時為60學時,具體分布見下表。
章節(jié) 建議學時
R語言簡介 2
數(shù)據(jù)類型與數(shù)據(jù)對象 6
控制語句與函數(shù) 8
數(shù)據(jù)的讀寫與預處理 12
R語言基本圖形 6
ggplot2繪圖基礎(chǔ)和R語言高級繪圖 8
R語言數(shù)據(jù)分析基礎(chǔ) 8
R語言機器學習基礎(chǔ) 6
R語言訪問SQL數(shù)據(jù)庫 4
本書由涂旭東、黃源任主編。其中,黃源編寫第1章、第2章和第8章并負責策劃與統(tǒng)稿工作,涂旭東編寫第3章至第7章和第9章。
本書是校企合作的結(jié)果,在編寫過程中得到重慶譽存大數(shù)據(jù)有限公司黃遠江博士的大力支持,同時編者參閱了大量相關(guān)資料,在此一并表示感謝。
由于編者水平有限,書中難免存在疏漏甚至錯誤之處,懇請讀者批評指正,編者電子郵箱:2103069667@qq.com。
編 者
2021年2月
1.1 R語言概述 2
1.1.1 什么是R語言 2
1.1.2 R語言的特點 2
1.2 R的下載與運行 2
1.2.1 R的下載 3
1.2.2 R的運行 4
1.2.3 在R中查看幫助 6
1.3 R語言包 8
1.3.1 R語言包的安裝 9
1.3.2 R語言包的載入 9
1.3.3 R語言包的使用 9
1.4 實訓 10
1.5 本章小結(jié) 11
練習1 11
第2章 數(shù)據(jù)類型與數(shù)據(jù)對象 12
2.1 數(shù)據(jù)類型 13
2.1.1 什么是數(shù)據(jù)類型 13
2.1.2 常見的數(shù)據(jù)類型 13
2.2 變量與標量 14
2.2.1 變量 14
2.2.2 標量 15
2.3 R語言中的數(shù)據(jù)對象 16
2.3.1 向量 16
2.3.2 矩陣 20
2.3.3 數(shù)組 23
2.3.4 列表 24
2.3.5 因子 26
2.3.6 數(shù)據(jù)框 26
2.4 R語言中數(shù)據(jù)類型的轉(zhuǎn)換 31
2.4.1 類型轉(zhuǎn)換函數(shù)介紹 31
2.4.2 R中數(shù)據(jù)類型轉(zhuǎn)換實例 32
2.5 實訓 32
2.6 本章小結(jié) 33
練習2 34
第3章 控制語句與函數(shù) 35
3.1 條件結(jié)構(gòu) 36
3.1.1 條件表達式 36
3.1.2 if語句 36
3.1.3 switch語句 38
3.2 循環(huán)結(jié)構(gòu) 39
3.2.1 for循環(huán) 39
3.2.2 while循環(huán) 40
3.2.3 break語句 40
3.2.4 repeat語句 40
3.3 函數(shù) 41
3.3.1 自定義R函數(shù) 41
3.3.2 返回值 42
3.3.3 函數(shù)的參數(shù) 42
3.3.4 程序的向量化實現(xiàn) 43
3.3.5 apply()函數(shù)族 44
3.3.6 養(yǎng)成良好的代碼編寫習慣 49
3.4 實訓 49
3.5 本章小結(jié) 51
練習3 51
第4章 數(shù)據(jù)的讀寫與預處理 53
4.1 數(shù)據(jù)的輸入 54
4.1.1 工作目錄 54
4.1.2 向量的輸入 54
4.1.3 數(shù)據(jù)文件的讀取 55
4.1.4 讀取數(shù)據(jù)文件的注意事項 57
4.2 數(shù)據(jù)的輸出 58
4.2.1 屏幕輸出 58
4.2.2 向量的輸出 58
4.2.3 數(shù)據(jù)文件的輸出 59
4.3 R工作空間的保存和加載 61
4.3.1 R工作空間的保存 61
4.3.2 R工作空間的加載 61
4.4 變量的預處理 62
4.4.1 變量重編碼 62
4.4.2 變量重命名 63
4.4.3 變量的排序 63
4.4.4 變量類型的轉(zhuǎn)換 64
4.5 字符串的處理 65
4.5.1 字符串分割 65
4.5.2 字符串拼接 66
4.5.3 字符串長度計算 67
4.5.4 字符串截取 68
4.5.5 字符串替換 69
4.5.6 字符串大小寫轉(zhuǎn)換 70
4.5.7 字符串匹配 71
4.5.8 字符串格式化輸出 72
4.5.9 使用stringr包處理字符串 73
4.6 日期變量的處理和轉(zhuǎn)換 75
4.6.1 取系統(tǒng)日期和時間 75
4.6.2 把字符串解析成日期和時間 76
4.6.3 把日期和時間解析成字符串 76
4.6.4 對日期中相關(guān)信息的提取與比較 77
4.6.5 使用lubridate包處理日期變量 77
4.7 清洗重復數(shù)據(jù) 80
4.7.1 查找是否有重復值 80
4.7.2 查找重復值的索引值 80
4.7.3 去除重復值 81
4.8 缺失數(shù)據(jù)處理 81
4.8.1 缺失數(shù)據(jù)的識別 81
4.8.2 缺失數(shù)據(jù)的處理 82
4.9 異常值識別和處理 83
4.9.1 簡單統(tǒng)計量分析 83
4.9.2 根據(jù)3σ原則檢測異常值 84
4.9.3 根據(jù)箱型圖檢測異常值 84
4.9.4 蓋帽法 85
4.10 數(shù)據(jù)集的合并與拆分 86
4.10.1 數(shù)據(jù)集的合并 86
4.10.2 數(shù)據(jù)集的拆分 89
4.10.3 數(shù)據(jù)集的抽取 89
4.10.4 使用tidyr包 92
4.11 實訓 94
4.12 本章小結(jié) 99
練習4 99
第5章 R語言基本圖形 100
5.1 R語言常見圖形 101
5.1.1 散點圖 101
5.1.2 點圖 102
5.1.3 折線圖 102
5.1.4 曲線圖 103
5.1.5 條形圖 104
5.1.6 餅圖 105
5.1.7 箱線圖 107
5.1.8 直方圖 109
5.2 R語言圖形修飾 109
5.2.1 設置符號和線條 110
5.2.2 設置顏色 111
5.2.3 設置文本屬性 111
5.2.4 添加標題 112
5.2.5 添加圖例 113
5.2.6 添加線 113
5.2.7 添加坐標軸 115
5.2.8 添加文本標注 115
5.3 圖形的布局和保存 116
5.3.1 一頁多圖 116
5.3.2 保存圖形 117
5.4 實訓 117
5.5 本章小結(jié) 123
練習5 123
第6章 ggplot2繪圖基礎(chǔ)和R語言高級繪圖 125
6.1 ggplot2繪圖基礎(chǔ) 126
6.1.1 數(shù)據(jù)(Data) 126
6.1.2 映射(Mapping) 127
6.1.3 幾何對象(Geometric) 128
6.1.4 標尺(Scale) 131
6.1.5 統(tǒng)計變換(Statistics) 132
6.1.6 坐標系統(tǒng)(Coordinate) 133
6.1.7 圖層(Layer) 134
6.1.8 分面(Facet) 135
6.1.9 主題(Theme) 135
6.1.10 ggplot2繪圖的一般步驟 136
6.2 R語言高級繪圖 136
6.2.1 散點圖矩陣 136
6.2.2 關(guān)系矩陣圖和相關(guān)系數(shù)矩陣 137
6.2.3 橢圓 138
6.2.4 三維散點圖 139
6.2.5 氣泡圖 139
6.2.6 網(wǎng)絡圖 140
6.2.7 馬賽克圖 141
6.2.8 關(guān)鍵字云 142
6.2.9 雷達圖 143
6.2.10 山巒圖 144
6.2.11 交互圖 146
6.3 實訓 146
6.4 本章小結(jié) 155
練習6 155
第7章 R語言數(shù)據(jù)分析基礎(chǔ) 156
7.1 描述性統(tǒng)計分析 157
7.1.1 常用統(tǒng)計量簡介 157
7.1.2 描述性統(tǒng)計的函數(shù)實現(xiàn) 159
7.2 R語言數(shù)據(jù)分析常用函數(shù) 161
7.3 t-檢驗 164
7.3.1 單樣本t-檢驗 164
7.3.2 配對樣本t-檢驗 165
7.4 相關(guān)分析 166
7.4.1 相關(guān)性概念 166
7.4.2 相關(guān)分析 167
7.5 聚類分析 169
7.5.1 聚類分析的概念 169
7.5.2 計算樣本間的距離 169
7.5.3 計算類與類之間的距離 171
7.5.4 相似系數(shù) 171
7.5.5 聚類分析的主要步驟 172
7.5.6 分層聚類 172
7.5.7 k-means聚類 173
7.5.8 聚類分析的實現(xiàn) 174
7.6 主成分分析 175
7.6.1 主成分分析的基本思想 175
7.6.2 主成分分析的幾何解釋 176
7.6.3 主成分分析的數(shù)學模型 177
7.6.4 主成分分析的實現(xiàn) 177
7.7 實訓 179
7.8 本章小結(jié) 182
練習7 183
第8章 R語言機器學習基礎(chǔ) 184
8.1 機器學習概述 185
8.1.1 認識機器學習 185
8.1.2 機器學習的應用 185
8.2 機器學習分類 186
8.2.1 監(jiān)督學習 186
8.2.2 無監(jiān)督學習 187
8.2.3 半監(jiān)督學習 188
8.3 機器學習常用算法 189
8.3.1 線性回歸 189
8.3.2 邏輯回歸 196
8.3.3 聚類 201
8.3.4 神經(jīng)網(wǎng)絡 204
8.4 機器學習基本流程 206
8.4.1 數(shù)據(jù)的收集 206
8.4.2 數(shù)據(jù)預處理與特征工程 208
8.4.3 模型的選擇與訓練 209
8.4.4 模型的評估 209
8.5 實訓 210
8.6 本章小結(jié) 214
練習8 214
第9章 R語言訪問SQL數(shù)據(jù)庫 215
9.1 R語言訪問數(shù)據(jù)庫的基本原理 216
9.2 R語言訪問SQLite數(shù)據(jù)庫 216
9.3 R語言訪問MySQL數(shù)據(jù)庫 219
9.4 R語言訪問Oracle數(shù)據(jù)庫 222
9.5 ODBC和RODBC包介紹 224
9.6 實訓 227
9.7 本章小結(jié) 229
練習9 230
參考文獻 231
- 庭院風骨—樹、灌、籬 [創(chuàng)意房主 著]
- Python語言程序設計教程 [郭其標 房宜汕]
- 微積分(經(jīng)管類)教程篇(下冊) [曹海軍 王海棠 周玲麗]
- 微積分(經(jīng)管類)教程篇(上冊) [曹海軍 王海棠 周玲麗]
- 微積分(經(jīng)管類)導學篇(上冊) [王海棠 曹海軍 周玲麗]
- 網(wǎng)站前端技術(shù)案例教程(HTML+CSS+JavaScript)(第二版) [黃華升]
- 線性代數(shù) [主編 史昱 陳鳳欣]
- 電力電子技術(shù)課程學習及實驗指導 [主編 陳榮]
- 成長對話:青春的榜樣 [主編 施端銀 黃武剛 應巨林]
- 人工智能應用基礎(chǔ) [主編 楊纓 李佳]
- 中華水文化(慕課版)(第二版) [畢雪燕 楊華軻 羅玲誼 等編著]
- 電路與電子技術(shù)Ⅱ——電路分析基礎(chǔ) [主編 陳曉 金哲]
- 飛機維修專業(yè)英語——飛機系統(tǒng)(第二版) [趙迎春]
- 英語大爆炸:跟趣味情景劇學口語(微課版) [秦然 編著]
- 機械工程制圖任務跟蹤訓練 [主編 王瑞清 趙金考 周彥云 ]
- 機械工程制圖 [主編 覃國萍 劉百順 禹晨]
- 平面設計與制作項目化教程 [主編 李晨]
- 后期影像剪輯技術(shù) [主編 郭建偉]
- 人工智能概論(第二版) [主編 任云暉 丁紅 徐迎春 ]
- 信息時代美育之道 [主編 劉宏宇 黎婭]
- 數(shù)字媒體交互設計項目式教程(微課版) [主編 蘇陸]
- 動畫運動規(guī)律項目實例解析(微課版) [孫珊珊 袁維坤]
- 自然語言處理 [主編 馮建周]
- 新媒體內(nèi)容創(chuàng)作實務(微課版) [主編 覃思源]
- 人工智能基礎(chǔ) [主編 余平 張春陽]
- 人工智能導論 [主編 王飛 潘立武]
- Amazing!兒童英語自然拼讀分級教材(全8冊) [王玲 編著]
- Spark大數(shù)據(jù)處理技術(shù) [主編 劉仁山 周洪翠 莊新妍]
- 毫無PS痕跡—你的第一本Photoshop書(第二版) [趙鵬 著]
- 電視新聞制作(活頁式) [主編 王曉翠 劉傳琳]