Python機器學習技術與應用

-
【作 者】主 編 王路漫 齊惠穎
【I S B N 】978-7-5226-1100-6
【責任編輯】趙佳琦
【適用讀者群】本科
【出版時間】2023-02-08
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數】240
【千字數】384
【印 張】15
【定 價】¥49
【叢 書】普通高等教育人工智能專業系列教材
【備注信息】
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
內 容 提 要
本書以機器學習初學者為教學對象,通過講解機器學習的常用方法及實際應用,培養讀者機器學習應用技能及計算思維能力。本書共12章,主要內容包括機器學習概述、Python語言基礎、網絡爬蟲、數據預處理與特征工程、多元回歸分析、分類方法、支持向量機、樸素貝葉斯方法、聚類分析方法、人工神經網絡與深度學習、數據可視化、基于Pyecharts的大數據可視化圖表。
本書內容豐富、圖文并茂,以數據分析流程為主線,算法與應用相結合,系統講解常用的機器學習理論和分析方法,通過案例幫助讀者快速掌握機器學習相關技術,以實現理論與實踐的緊密結合。
本書可以作為高等學校各類專業的機器學習通識課程教材,或計算機類專業學生的必修課教材,也可供對機器學習感興趣的相關人員閱讀。
本書配有習題答案,讀者可從中國水利水電出版社網站(www.waterpub.com.cn)或萬水書苑網站(www.hzxbc.cn)免費下載。
內容全面 循序漸進地引導讀者掌握機器學習的常用方法。
案例實用 以實際問題為案例,提升計算思維能力。
資源豐富 講解視頻、程序源碼、習題答案等資源,方便讀者學習使用。
前 言
機器學習是人工智能的一個重要分支,被廣泛應用于大數據相關的諸多領域,深入推動了各個行業的創新與變革。對于當今的高校學生,全面理解且有效運用機器學習方法是十分必要的。面對新時代的發展需求,為培養學生應對時代變革所需的能力,從2015年開始北京大學醫學部面向本科生和研究生開設多門機器學習相關選修課,同時將機器學習的相關內容融入到本科生的“大學計算機”這門必修課中。多位老師花費大量時間和精力進行課程的建設和改革,形成完整的教學內容及豐富的案例式教學課程資源,這些課程深受學生的喜愛。因此我們反復對課程實施過程中的教學資源及教學經驗進行梳理總結,并編寫整理成書,為更多高校的教育教學提供參考。
本書面向各領域的實際問題需求,以培養學生的計算思維能力為目標,以全新的視角組織內容,按照數據分析的流程,通過機器學習方法和應用實踐相結合的方式深入講解常用算法。
本書既注重思維培養,又兼顧應用需求,在通俗易懂的前提下,追求知識體系的系統性,盡可能全面展示機器學習的方法及應用。
本書具有以下特點:
1. 內容全面。以機器學習的角度,按照數據分析的流程組織內容,循序漸進地引導讀者掌握機器學習的常用方法,逐步培養讀者的數據素養。
2. 案例實用。本書選用實際問題作為案例,以Python語言為載體,讓讀者通過簡單的代碼輕松實現機器學習的整個過程,解決實際問題,快速獲得計算思維能力的提升。
3. 資源豐富。本書提供重點例題的講解視頻⒊絳蛟綽搿⑾疤獾榷嘀紙萄ё試矗枋櫓邢嚶ξ恢玫畝肟梢栽諳吖劭礎⒀啊�
4. 作者團隊優秀。編寫本書的教師都具有多年的一線教學經驗,本書重難點突出,能夠激發學生的學習熱情。
本書由王路漫、齊惠穎任主編,張愛桃、王靜、殷蜀梅、周瑜任副主編。參編人員撰寫任務情況如下:第1、6、11章由王路漫編寫,第2章由王晨編寫,第3章由齊惠穎編寫,第4章由楊莉編寫,第5、8章由張愛桃編寫,第7、10章由王靜編寫,第9章由周瑜編寫,第12章由殷蜀梅編寫。王路漫、周瑜和焦影倩共同完成本書的統稿和定稿工作。
此外,中國水利水電出版社的有關負責同志對本書的出版給予了大力支持,特別是周益丹副編審,在本書的策劃和寫作中,提出了寶貴的意見,在此深表感謝。
由于編者水平有限,書中難免出現遺漏和不當之處,敬請讀者提出寶貴建議,批評指正!
王路漫
2022年6月
第1章 機器學習概述 1
1.1 機器學習的概念 1
1.2 機器學習的分類 2
1.2.1 實際問題的分類 2
1.2.2 根據訓練方法進行分類 2
1.3 機器學習的開發流程 3
1.4 機器學習的應用 4
本章小結 6
習 題 6
第2章 Python語言基礎 7
2.1 Python語言概述 7
2.1.1 Python簡介 7
2.1.2 Python優勢 7
2.2 Python環境配置與使用 8
2.2.1 Anaconda的安裝方法 8
2.2.2 Spyder的環境介紹 12
2.2.3 第三方庫的安裝方法 13
2.3 數據分析相關庫的介紹 15
2.3.1 NumPy庫 15
2.3.2 Pandas庫 19
2.3.3 Sklearn庫 22
本章小結 24
習 題 24
第3章 網絡爬蟲 26
3.1 網絡爬蟲基本知識 26
3.1.1 網絡爬蟲簡介 26
3.1.2 HTTP協議 28
3.1.3 HTML語言 32
3.1.4 CSS樣式表 33
3.1.5 JavaScript腳本 34
3.2 網頁內容獲取方法 35
3.2.1 requests主要方法 35
3.2.2 response對象 39
3.3 網頁內容解析方法 40
3.3.1 BeautifulSoup 40
3.3.2 正則表達式 46
3.4 數據存儲 50
3.4.1 TXT格式存儲 51
3.4.2 JSON格式存儲 51
3.4.3 CSV格式存儲 52
3.4.4 圖片文件存儲 52
本章小結 52
習 題 53
第4章 數據預處理與特征工程 54
4.1 數據預處理的主要方法 54
4.1.1 刪除數據 54
4.1.2 缺失值處理 56
4.1.3 重復值處理 60
4.1.4 異常值處理 62
4.1.5 數據類型的轉換 62
4.2 特征選擇的主要方法 64
4.2.1 過濾法 64
4.2.2 包裹法 67
4.2.3 嵌入法 68
4.3 數據預處理與特征工程綜合實例
——Titanic生存分析 68
本章小結 73
習 題 73
第5章 多元回歸分析 75
5.1 多元線性回歸 75
5.1.1 線性回歸的基本原理 75
5.1.2 多元線性回歸的實現 79
5.1.3 回歸模型的評估指標 81
5.2 多重共線性問題 83
5.2.1 多重共線性的定義 83
5.2.2 嶺回歸 85
5.2.3 Lasso回歸 89
5.3 非線性回歸——多項式回歸 91
5.3.1 多項式回歸的基本概念 92
5.3.2 多項式回歸的實現 93
5.4 Logistic回歸 94
5.4.1 Logistic回歸模型 94
5.4.2 Logistic回歸參數估計 96
5.4.3 Logistic回歸評估指標 98
5.4.4 應用實例 100
本章小結 103
習 題 103
第6章 分類方法 106
6.1 分類方法概述 106
6.2 決策樹 107
6.2.1 決策樹方法的基本概念 107
6.2.2 決策樹方法的工作方式 108
6.2.3 屬性選擇的度量 109
6.2.4 決策樹算法——ID3算法 110
6.2.5 Sklearn中決策樹算法的實現 110
6.2.6 決策樹算法應用實例 113
6.3 隨機森林 117
6.3.1 隨機森林概述 117
6.3.2 Sklearn中隨機森林算法的實現 118
6.3.3 隨機森林算法應用實例 118
6.4 分類算法評估 122
6.4.1 評估準則 122
6.4.2 評估過程 122
6.4.3 評估方法 123
6.4.4 評估實例 124
本章小結 125
習 題 125
第7章 支持向量機 126
7.1 支持向量機算法概述 126
7.2 SVM的分類實現方法及案例 129
7.2.1 SVC支持向量分類算法 129
7.2.2 NuSVC支持向量分類算法 131
7.2.3 LinearSVC線性支持向量分類算法 133
7.3 SVM的回歸實現方法及案例 135
7.3.1 SVR回歸實現方法 135
7.3.2 NuSVR回歸實現方法 137
7.3.3 LinearSVR回歸實現方法 138
7.4 SVM異常檢測的實現方法 139
7.5 SVM實戰——人臉識別 140
7.5.1 導入并顯示數據集 141
7.5.2 SVM分類器模型選擇和優化 142
本章小結 144
習 題 144
第8章 樸素貝葉斯方法 146
8.1 樸素貝葉斯方法概述 146
8.1.1 貝葉斯定理 146
8.1.2 樸素貝葉斯方法原理 147
8.2 不同分布下的貝葉斯方法 148
8.2.1 高斯樸素貝葉斯方法 148
8.2.2 多項式樸素貝葉斯方法 150
8.3 樸素貝葉斯實例——文本分類 152
8.4 概率類模型評估的評估指標 154
8.4.1 布利爾分數 155
8.4.2 對數損失函數 156
8.4.3 可靠性曲線 156
本章小結 158
習 題 159
第9章 聚類分析方法 161
9.1 聚類分析方法與無監督學習 161
9.1.1 聚類分析方法 161
9.1.2 聚類分析和分類分析的區別 162
9.2 k-均值聚類算法 162
9.2.1 k-均值聚類算法概述 162
9.2.2 距離度量 163
9.2.3 Sklearn中k-均值聚類算法的實現 164
9.2.4 k-均值聚類算法的優缺點 166
9.3 密度聚類算法 167
9.3.1 密度聚類算法概述 167
9.3.2 DBSCAN算法的實現 169
9.4 聚類算法的評估 170
9.4.1 確定聚類簇數k 170
9.4.2 評估聚類質量 172
9.5 聚類算法實例 174
本章小結 177
習 題 178
第10章 人工神經網絡與深度學習 179
10.1 人工神經網絡與深度學習概述 179
10.2 人工神經網絡的原理 181
10.2.1 人工神經元模型 181
10.2.2 人工神經網絡模型 185
10.2.3 人工神經網絡算法 186
10.3 BP神經網絡 186
10.3.1 BP神經網絡的模型 187
10.3.2 BP神經網絡的學習算法 187
10.3.3 BP神經網絡的設計 188
10.4 人工神經網絡的實現方法 189
10.4.1 MLPClassifier介紹 189
10.4.2 MLPClassifier案例 190
10.5 人工神經網絡算法實戰——人臉識別 195
10.5.1 導入數據集并進行數據集劃分 196
10.5.2 優化MLP分類器模型 196
10.5.3 MLP分類器模型預測 200
本章小結 201
練 習 201
第11章 數據可視化 202
11.1 數據可視化的概念及分類 202
11.2 使用Matplotlib庫進行圖表的繪制 204
11.2.1 圖表的主要元素及繪制步驟 204
11.2.2 簡單圖表繪制 206
11.2.3 多圖組合繪制 214
本章小結 216
習 題 217
第12章 基于Pyecharts的大數據可視化圖表 218
12.1 Pyecharts概述 218
12.1.1 Pyecharts的簡介 218
12.1.2 Pyecharts的主要繪制步驟 218
12.2 基于文本數據生成詞云圖 221
12.2.1 利用Pyecharts繪制英文詞云圖 221
12.2.2 利用jieba繪制中文詞云圖 222
12.3 基于結構化數據生成立體交互式圖表 223
12.4 基于JSON格式文件繪制桑基圖 225
12.5 繪制圓形關系圖 227
本章小結 229
習 題 229
參考文獻 230
- 零基礎玩轉國產大模型DeepSeek [徐永冰 張帥 編著]
- 網絡工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統項目管理師考試32小時通關(適用第4版考綱) [薛大龍]
- 信息系統管理工程師考試32小時通關(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實訓 [洪曉江 達則曉麗 錢波]
- 科技信息檢索與論文寫作實用教程 [李振華]
- 傳統山水畫論解讀與實踐 [陳鈉 著]
- Python數據庫編程 [主編 殷樹友 邢 翀]
- 計算機基礎實訓指導 [主編 袁春萍 朱妮]
- 嵌入式人工智能技術應用(數字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術 [桂存兵 著]
- 變頻器與伺服應用 [陳剛 葉云飛]
- 物聯網工程設計與實踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運營與管理 [鐘肖英 陳瀟]
- Java面向對象程序設計 [主編 姜春磊 陳虹潔]
- 信息技術基礎(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應用 [主編 陳 萍 劉培培 陳孟軍]
- 大學生職業發展與就業指導 [主編 劉志堅]
- 高級辦公應用項目教程 [主編 屈晶 趙成麗]
- 微信小程序開發項目實戰(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業檔案工作實戰寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計算機網絡原理及應用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學生創業基礎 [主編 王麗莉 王 楊]
- 船舶輔機 [主編 王連海 于洋 姜淑翠]
- 大學生就業指導 [主編 王麗莉 董宴廷]
- 系統架構設計師章節習題與考點特訓 [主編 薛大龍 鄒月平]
- 高校學生工作探索與實踐 [郭亮 著]
- 大學生情商管理 [方雄 著]
- 2023年長沙市會展業發展報告 [主編 周棟良]