數據挖掘算法—基于C++及CUDA C

簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書是美國著名數據挖掘算法專家、數值計算專業的數理統計學博士Timothy Masters的最新作品。
應用中的預測或分類使數據挖掘工程師經常會面對成千上萬的候選特征。這些特征絕大多數沒有價值或只有很小的價值,只有與某個或某些其他特征聯合起來才可能有用;一些特征可能有巨大的預測能力,但它們又可能僅存在于整體特征空間的某些區域……數據挖掘中,類似這種使人痛苦的問題是無窮的。本書中的現代特征選擇技術,將幫助你解決這些問題。本書中所有的算法都可被直覺證實,并有相關方程和解釋材料支撐。作者還展現了這些算法的完整的、受到高度好評的源代碼(下載網址:https://www.apress.com/cn/book/9781484259870),并對其進行了解析。
本書適合算法、數據挖掘、人工智能等領域的師生及相關的技術與研究人員使用。
數值計算專家Timothy Masters 博士著作
展現特征提取與選擇算法的最新技術
所有算法都可被直覺證實
Timothy Masters獲得數值計算專業的數理統計博士學位后,一直擔任政府和行業的獨立顧問。早期研究領域包括高程影像的自動特征檢測,還開發了洪災和旱災預測,隱蔽導彈發射井檢測和軍用車輛識別等應用。后來與醫學研究人員合作開發了穿刺活檢良性細胞/惡性細胞的計算鑒別算法。在過去的20年中,主要專注于金融市場交易系統的自動評估方法研究。撰寫了12本關于預測建模實際應用方面的圖書:
《實用神經網絡C++實現》(Academic,1993)
《基于神經網絡的信號和圖像處理》(Wiley,1994)
《神經網絡先進算法》(Wiley,1995)
《時間序列預測的神經網絡、新型和混合算法》(Wiley,1995)
《預測和分類的評估與改進》(Apress,2018)
《深度信念網絡的C++和CUDA C實現:第一卷:受限玻爾茲曼機和監督式前饋網絡》(Apress,2018)
《深度信念網絡的C++和CUDA C實現:第二卷:復域中的自編碼》(Apress,2018)
《深度信念網絡的C++和CUDA C實現:第三卷:卷積神經網絡》(Apress,2018)
《數據挖掘算法的C++實現》(Apress,2018)
《市場交易系統的測試與優化》(Apress,2018)
《金融市場預測的可靠統計指標:C++算法實現》(KDP,2019,第2版 2020)
《交易系統開發的排列檢驗和隨機檢驗:C++算法實現》(KDP,2020)
第2章 前向選擇成分分析 3
前向選擇成分分析概述 3
數學原理與代碼示例 5
最大化解釋方差 6
方差最大化準則代碼 7
后向細化 10
多線程后向細化 13
有序成分正交化 18
綜合應用 20
僅前向選擇子集的成分變量 24
后向細化子集的成分變量 25
人工變量示例 26
第3章 局部特征選擇 30
算法概述 30
算法輸出結果 34
簡要介紹:單純形算法 34
線性規劃問題 35
Simplex類的接口 36
更多細節 37
一種更嚴格的LFS方法 38
類內分割和類間分割 41
計算權重 43
最大化類間分割 45
最小化類內分割 48
測試β試驗值 49
關于線程的簡要說明 52
CUDA權重計算 52
將CUDA代碼集成到算法中 53
初始化CUDA硬件 54
計算與當前實例之差 56
計算距離矩陣 57
計算最小距離 59
計算權重方程項 63
轉置項矩陣 64
權重項求和 65
權重遷移到主機 66
局部特征選擇示例 66
關于運行時的解釋說明 67
第4章 時間序列特征的記憶特性 68
簡單數學概述 69
前向算法 70
后向算法 72
α和β修正 74
一些常規計算 78
均值和協方差 78
概率密度 79
多元正態概率密度函數 80
啟動參數 81
初始化算法流程 81
對均值施加擾動 82
對協方差施加擾動 82
對轉移概率施加擾動 83
關于隨機數發生器的解釋 83
完整優化算法 84
計算狀態概率 85
更新均值和協方差 87
更新初始概率和轉移概率 89
HMM在時間序列中的記憶特性評估 93
鏈接特征變量與目標變量 96
鏈接HMM狀態與目標 102
一個人為的不當示例 109
一個合理可行的示例 111
第5章 逐步選擇改進算法 113
特征評估模型 114
基本模型實現代碼 115
交叉驗證性能度量 118
逐步選擇算法 120
確定第一個變量 125
在現有模型中添加變量 127
三個算法演示示例 130
第6章 名義變量到有序變量的轉換 133
實現概述 135
合理關系測試 135
股票價格變動示例 136
名義變量到有序變量變換實現代碼 138
構造函數 139
輸出計數表 141
計算映射函數 143
Monte-Carlo置換檢驗 145
- 零基礎玩轉國產大模型DeepSeek [徐永冰 張帥 編著]
- 網絡工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統項目管理師考試32小時通關(適用第4版考綱) [薛大龍]
- 信息系統管理工程師考試32小時通關(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實訓 [洪曉江 達則曉麗 錢波]
- 科技信息檢索與論文寫作實用教程 [李振華]
- 傳統山水畫論解讀與實踐 [陳鈉 著]
- Python數據庫編程 [主編 殷樹友 邢 翀]
- 計算機基礎實訓指導 [主編 袁春萍 朱妮]
- 嵌入式人工智能技術應用(數字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術 [桂存兵 著]
- 變頻器與伺服應用 [陳剛 葉云飛]
- 物聯網工程設計與實踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運營與管理 [鐘肖英 陳瀟]
- Java面向對象程序設計 [主編 姜春磊 陳虹潔]
- 信息技術基礎(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應用 [主編 陳 萍 劉培培 陳孟軍]
- 大學生職業發展與就業指導 [主編 劉志堅]
- 高級辦公應用項目教程 [主編 屈晶 趙成麗]
- 微信小程序開發項目實戰(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業檔案工作實戰寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計算機網絡原理及應用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學生創業基礎 [主編 王麗莉 王 楊]
- 船舶輔機 [主編 王連海 于洋 姜淑翠]
- 大學生就業指導 [主編 王麗莉 董宴廷]
- 系統架構設計師章節習題與考點特訓 [主編 薛大龍 鄒月平]
- 高校學生工作探索與實踐 [郭亮 著]
- 大學生情商管理 [方雄 著]
- 2023年長沙市會展業發展報告 [主編 周棟良]