機器學(xué)習(xí)與R語言是一本涵蓋機器學(xué)習(xí)核心算法手冊,由美國程序員布雷特·蘭茨編著。本書內(nèi)容豐富翔實,通過豐富的實際案例來探索如何應(yīng)用r來進行現(xiàn)實世界問題的機器學(xué)習(xí),如何從數(shù)據(jù)中獲取可以付諸行動的洞察力。通過閱讀本書,你將學(xué)到:用r準(zhǔn)備用于機器學(xué)習(xí)的數(shù)據(jù),用r進行數(shù)據(jù)探索和數(shù)據(jù)可視化,用k近領(lǐng)方法進行數(shù)據(jù)分類,用線性回歸預(yù)測數(shù)值型數(shù)據(jù)等等,非常適合對機器學(xué)習(xí)和R語言感興趣的用戶下載閱讀。
內(nèi)容介紹
《機器學(xué)習(xí)與R語言》涵蓋的內(nèi)容第1章介紹了用來定義和區(qū)分機器學(xué)習(xí)算法的術(shù)語和概念,并給出了將學(xué)習(xí)任務(wù)與適當(dāng)算法相匹配的方法。第2章介紹如何應(yīng)用R來管理數(shù)據(jù),進行數(shù)據(jù)的探索分析和數(shù)據(jù)可視化;第3~9章介紹典型的機器學(xué)習(xí)算法,包括k近鄰分類算法、樸素貝葉斯算法、決策樹和規(guī)則樹、回歸預(yù)測、黑盒算法——神經(jīng)網(wǎng)絡(luò)和支持向量機、關(guān)聯(lián)分析、k均值聚類,并給出大量的實際案例和詳細(xì)的分析步驟,例如乳腺癌的判斷、垃圾短信的過濾、貸款違約的預(yù)測、毒蘑菇的判別、醫(yī)療費用的預(yù)測、建筑用混凝土強度的預(yù)測、光學(xué)字符的識別、超市購物籃關(guān)聯(lián)分析以及市場細(xì)分等;第10章介紹模型性能評價的原理和方法;第11章給出提高模型性能的幾種常用方法;第12章討論用R進行機器學(xué)習(xí)時可能遇到的一些高級專題,如特殊形式的數(shù)據(jù)、大數(shù)據(jù)集的處理、并行計算和GPU計算等技術(shù)。章節(jié)目錄
推薦序
譯者序
前言
關(guān)于審稿人
第1章 機器學(xué)習(xí)簡介1
1.1 機器學(xué)習(xí)的起源1
1.2 機器學(xué)習(xí)的使用與濫用3
1.2.1 機器學(xué)習(xí)的成功使用3
1.2.2 機器學(xué)習(xí)的限制4
1.2.3 機器學(xué)習(xí)的倫理方面5
1.3 機器如何學(xué)習(xí)6
1.3.1 數(shù)據(jù)存儲7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 評估10
1.4 實踐中的機器學(xué)習(xí)11
1.4.1 輸入數(shù)據(jù)的類型11
1.4.2 機器學(xué)習(xí)算法的類型12
1.4.3 為輸入數(shù)據(jù)匹配算法14
1.5 使用R進行機器學(xué)習(xí)15
1.5.1 安裝R添加包15
1.5.2 載入和卸載R添加包16
1.6 總結(jié)16
第2章 數(shù)據(jù)的管理和理解18
2.1 R數(shù)據(jù)結(jié)構(gòu)18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 數(shù)據(jù)框23
2.1.5 矩陣和數(shù)組25
2.2 用R管理數(shù)據(jù)27
2.2.1 保存、載入和移除R數(shù)據(jù)結(jié)構(gòu)27
2.2.2 用CSV文件導(dǎo)入和保存數(shù)據(jù)28
2.3 探索和理解數(shù)據(jù)29
2.3.1 探索數(shù)據(jù)的結(jié)構(gòu)29
2.3.2 探索數(shù)值變量30
2.3.3 探索分類變量38
2.3.4 探索變量之間的關(guān)系40
2.4 總結(jié)43
第3章 懶惰學(xué)習(xí)—使用近鄰分類44
3.1 理解近鄰分類44
3.1.1 kNN算法45
3.1.2 為什么kNN算法是懶惰的50
3.2 例子—用kNN算法診斷乳腺癌51
3.2.1 第1步—收集數(shù)據(jù)51
3.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)52
3.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型55
3.2.4 第4步—評估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 總結(jié)59
第4章 概率學(xué)習(xí)—樸素貝葉斯分類60
4.1 理解樸素貝葉斯60
4.1.1 貝葉斯方法的基本概念61
4.1.2 樸素貝葉斯算法65
4.2 例子—基于貝葉斯算法的手機垃圾短信過濾69
4.2.1 第1步—收集數(shù)據(jù)69
4.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)70
4.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型81
4.2.4 第4步—評估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 總結(jié)84
第5章 分而治之—應(yīng)用決策樹和規(guī)則進行分類85
5.1 理解決策樹85
5.1.1 分而治之86
5.1.2 C5.0決策樹算法89
5.2 例子—使用C5.0決策樹識別高風(fēng)險銀行貸款91
5.2.1 第1步—收集數(shù)據(jù)92
5.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)92
5.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型94
5.2.4 第4步—評估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分類規(guī)則101
5.3.1 獨立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 來自決策樹的規(guī)則105
5.3.5 什么使決策樹和規(guī)則貪婪106
5.4 例子—應(yīng)用規(guī)則學(xué)習(xí)算法識別有毒的蘑菇108
5.4.1 第1步—收集數(shù)據(jù)108
5.4.2 第2步—探索和準(zhǔn)備數(shù)據(jù)108
5.4.3 第3步—基于數(shù)據(jù)訓(xùn)練模型109
5.4.4 第4步—評估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 總結(jié)114
第6章 預(yù)測數(shù)值型數(shù)據(jù)—回歸方法115
6.1 理解回歸115
6.1.1 簡單線性回歸117
6.1.2 普通最小二乘估計119
6.1.3 相關(guān)性120
6.1.4 多元線性回歸121
6.2 例子—應(yīng)用線性回歸預(yù)測醫(yī)療費用124
6.2.1 第1步—收集數(shù)據(jù)124
6.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)125
6.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型129
6.2.4 第4步—評估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回歸樹和模型樹134
6.4 例子—用回歸樹和模型樹估計葡萄酒的質(zhì)量136
6.4.1 第1步—收集數(shù)據(jù)137
6.4.2 第2步—探索和準(zhǔn)備數(shù)據(jù)137
6.4.3 第3步—基于數(shù)據(jù)訓(xùn)練模型139
6.4.4 第4步—評估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 總結(jié)145
第7章 黑箱方法—神經(jīng)網(wǎng)絡(luò)和支持向量機147
7.1理解神經(jīng)網(wǎng)絡(luò)147
7.1.1從生物神經(jīng)元到人工神經(jīng)元148
7.1.2激活函數(shù)149
7.1.3網(wǎng)絡(luò)拓?fù)?51
7.1.4用后向傳播訓(xùn)練神經(jīng)網(wǎng)絡(luò)154
7.2例子—用人工神經(jīng)網(wǎng)絡(luò)對混凝土的強度進行建模155
7.2.1第1步—收集數(shù)據(jù)155
7.2.2第2步—探索和準(zhǔn)備數(shù)據(jù)156
7.2.3第3步—基于數(shù)據(jù)訓(xùn)練模型157
7.2.4第4步—評估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量機161
7.3.1用超平面分類161
7.3.2對非線性空間使用核函數(shù)164
7.4例子—用支持向量機進行光學(xué)字符識別166
7.4.1第1步—收集數(shù)據(jù)166
7.4.2第2步—探索和準(zhǔn)備數(shù)據(jù)167
7.4.3第3步—基于數(shù)據(jù)訓(xùn)練模型168
7.4.4第4步—評估模型的性能170
7.4.5第5步—提高模型的性能171
7.5總結(jié)172
第8章 探尋模式—基于關(guān)聯(lián)規(guī)則的購物籃分析173
8.1理解關(guān)聯(lián)規(guī)則173
8.1.1用于關(guān)聯(lián)規(guī)則學(xué)習(xí)的Apriori算法174
8.1.2度量規(guī)則興趣度—支持度和置信度175
8.1.3用Apriori原則建立規(guī)則176
8.2例子—用關(guān)聯(lián)規(guī)則確定經(jīng)常一起購買的食品雜貨177
8.2.1第1步—收集數(shù)據(jù)177
8.2.2第2步—探索和準(zhǔn)備數(shù)據(jù)178
8.2.3第3步—基于數(shù)據(jù)訓(xùn)練模型183
8.2.4第4步—評估模型的性能185
8.2.5第5步—提高模型的性能187
8.3總結(jié)190
第9章 尋找數(shù)據(jù)的分組—k均值聚類191
9.1理解聚類191
9.1.1聚類—一種機器學(xué)習(xí)任務(wù)192
9.1.2k均值聚類算法193
9.2例子—用k均值聚類探尋青少年市場細(xì)分198
9.2.1第1步—收集數(shù)據(jù)199
9.2.2第2步—探索和準(zhǔn)備數(shù)據(jù)199
9.2.3第3步—基于數(shù)據(jù)訓(xùn)練模型203
9.2.4第4步—評估模型的性能205
9.2.5第5步—提高模型的性能207
9.3總結(jié)208
使用說明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進行閱讀
- 下載地址
發(fā)表評論
0條評論軟件排行榜
熱門推薦
- 得間免費小說電腦版 v5.3.0.372.58M / 簡體中文
- 有柿電腦版 v11.6.284.23M / 簡體中文
- cnki全球?qū)W術(shù)快報電腦版 v1.0.1135.99M / 簡體中文
- 瀟湘書院電腦版 v2.3.11.888官方版49.65M / 簡體中文
- 數(shù)據(jù)挖掘?qū)д?官方版61.61M / 簡體中文
- 未公開的Oracle數(shù)據(jù)庫秘密 迪貝斯pdf掃描版34.69M / 簡體中文
- 本草綱目 5.34M / 簡體中文
- docker入門實戰(zhàn) pdf完整版1.38M / 簡體中文
- Scala程序設(shè)計第二版 pdf高清完整版15.83M / 簡體中文
- HotSpot實戰(zhàn)(陳濤著) 中文pdf掃描版82M / 簡體中文