機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)是一本非常實(shí)用的機(jī)器學(xué)習(xí)教程,由美國(guó)機(jī)器學(xué)習(xí)和機(jī)器人學(xué)博士Willi Richert編著,手把手教你用Python設(shè)計(jì)機(jī)器學(xué)習(xí)系統(tǒng)。本書為讀者提供了大量的Python庫(kù)參考,全書用豐富的案例,教會(huì)讀者如何細(xì)析機(jī)器學(xué)習(xí)技巧與方法,帶你承襲正確的思維方式,非常適合需要機(jī)器學(xué)習(xí)技術(shù)的Python開發(fā)人員、計(jì)算機(jī)科學(xué)研究人員、數(shù)據(jù)科學(xué)家、人工智能程序員,以及統(tǒng)計(jì)程序員閱讀參考。
使用說(shuō)明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請(qǐng)務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進(jìn)行閱讀試讀
內(nèi)容介紹
《機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)》是實(shí)用的Python機(jī)器學(xué)習(xí)教程,結(jié)合大量案例,介紹了機(jī)器學(xué)習(xí)的各方面知識(shí)。本書不僅告訴你“怎么做”,還會(huì)分析“為什么”,力求幫助讀者掌握多種多樣的機(jī)器學(xué)習(xí)Python庫(kù),學(xué)習(xí)構(gòu)建基于Python的機(jī)器學(xué)習(xí)系統(tǒng),并親身實(shí)踐和體驗(yàn)機(jī)器學(xué)習(xí)系統(tǒng)的功能。
本書共分為12章:
第1章通過(guò)一個(gè)非常簡(jiǎn)單的例子介紹機(jī)器學(xué)習(xí)的基本概念。盡管很簡(jiǎn)單,但也可能會(huì)有過(guò)擬合的風(fēng)險(xiǎn),這對(duì)我們提出了挑戰(zhàn)。
第2章講解了使用真實(shí)數(shù)據(jù)解決分類問題的方法,在這里我們對(duì)計(jì)算機(jī)進(jìn)行訓(xùn)練,使它能夠區(qū)分不同類型的花朵。
第3章講解了詞袋方法的威力,我們可以在沒有真正理解帖子內(nèi)容的情況下,用它來(lái)尋找相似的帖子。
第4章讓我們超越將每個(gè)帖子分配給單個(gè)簇的方式。由于真實(shí)的文本可以處理多個(gè)主題,我們可以看到如何把帖子分配到幾個(gè)主題上。
第5章講解了如何用邏輯回歸判定用戶的答案是好還是壞。在這個(gè)情景的背后,我們將學(xué)會(huì)用偏差-方差的折中調(diào)試機(jī)器學(xué)習(xí)模型。
第6章介紹了樸素貝葉斯的工作原理,以及如何用它對(duì)推文進(jìn)行分類,來(lái)判斷推文中的情感是正面的還是負(fù)面的。
第7章討論了一個(gè)處理數(shù)據(jù)的經(jīng)典課題,但它在今天仍然有意義。我們用它構(gòu)建了一個(gè)推薦系統(tǒng),這個(gè)系統(tǒng)根據(jù)用戶所輸入的喜歡和不喜歡的信息,為用戶推薦新的商品。
第8章同時(shí)使用多種方法改進(jìn)推薦效果。我們還可以看到如何只根據(jù)購(gòu)物信息構(gòu)建推薦系統(tǒng),而不需要用戶的評(píng)分?jǐn)?shù)據(jù)(用戶并不總會(huì)提供這一信息)。
第9章舉例說(shuō)明,如果有人把我們收集而成的龐大音樂庫(kù)弄亂了,那么為歌曲建立次序的唯一希望就是讓機(jī)器來(lái)對(duì)歌曲分類。你會(huì)發(fā)現(xiàn),有時(shí)信任別人的專長(zhǎng)比我們自己構(gòu)建特征更好。
第10章講解了如何在處理圖像這個(gè)特定情景下應(yīng)用分類方法。這個(gè)領(lǐng)域又叫做模式識(shí)別。
第11章告訴我們還有其他什么方法可以幫我們精簡(jiǎn)數(shù)據(jù),使機(jī)器學(xué)習(xí)算法能夠處理它們。
第12章講解了不斷膨脹的數(shù)據(jù)規(guī)模,以及這為何會(huì)為數(shù)據(jù)分析造成難題。在本章中,我們利用多核或計(jì)算集群,探索了一些更大規(guī)模數(shù)據(jù)的處理方法。另外,我們還介紹了云計(jì)算(將亞馬遜的Web服務(wù)當(dāng)做云計(jì)算提供商)。
機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)章節(jié)目錄
機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)是一本非常實(shí)用的機(jī)器學(xué)習(xí)教程,由美國(guó)機(jī)器學(xué)習(xí)和機(jī)器人學(xué)博士Willi Richert編著,手把手教你用Python設(shè)計(jì)機(jī)器學(xué)習(xí)系統(tǒng)。本書為讀者提供了大量的Python庫(kù)參考,全書用豐富的案例,教會(huì)讀者如何細(xì)析機(jī)器學(xué)習(xí)技巧與方法,帶你承襲正確的思維方式,非常適合需要機(jī)器學(xué)習(xí)技術(shù)的Python開發(fā)人員、計(jì)算機(jī)科學(xué)研究人員、數(shù)據(jù)科學(xué)家、人工智能程序員,以及統(tǒng)計(jì)程序員閱讀參考。
使用說(shuō)明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請(qǐng)務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進(jìn)行閱讀試讀
內(nèi)容介紹
《機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)》是實(shí)用的Python機(jī)器學(xué)習(xí)教程,結(jié)合大量案例,介紹了機(jī)器學(xué)習(xí)的各方面知識(shí)。本書不僅告訴你“怎么做”,還會(huì)分析“為什么”,力求幫助讀者掌握多種多樣的機(jī)器學(xué)習(xí)Python庫(kù),學(xué)習(xí)構(gòu)建基于Python的機(jī)器學(xué)習(xí)系統(tǒng),并親身實(shí)踐和體驗(yàn)機(jī)器學(xué)習(xí)系統(tǒng)的功能。
本書共分為12章:
第1章通過(guò)一個(gè)非常簡(jiǎn)單的例子介紹機(jī)器學(xué)習(xí)的基本概念。盡管很簡(jiǎn)單,但也可能會(huì)有過(guò)擬合的風(fēng)險(xiǎn),這對(duì)我們提出了挑戰(zhàn)。
第2章講解了使用真實(shí)數(shù)據(jù)解決分類問題的方法,在這里我們對(duì)計(jì)算機(jī)進(jìn)行訓(xùn)練,使它能夠區(qū)分不同類型的花朵。
第3章講解了詞袋方法的威力,我們可以在沒有真正理解帖子內(nèi)容的情況下,用它來(lái)尋找相似的帖子。
第4章讓我們超越將每個(gè)帖子分配給單個(gè)簇的方式。由于真實(shí)的文本可以處理多個(gè)主題,我們可以看到如何把帖子分配到幾個(gè)主題上。
第5章講解了如何用邏輯回歸判定用戶的答案是好還是壞。在這個(gè)情景的背后,我們將學(xué)會(huì)用偏差-方差的折中調(diào)試機(jī)器學(xué)習(xí)模型。
第6章介紹了樸素貝葉斯的工作原理,以及如何用它對(duì)推文進(jìn)行分類,來(lái)判斷推文中的情感是正面的還是負(fù)面的。
第7章討論了一個(gè)處理數(shù)據(jù)的經(jīng)典課題,但它在今天仍然有意義。我們用它構(gòu)建了一個(gè)推薦系統(tǒng),這個(gè)系統(tǒng)根據(jù)用戶所輸入的喜歡和不喜歡的信息,為用戶推薦新的商品。
第8章同時(shí)使用多種方法改進(jìn)推薦效果。我們還可以看到如何只根據(jù)購(gòu)物信息構(gòu)建推薦系統(tǒng),而不需要用戶的評(píng)分?jǐn)?shù)據(jù)(用戶并不總會(huì)提供這一信息)。
第9章舉例說(shuō)明,如果有人把我們收集而成的龐大音樂庫(kù)弄亂了,那么為歌曲建立次序的唯一希望就是讓機(jī)器來(lái)對(duì)歌曲分類。你會(huì)發(fā)現(xiàn),有時(shí)信任別人的專長(zhǎng)比我們自己構(gòu)建特征更好。
第10章講解了如何在處理圖像這個(gè)特定情景下應(yīng)用分類方法。這個(gè)領(lǐng)域又叫做模式識(shí)別。
第11章告訴我們還有其他什么方法可以幫我們精簡(jiǎn)數(shù)據(jù),使機(jī)器學(xué)習(xí)算法能夠處理它們。
第12章講解了不斷膨脹的數(shù)據(jù)規(guī)模,以及這為何會(huì)為數(shù)據(jù)分析造成難題。在本章中,我們利用多核或計(jì)算集群,探索了一些更大規(guī)模數(shù)據(jù)的處理方法。另外,我們還介紹了云計(jì)算(將亞馬遜的Web服務(wù)當(dāng)做云計(jì)算提供商)。
機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)章節(jié)目錄
目 錄
第1章 Python機(jī)器學(xué)習(xí)入門 1
1.1 夢(mèng)之隊(duì):機(jī)器學(xué)習(xí)與Python 1
1.2 這本書將教給你什么(以及不會(huì)教什么) 2
1.3 遇到困難的時(shí)候怎么辦 3
1.4 開始 4
1.4.1 NumPy、SciPy和Matplotlib簡(jiǎn)介 4
1.4.2 安裝Python 5
1.4.3 使用NumPy和SciPy智能高效地處理數(shù)據(jù) 5
1.4.4 學(xué)習(xí)NumPy 5
1.4.5 學(xué)習(xí)SciPy 9
1.5 我們第一個(gè)(極小的)機(jī)器學(xué)習(xí)應(yīng)用 10
1.5.1 讀取數(shù)據(jù) 10
1.5.2 預(yù)處理和清洗數(shù)據(jù) 11
1.5.3 選擇正確的模型和學(xué)習(xí)算法 12
1.6 小結(jié) 20
第2章 如何對(duì)真實(shí)樣本分類 22
2.1 Iris數(shù)據(jù)集 22
2.1.1 第一步是可視化 23
2.1.2 構(gòu)建第一個(gè)分類模型 24
2.2 構(gòu)建更復(fù)雜的分類器 28
2.3 更復(fù)雜的數(shù)據(jù)集和更復(fù)雜的分類器 29
2.3.1 從Seeds數(shù)據(jù)集中學(xué)習(xí) 29
2.3.2 特征和特征工程 30
2.3.3 最鄰近分類 30
2.4 二分類和多分類 33
2.5 小結(jié) 34
第3章 聚類:尋找相關(guān)的帖子 35
3.1 評(píng)估帖子的關(guān)聯(lián)性 35
3.1.1 不應(yīng)該怎樣 36
3.1.2 應(yīng)該怎樣 36
3.2 預(yù)處理:用相近的公共詞語(yǔ)個(gè)數(shù)來(lái)衡量相似性 37
3.2.1 將原始文本轉(zhuǎn)化為詞袋 37
3.2.2 統(tǒng)計(jì)詞語(yǔ) 38
3.2.3 詞語(yǔ)頻次向量的歸一化 40
3.2.4 刪除不重要的詞語(yǔ) 41
3.2.5 詞干處理 42
3.2.6 停用詞興奮劑 44
3.2.7 我們的成果和目標(biāo) 45
3.3 聚類 46
3.3.1 K均值 46
3.3.2 讓測(cè)試數(shù)據(jù)評(píng)估我們的想法 49
3.3.3 對(duì)帖子聚類 50
3.4 解決我們最初的難題 51
3.5 調(diào)整參數(shù) 54
3.6 小結(jié) 54
第4章 主題模型 55
4.1 潛在狄利克雷分配(LDA) 55
4.2 在主題空間比較相似度 59
4.3 選擇主題個(gè)數(shù) 64
4.4 小結(jié) 65
第5章 分類:檢測(cè)劣質(zhì)答案 67
5.1 路線圖概述 67
5.2 學(xué)習(xí)如何區(qū)分出優(yōu)秀的答案 68
5.2.1 調(diào)整樣本 68
5.2.2 調(diào)整分類器 68
5.3 獲取數(shù)據(jù) 68
5.3.1 將數(shù)據(jù)消減到可處理的程度 69
5.3.2 對(duì)屬性進(jìn)行預(yù)選擇和處理 70
5.3.3 定義什么是優(yōu)質(zhì)答案 71
5.4 創(chuàng)建第一個(gè)分類器 71
5.4.1 從k鄰近(kNN)算法開始 71
5.4.2 特征工程 72
5.4.3 訓(xùn)練分類器 73
5.4.4 評(píng)估分類器的性能 74
5.4.5 設(shè)計(jì)更多的特征 74
5.5 決定怎樣提升效果 77
5.5.1 偏差?方差及其折中 77
5.5.2 解決高偏差 78
5.5.3 解決高方差 78
5.5.4 高偏差或低偏差 78
5.6 采用邏輯回歸 81
5.6.1 一點(diǎn)數(shù)學(xué)和一個(gè)小例子 81
5.6.2 在帖子分類問題上應(yīng)用邏輯回歸 83
5.7 觀察正確率的背后:準(zhǔn)確率和召回率 84
5.8 為分類器瘦身 87
5.9 出貨 88
5.10 小結(jié) 88
第6章 分類II:情感分析 89
6.1 路線圖概述 89
6.2 獲取數(shù)據(jù) 89
6.3 樸素貝葉斯分類器介紹 90
6.3.1 了解貝葉斯定理 90
6.3.2 樸素 91
6.3.3 使用樸素貝葉斯進(jìn)行分類 92
6.3.4 考慮未出現(xiàn)的詞語(yǔ)和其他古怪情況 94
6.3.5 考慮算術(shù)下溢 95
6.4 創(chuàng)建第一個(gè)分類器并調(diào)優(yōu) 97
6.4.1 先解決一個(gè)簡(jiǎn)單問題 97
6.4.2 使用所有的類 99
6.4.3 對(duì)分類器的參數(shù)進(jìn)行調(diào)優(yōu) 101
6.5 清洗推文 104
6.6 將詞語(yǔ)類型考慮進(jìn)去 106
6.6.1 確定詞語(yǔ)的類型 106
6.6.2 用SentiWordNet成功地作弊 108
6.6.3 我們第一個(gè)估算器 110
6.6.4 把所有東西融合在一起 111
6.7 小結(jié) 112
第7章 回歸:推薦 113
7.1 用回歸預(yù)測(cè)房?jī)r(jià) 113
7.1.1 多維回歸 116
7.1.2 回歸里的交叉驗(yàn)證 116
7.2 懲罰式回歸 117
7.2.1 L1和L2懲罰 117
7.2.2 在Scikit-learn中使用Lasso或彈性網(wǎng) 118
7.3 P大于N的情形 119
7.3.1 基于文本的例子 120
7.3.2 評(píng)分預(yù)測(cè)和推薦 122
7.4 小結(jié) 126
第8章 回歸:改進(jìn)的推薦 127
8.1 改進(jìn)的推薦 127
8.1.1 使用二值推薦矩陣 127
8.1.2 審視電影的近鄰 129
8.1.3 組合多種方法 130
8.2 購(gòu)物籃分析 132
8.2.1 獲取有用的預(yù)測(cè) 133
8.2.2 分析超市購(gòu)物籃 134
8.2.3 關(guān)聯(lián)規(guī)則挖掘 136
8.2.4 更多購(gòu)物籃分析的高級(jí)話題 137
8.3 小結(jié) 138
第9章 分類III:音樂體裁分類 139
9.1 路線圖概述 139
9.2 獲取音樂數(shù)據(jù) 139
9.3 觀察音樂 140
9.4 用FFT構(gòu)建第一個(gè)分類器 143
9.4.1 增加實(shí)驗(yàn)敏捷性 143
9.4.2 訓(xùn)練分類器 144
9.4.3 在多分類問題中用混淆矩陣評(píng)估正確率 144
9.4.4 另一種方式評(píng)估分類器效果:受試者工作特征曲線(ROC) 146
9.5 用梅爾倒頻譜系數(shù)(MFCC)提升分類效果 148
9.6 小結(jié) 152
第10章 計(jì)算機(jī)視覺:模式識(shí)別 154
10.1 圖像處理簡(jiǎn)介 154
10.2 讀取和顯示圖像 155
10.2.1 圖像處理基礎(chǔ) 156
10.2.2 加入椒鹽噪聲 161
10.2.3 模式識(shí)別 163
10.2.4 計(jì)算圖像特征 163
10.2.5 設(shè)計(jì)你自己的特征 164
10.3 在更難的數(shù)據(jù)集上分類 166
10.4 局部特征表示 167
10.5 小結(jié) 170
第11章 降維 171
11.1 路線圖 171
11.2 選擇特征 172
11.2.1 用篩選器檢測(cè)冗余特征 172
11.2.2 用封裝器讓模型選擇特征 178
11.3 其他特征選擇方法 180
11.4 特征抽取 181
11.4.1 主成分分析(PCA) 181
11.4.2 PCA的局限性以及LDA會(huì)有什么幫助 183
11.5 多維標(biāo)度法(MDS) 184
11.6 小結(jié) 187
第12章 大數(shù)據(jù) 188
12.1 了解大數(shù)據(jù) 188
12.2 用Jug程序包把你的處理流程分解成幾個(gè)任務(wù) 189
12.2.1 關(guān)于任務(wù) 189
12.2.2 復(fù)用部分結(jié)果 191
12.2.3 幕后的工作原理 192
12.2.4 用Jug分析數(shù)據(jù) 192
12.3 使用亞馬遜Web服務(wù)(AWS) 194
12.3.1 構(gòu)建你的第一臺(tái)機(jī)器 195
12.3.2 用starcluster自動(dòng)創(chuàng)建集群 199
12.4 小結(jié) 202
附錄A 更多機(jī)器學(xué)習(xí)知識(shí) 203
A.1 在線資源 203
A.2 參考書 203
A.2.1 問答網(wǎng)站 203
A.2.2 博客 204
A.2.3 數(shù)據(jù)資源 205
A.2.4 競(jìng)爭(zhēng)日益加劇 205
A.3 還剩下什么 205
A.4 小結(jié) 206
索引 207
- 下載地址
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
有問題? 點(diǎn)此報(bào)錯(cuò)
發(fā)表評(píng)論
0條評(píng)論軟件排行榜
熱門推薦
- 南方Plus電腦版 v12.0.027.06M / 簡(jiǎn)體中文
- 得間免費(fèi)小說(shuō)電腦版 v5.3.1.372.86M / 簡(jiǎn)體中文
- 開源閱讀電腦版 v3.2517.96M / 簡(jiǎn)體中文
- 京東讀書電腦版 v1.13.4官方版1.98M / 簡(jiǎn)體中文
- PHP語(yǔ)言精粹電子書 pdf掃描版25.72M / 簡(jiǎn)體中文
- linux常用命令大全 chm版1.48M / 簡(jiǎn)體中文
- 本草綱目 5.34M / 簡(jiǎn)體中文
- Scala程序設(shè)計(jì)第二版 pdf高清完整版15.83M / 簡(jiǎn)體中文
- C++黑客編程揭秘與防范第2版 冀云pdf掃描版54.58M / 簡(jiǎn)體中文
- C++多核高級(jí)編程 修斯pdf掃描版57.21M / 簡(jiǎn)體中文