數(shù)據(jù)挖掘技術(shù)與工程實(shí)踐是深入學(xué)習(xí)數(shù)據(jù)挖掘技術(shù)并進(jìn)行工程實(shí)踐的必讀之作,由資深數(shù)據(jù)挖掘技術(shù)專家莊映輝和李堃編著。本書內(nèi)容的跨度較大,涵蓋的內(nèi)容比較廣泛,既有對(duì)數(shù)據(jù)挖掘概念的探討,也有對(duì)數(shù)據(jù)挖掘技術(shù)和原理的介紹,還有對(duì)數(shù)據(jù)挖掘應(yīng)用實(shí)踐的體會(huì)和總結(jié)。其中包括數(shù)據(jù)挖掘定制化項(xiàng)目案例,也涵蓋了數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的開發(fā)及詳細(xì)技術(shù)介紹,還有通過(guò)數(shù)據(jù)挖掘通用工具開展的應(yīng)用案例展示。從技術(shù)上,涉及數(shù)據(jù)挖掘、數(shù)理統(tǒng)計(jì)、數(shù)據(jù)庫(kù)技術(shù),以及更廣泛的各種IT技術(shù),歡迎免費(fèi)下載閱讀。
內(nèi)容介紹
數(shù)據(jù)挖掘是當(dāng)前最活躍的領(lǐng)域之一?!稊?shù)據(jù)挖掘技術(shù)與工程實(shí)踐》作者根據(jù)自己20年數(shù)據(jù)挖掘方面的經(jīng)驗(yàn),總結(jié)了數(shù)據(jù)挖掘的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),提供了大量一線資料。本書首先介紹數(shù)據(jù)挖掘的概念和誤區(qū),然后介紹數(shù)據(jù)探索的方法,包括數(shù)據(jù)查探、數(shù)據(jù)描繪、數(shù)據(jù)變換、數(shù)據(jù)優(yōu)化等,重點(diǎn)介紹了相關(guān)算法,包括:相關(guān)因子算法、聚類算法、分類算法、回歸與測(cè)試算法等。不僅列舉了詳細(xì)示例,還介紹了算法在工程實(shí)踐中的具體應(yīng)用,特別是總結(jié)了自己獨(dú)特的一些新算法,例如秩相關(guān)因子選擇算法、矢量相關(guān)因子選擇算法、密度分布聚類算法、概率特征模型算法等。還剖析了幾個(gè)熱門領(lǐng)域的實(shí)際應(yīng)用,涉及醫(yī)藥學(xué)、信息安全、新聞分析、商品推薦、證券預(yù)測(cè)等領(lǐng)域的應(yīng)用。最后歸納總結(jié)了數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的開發(fā)方案,并介紹一個(gè)數(shù)據(jù)挖掘工具的應(yīng)用。
《數(shù)據(jù)挖掘技術(shù)與工程實(shí)踐》可供數(shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)等領(lǐng)域的技術(shù)人員參考,也可供想建立智能計(jì)算系統(tǒng)的企業(yè)信息系統(tǒng)管理人員參考。
數(shù)據(jù)挖掘技術(shù)與工程實(shí)踐章節(jié)目錄
第1章 數(shù)據(jù)挖掘應(yīng)用緒論1
1.1 認(rèn)識(shí)數(shù)據(jù)挖掘1
1.1.1 數(shù)據(jù)挖掘概念2
1.1.2 數(shù)據(jù)挖掘與生活4
1.1.3 數(shù)據(jù)挖掘與知識(shí)6
1.2 數(shù)據(jù)挖掘應(yīng)用基礎(chǔ)6
1.2.1 事物與維度7
1.2.2 分布與關(guān)系9
1.2.3 描繪與預(yù)測(cè)11
1.2.4 現(xiàn)象和知識(shí)13
1.2.5 規(guī)律與因果13
1.3 數(shù)據(jù)挖掘應(yīng)用系統(tǒng)工程14
1.3.1 數(shù)據(jù)層14
1.3.2 算法層18
1.3.3 應(yīng)用層23
1.4 數(shù)據(jù)挖掘應(yīng)用體會(huì)26
1.4.1 項(xiàng)目關(guān)鍵點(diǎn)26
1.4.2 技術(shù)與應(yīng)用創(chuàng)新27
1.4.3 經(jīng)驗(yàn)積累與應(yīng)用28
1.5 無(wú)限三維嵌套空間假說(shuō)28
1.5.1 一維空間29
1.5.2 二維空間29
1.5.3 三維空間29
1.5.4 突破三維空間30
1.5.5 五維空間31
1.5.6 六維空間31
1.6 本章小結(jié)32
第2章 數(shù)據(jù)探索與準(zhǔn)備33
2.1 數(shù)據(jù)關(guān)系探索34
2.1.1 業(yè)務(wù)發(fā)現(xiàn)34
2.1.2 關(guān)系發(fā)現(xiàn)36
2.1.3 數(shù)據(jù)質(zhì)量探索37
2.1.4 數(shù)據(jù)整合40
2.2 數(shù)據(jù)特征探索42
2.2.1 數(shù)據(jù)的統(tǒng)計(jì)學(xué)特征42
2.2.2 統(tǒng)計(jì)學(xué)特征應(yīng)用48
2.3 數(shù)據(jù)選擇52
2.3.1 適當(dāng)?shù)臄?shù)據(jù)規(guī)模52
2.3.2 數(shù)據(jù)的代表性53
2.3.3 數(shù)據(jù)的選取54
2.4 數(shù)據(jù)處理56
2.4.1 數(shù)據(jù)標(biāo)準(zhǔn)化57
2.4.2 數(shù)據(jù)離散化58
2.5 統(tǒng)計(jì)學(xué)算法的數(shù)量條件60
2.5.1 樣本量估計(jì)概念60
2.5.2 單樣本總體均值比較的樣本量估計(jì)(T-Test)61
2.5.3 兩樣本總體均值比較的樣本量估計(jì)(T-Test)62
2.5.4 多樣本總體均值比較的樣本量估計(jì)(F-Test)63
2.5.5 區(qū)組設(shè)計(jì)多樣本總體均值比較的樣本量估計(jì)(F-Test)66
2.5.6 直線回歸與相關(guān)的樣本量估計(jì)66
2.5.7 對(duì)照分析的樣本量估計(jì)67
2.6 數(shù)據(jù)探索應(yīng)用68
2.6.1 檢驗(yàn)項(xiàng)的疾病分布69
2.6.2 疾病中檢驗(yàn)項(xiàng)的分布70
2.6.3 成對(duì)檢驗(yàn)項(xiàng)的相關(guān)分析71
2.6.4 兩種藥物的應(yīng)用分析71
2.7 本章小結(jié)73
第3章 數(shù)據(jù)挖掘應(yīng)用算法74
3.1 聚類分析74
3.1.1 劃分聚類算法(K均值)75
3.1.2 層次聚類算法(組平均)79
3.1.3 密度聚類算法84
3.2 特性選擇85
3.2.1 特性選擇概念85
3.2.2 線性相關(guān)算法90
3.2.3 相關(guān)因子SRCF算法91
3.3 特征抽取100
3.3.1 主成分分析算法101
3.3.2 因子分析算法102
3.3.3 非負(fù)矩陣因子分解NMF算法103
3.4 關(guān)聯(lián)規(guī)則104
3.4.1 關(guān)聯(lián)規(guī)則概念105
3.4.2 Apriori算法105
3.4.3 FP樹頻集算法106
3.4.4 提升Lift107
3.5 分類和預(yù)測(cè)107
3.5.1 支持向量機(jī)107
3.5.2 Logistic回歸算法112
3.5.3 樸素貝葉斯分類算法115
3.5.4 決策樹121
3.5.5 人工神經(jīng)網(wǎng)絡(luò)125
3.5.6 分類與聚類的關(guān)系129
3.6 時(shí)間序列129
3.6.1 灰色系統(tǒng)預(yù)測(cè)模型129
3.6.2 ARIMA模型預(yù)測(cè)135
3.7 本章小結(jié)136
第4章 數(shù)據(jù)挖掘應(yīng)用案例137
4.1 特性選擇的應(yīng)用137
4.1.1 數(shù)據(jù)整合137
4.1.2 數(shù)據(jù)描繪138
4.1.3 數(shù)據(jù)標(biāo)準(zhǔn)化139
4.1.4 特性選擇探索139
4.2 分類模型的應(yīng)用——算法比較144
4.2.1 數(shù)據(jù)整合144
4.2.2 數(shù)據(jù)描繪145
4.2.3 數(shù)據(jù)標(biāo)準(zhǔn)化148
4.2.4 特性選擇探索148
4.2.5 分類模型150
4.3 分類模型的應(yīng)用——網(wǎng)絡(luò)異常偵測(cè)151
4.3.1 計(jì)算機(jī)網(wǎng)絡(luò)異常行為152
4.3.2 網(wǎng)絡(luò)異常數(shù)據(jù)模型152
4.3.3 分類模型算法應(yīng)用156
4.4 算法的綜合應(yīng)用——腫瘤標(biāo)志物的研究159
4.4.1 樣本選取160
4.4.2 癌胚抗原臨床特征主題分析164
4.4.3 癌胚抗原臨床特征規(guī)則分析167
4.4.4 癌胚抗原臨床特征規(guī)則的比較分析172
4.4.5 癌胚抗原相關(guān)因子分析173
4.4.6 不同等級(jí)癌胚抗原組差異分析176
4.5 數(shù)據(jù)挖掘在其他領(lǐng)域中的應(yīng)用180
4.6 本章小結(jié)182
第5章 數(shù)據(jù)挖掘行業(yè)應(yīng)用原理183
5.1 傳統(tǒng)醫(yī)學(xué)科研方法的現(xiàn)狀184
5.1.1 傳統(tǒng)醫(yī)學(xué)科研的命題與假說(shuō)184
5.1.2 傳統(tǒng)醫(yī)學(xué)科研的數(shù)據(jù)應(yīng)用185
5.1.3 傳統(tǒng)的醫(yī)學(xué)科研的統(tǒng)計(jì)學(xué)應(yīng)用186
5.1.4 傳統(tǒng)醫(yī)學(xué)科研的流程186
5.2 智能醫(yī)學(xué)科研系統(tǒng)的需求187
5.2.1 臨床醫(yī)學(xué)科研的問題187
5.2.2 臨床醫(yī)學(xué)科研的解決思路188
5.3 智能醫(yī)學(xué)科研系統(tǒng)的設(shè)計(jì)思想190
5.3.1 科研立題190
5.3.2 科研設(shè)計(jì)與統(tǒng)計(jì)分析191
5.3.3 樣本數(shù)據(jù)收集與分析192
5.4 智能醫(yī)學(xué)科研系統(tǒng)的核心技術(shù)方法193
5.5 智能醫(yī)學(xué)科研系統(tǒng)的科研數(shù)據(jù)倉(cāng)庫(kù)建設(shè)194
5.5.1 醫(yī)學(xué)科研數(shù)據(jù)倉(cāng)庫(kù)建設(shè)的技術(shù)方法194
5.5.2 醫(yī)學(xué)科研數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)過(guò)程196
5.5.3 科研數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)安全198
5.6 智能醫(yī)學(xué)科研系統(tǒng)的核心功能設(shè)計(jì)198
5.7 智能醫(yī)學(xué)科研系統(tǒng)的整體功能設(shè)計(jì)199
5.7.1 智能醫(yī)學(xué)科研系統(tǒng)主要功能200
5.7.2 智能醫(yī)學(xué)科研系統(tǒng)的模塊設(shè)計(jì)和應(yīng)用實(shí)現(xiàn)202
5.7.3 智能醫(yī)學(xué)科研系統(tǒng)的評(píng)估方法211
5.8 智能醫(yī)學(xué)科研系統(tǒng)的應(yīng)用價(jià)值215
5.9 本章小結(jié)218
第6章 數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的開發(fā)219
6.1 數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的意義219
6.2 IMRS系統(tǒng)設(shè)計(jì)221
6.2.1 對(duì)數(shù)據(jù)源的分析221
6.2.2 數(shù)據(jù)挖掘應(yīng)用系統(tǒng)IMRS的總體設(shè)計(jì)224
6.3 IMRS異常偵測(cè)模型的開發(fā)232
6.3.1 異常偵測(cè)模型的功能展示232
6.3.2 數(shù)據(jù)挖掘技術(shù)開發(fā)要點(diǎn)236
6.4 IMRS特征抽取模型的開發(fā)242
6.4.1 特征抽取模型的功能展示242
6.4.2 數(shù)據(jù)挖掘技術(shù)開發(fā)要點(diǎn)243
6.5 IMRS智能統(tǒng)計(jì)模型的開發(fā)255
6.5.1 回歸模型的開發(fā)實(shí)現(xiàn)255
6.5.2 線性相關(guān)模型的開發(fā)實(shí)現(xiàn)267
6.6 IMRS的算法開發(fā)271
6.6.1 相關(guān)因子算法SRCF的實(shí)現(xiàn)271
6.6.2 樸素貝葉斯分類算法的實(shí)現(xiàn)275
6.7 本章小結(jié)280
第7章 數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的應(yīng)用281
7.1 分布探索282
7.1.1 兩維度聚類模型應(yīng)用282
7.1.2 高維度聚類模型應(yīng)用287
7.2 關(guān)系探索289
7.2.1 關(guān)聯(lián)規(guī)則的應(yīng)用289
7.2.2 特性選擇的應(yīng)用292
7.3 特征探索297
7.3.1 不穩(wěn)定心絞痛的特征總結(jié)297
7.3.2 動(dòng)脈硬化心臟病的臨床特征302
7.4 異常探索305
7.4.1 生理指標(biāo)的異常偵測(cè)305
7.4.2 異常偵測(cè)模型的比較307
7.5 推測(cè)探索308
7.6 應(yīng)用系統(tǒng)的高級(jí)應(yīng)用310
7.6.1 異常偵測(cè)的高級(jí)用法310
7.6.2 關(guān)聯(lián)規(guī)則的高級(jí)應(yīng)用315
7.7 本章小結(jié)320
第8章 數(shù)據(jù)挖掘工具的應(yīng)用321
8.1 應(yīng)用Oracle Data Mining321
8.1.1 ODM數(shù)據(jù)挖掘流程322
8.1.2 ODM算法模型323
8.1.3 ODM算法應(yīng)用327
8.2 應(yīng)用IBM SPSS Modeler351
8.2.1 IBM SPSS Modeler介紹351
8.2.2 SPSS Modeler獨(dú)立應(yīng)用352
8.2.3 SPSS Modeler與應(yīng)用系統(tǒng)的聯(lián)合應(yīng)用359 8.3 本章小結(jié)367
使用說(shuō)明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請(qǐng)務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進(jìn)行閱讀
- 下載地址
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
有問題? 點(diǎn)此報(bào)錯(cuò)
發(fā)表評(píng)論
0條評(píng)論軟件排行榜
熱門推薦
- 得間免費(fèi)小說(shuō)電腦版 v5.2.8.172.96M / 簡(jiǎn)體中文
- 南方Plus電腦版 v11.8.027.22M / 簡(jiǎn)體中文
- 網(wǎng)易新聞電腦版 v112.697.63M / 簡(jiǎn)體中文
- 吉利博瑞用戶手冊(cè) pdf高清版57.89M / 簡(jiǎn)體中文
- 京東讀書電腦版 v1.13.4官方版1.98M / 簡(jiǎn)體中文
- PHP語(yǔ)言精粹電子書 pdf掃描版25.72M / 簡(jiǎn)體中文
- linux常用命令大全 chm版1.48M / 簡(jiǎn)體中文
- 本草綱目 5.34M / 簡(jiǎn)體中文
- C++黑客編程揭秘與防范第2版 冀云pdf掃描版54.58M / 簡(jiǎn)體中文
- HotSpot實(shí)戰(zhàn)(陳濤著) 中文pdf掃描版82M / 簡(jiǎn)體中文