r語(yǔ)言數(shù)據(jù)分析與挖掘?qū)崙?zhàn)是一本由10余位數(shù)據(jù)挖掘領(lǐng)域資深專家和科研人員0余年大數(shù)據(jù)挖掘咨詢與實(shí)施經(jīng)驗(yàn)結(jié)晶,由張良均,云偉標(biāo),王路,劉曉勇四人編著。全書(shū)以數(shù)據(jù)挖掘的應(yīng)用出發(fā),以電力、航空、醫(yī)療等10個(gè)行業(yè)真實(shí)案例為主線,詳細(xì)講解了R數(shù)據(jù)挖掘建模的過(guò)程和數(shù)據(jù)挖掘的二次開(kāi)發(fā)。全書(shū)以大家熟知的數(shù)據(jù)挖掘建模工具R語(yǔ)言來(lái)展開(kāi),以解決某個(gè)應(yīng)用的挖掘目標(biāo)為前提,先介紹案例背景提出挖掘目標(biāo),再闡述分析方法與過(guò)程,最后完成模型構(gòu)建,在介紹建模過(guò)程中同時(shí)穿插操作訓(xùn)練,把相關(guān)的知識(shí)點(diǎn)嵌入相應(yīng)的操作過(guò)程中,使讀者輕松理解并掌握相關(guān)的理論和知識(shí)點(diǎn)。
內(nèi)容介紹
《R語(yǔ)言數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》是一本系統(tǒng)性的、以實(shí)踐為導(dǎo)向的R數(shù)據(jù)挖掘與分析實(shí)戰(zhàn)指南,多位技術(shù)專家結(jié)合自己10多年的經(jīng)驗(yàn),以電力、航空、醫(yī)療、互聯(lián)網(wǎng)、制造業(yè)等10個(gè)行業(yè)的實(shí)戰(zhàn)案例為主線,深入淺出地講解了如何利用R語(yǔ)言及其相關(guān)技術(shù)進(jìn)行數(shù)據(jù)挖掘建模、數(shù)據(jù)分析和二次開(kāi)發(fā),不僅為多個(gè)行業(yè)提供了成熟的解決方案,而且還提供了大量的技巧。
本書(shū)共16章,分三個(gè)部分:
基礎(chǔ)篇(第1~5章),第1章的主要內(nèi)容是數(shù)據(jù)挖掘概述;第2章對(duì)本書(shū)所用到的數(shù)據(jù)挖掘建模工具R語(yǔ)言進(jìn)行了簡(jiǎn)明扼要的說(shuō)明;第3、4、5章對(duì)數(shù)據(jù)挖掘的建模過(guò)程,包括數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理及挖掘建模的常用算法與原理進(jìn)行了介紹。
實(shí)戰(zhàn)篇(第6~15章),重點(diǎn)對(duì)數(shù)據(jù)挖掘技術(shù)在電力、航空、醫(yī)療、互聯(lián)網(wǎng)、生產(chǎn)制造以及公共服務(wù)等行業(yè)的應(yīng)用進(jìn)行了分析。在案例結(jié)構(gòu)組織上,本書(shū)是按照先介紹案例背景與挖掘目標(biāo),再闡述分析方法與過(guò)程,最后完成模型構(gòu)建的順序進(jìn)行的,在建模過(guò)程等關(guān)鍵環(huán)節(jié),穿插程序?qū)崿F(xiàn)代碼。最后通過(guò)上機(jī)實(shí)踐,加深數(shù)據(jù)挖掘技術(shù)在案例應(yīng)用中的理解。
高級(jí)篇(第16章),介紹了基于R語(yǔ)言二次開(kāi)發(fā)的數(shù)據(jù)挖掘應(yīng)用軟件——TipDM數(shù)據(jù)挖掘建模工具,并以此工具為例詳細(xì)介紹了基于R語(yǔ)言完成數(shù)據(jù)挖掘二次開(kāi)發(fā)的各個(gè)步驟,使讀者體驗(yàn)到通過(guò)R語(yǔ)言實(shí)現(xiàn)數(shù)據(jù)挖掘二次開(kāi)發(fā)的強(qiáng)大魅力。
章節(jié)目錄
前 言 基 礎(chǔ) 篇 第1章 數(shù)據(jù)挖掘基礎(chǔ)2 1.1 某知名連鎖餐飲企業(yè)的困惑2 1.2 從餐飲服務(wù)到數(shù)據(jù)挖掘3 1.3 數(shù)據(jù)挖掘的基本任務(wù)4 1.4 數(shù)據(jù)挖掘建模過(guò)程4 1.4.1 定義挖掘目標(biāo)4 1.4.2 數(shù)據(jù)取樣5 1.4.3 數(shù)據(jù)探索6 1.4.4 數(shù)據(jù)預(yù)處理7 1.4.5 挖掘建模7 1.4.6 模型評(píng)價(jià)7 1.5 常用數(shù)據(jù)挖掘建模工具7 1.6 小結(jié)9 第2章 R語(yǔ)言簡(jiǎn)介10 2.1 R安裝10 2.2 R使用入門(mén)11 2.2.1 R操作界面11 2.2.2 RStudio窗口介紹12 2.2.3 R常用操作13 2.3 R數(shù)據(jù)分析包16 2.4 配套附件使用設(shè)置18 2.5 小結(jié)18 第3章 數(shù)據(jù)探索19 3.1 數(shù)據(jù)質(zhì)量分析19 3.1.1 缺失值分析20 3.1.2 異常值分析20 3.1.3 一致性分析22 3.2 數(shù)據(jù)特征分析23 3.2.1 分布分析23 3.2.2 對(duì)比分析25 3.2.3 統(tǒng)計(jì)量分析27 3.2.4 周期性分析29 3.2.5 貢獻(xiàn)度分析30 3.2.6 相關(guān)性分析31 3.3 R語(yǔ)言主要數(shù)據(jù)探索函數(shù)35 3.3.1 統(tǒng)計(jì)特征函數(shù)35 3.3.2 統(tǒng)計(jì)作圖函數(shù)37 3.4 小結(jié)40 第4章 數(shù)據(jù)預(yù)處理41 4.1 數(shù)據(jù)清洗42 4.1.1 缺失值處理42 4.1.2 異常值處理45 4.2 數(shù)據(jù)集成45 4.2.1 實(shí)體識(shí)別46 4.2.2 冗余屬性識(shí)別46 4.3 數(shù)據(jù)變換46 4.3.1 簡(jiǎn)單函數(shù)變換46 4.3.2 規(guī)范化47 4.3.3 連續(xù)屬性離散化48 4.3.4 屬性構(gòu)造51 4.3.5 小波變換52 4.4 數(shù)據(jù)規(guī)約55 4.4.1 屬性規(guī)約55 4.4.2 數(shù)值規(guī)約58 4.5 R語(yǔ)言主要數(shù)據(jù)預(yù)處理函數(shù)61 4.6 小結(jié)65 第5章 挖掘建模66 5.1 分類與預(yù)測(cè)66 5.1.1 實(shí)現(xiàn)過(guò)程66 5.1.2 常用的分類與預(yù)測(cè)算法67 5.1.3 回歸分析68 5.1.4 決策樹(shù)73 5.1.5 人工神經(jīng)網(wǎng)絡(luò)79 5.1.6 分類與預(yù)測(cè)算法評(píng)價(jià)83 5.1.7 R語(yǔ)言主要分類與預(yù)測(cè)算法函數(shù)87 5.2 聚類分析89 5.2.1 常用聚類分析算法89 5.2.2 KMeans聚類算法90 5.2.3 聚類分析算法評(píng)價(jià)95 5.2.4 R語(yǔ)言主要聚類分析算法函數(shù)95 5.3 關(guān)聯(lián)規(guī)則97 5.3.1 常用關(guān)聯(lián)規(guī)則算法97 5.3.2 Apriori算法98 5.4 時(shí)序模式102 5.4.1 時(shí)間序列算法103 5.4.2 時(shí)間序列的預(yù)處理104 5.4.3 平穩(wěn)時(shí)間序列分析105 5.4.4 非平穩(wěn)時(shí)間序列分析107 5.4.5 R語(yǔ)言主要時(shí)序模式算法函數(shù)114 5.5 離群點(diǎn)檢測(cè)116 5.5.1 離群點(diǎn)檢測(cè)方法117 5.5.2 基于模型的離群點(diǎn)檢測(cè)方法118 5.5.3 基于聚類的離群點(diǎn)檢測(cè)方法120 5.6 小結(jié)122 實(shí) 戰(zhàn) 篇 第6章 電力竊漏電用戶自動(dòng)識(shí)別126 6.1 背景與挖掘目標(biāo)126 6.2 分析方法與過(guò)程129 6.2.1 數(shù)據(jù)抽取130 6.2.2 數(shù)據(jù)探索分析130 6.2.3 數(shù)據(jù)預(yù)處理133 6.2.4 構(gòu)建專家樣本137 6.2.5 模型構(gòu)建138 6.3 上機(jī)實(shí)驗(yàn)143 6.4 拓展思考144 6.5 小結(jié)144 第7章 航空公司客戶價(jià)值分析145 7.1 背景與挖掘目標(biāo)145 7.2 分析方法與過(guò)程146 7.2.1 數(shù)據(jù)抽取149 7.2.2 數(shù)據(jù)探索分析149 7.2.3 數(shù)據(jù)預(yù)處理150 7.2.4 模型構(gòu)建153 7.3 上機(jī)實(shí)驗(yàn)158 7.4 拓展思考159 7.5 小結(jié)159 第8章 中醫(yī)證型關(guān)聯(lián)規(guī)則挖掘160 8.1 背景與挖掘目標(biāo)160 8.2 分析方法與過(guò)程162 8.2.1 數(shù)據(jù)獲取163 8.2.2 數(shù)據(jù)預(yù)處理165 8.2.3 模型構(gòu)建169 8.3 上機(jī)實(shí)驗(yàn)171 8.4 拓展思考172 8.5 小結(jié)172 第9章 基于水色圖像的水質(zhì)評(píng)價(jià)173 9.1 背景與挖掘目標(biāo)173 9.2 分析方法與過(guò)程174 9.2.1 數(shù)據(jù)預(yù)處理175 9.2.2 模型構(gòu)建177 9.2.3 水質(zhì)評(píng)價(jià)179 9.3 上機(jī)實(shí)驗(yàn)180 9.4 拓展思考180 9.5 小結(jié)181 第10章 家用電器用戶行為分析與事件識(shí)別182 10.1 背景與挖掘目標(biāo)182 10.2 分析方法與過(guò)程183 10.2.1 數(shù)據(jù)抽取184 10.2.2 數(shù)據(jù)探索分析185 10.2.3 數(shù)據(jù)預(yù)處理185 10.2.4 模型構(gòu)建195 10.2.5 模型檢驗(yàn)198 10.3 上機(jī)實(shí)驗(yàn)200 10.4 拓展思考201 10.5 小結(jié)202 第11章 應(yīng)用系統(tǒng)負(fù)載分析與磁盤(pán)容量預(yù)測(cè)203 11.1 背景與挖掘目標(biāo)203 11.2 分析方法與過(guò)程205 11.2.1 數(shù)據(jù)抽取206 11.2.2 數(shù)據(jù)探索分析206 11.2.3 數(shù)據(jù)預(yù)處理207 11.2.4 模型構(gòu)建208 11.3 上機(jī)實(shí)驗(yàn)213 11.4 拓展思考214 11.5 小結(jié)215 第12章 電子商務(wù)智能推薦服務(wù)216 12.1 背景與挖掘目標(biāo)216 12.2 分析方法與過(guò)程222 12.2.1 數(shù)據(jù)抽取224 12.2.2 數(shù)據(jù)探索分析225 12.2.3 數(shù)據(jù)預(yù)處理230 12.2.4 模型構(gòu)建235 12.3 上機(jī)實(shí)驗(yàn)245 12.4 拓展思考246 12.5 小結(jié)251 第13章 基于數(shù)據(jù)挖掘技術(shù)的市財(cái)政收入分析預(yù)測(cè)模型252 13.1 背景與挖掘目標(biāo)252 13.2 分析方法與過(guò)程254 13.2.1 灰色預(yù)測(cè)與神經(jīng)網(wǎng)絡(luò)的組合模型255 13.2.2 數(shù)據(jù)探索分析256 13.2.3 模型構(gòu)建259 13.3 上機(jī)實(shí)驗(yàn)273 13.4 拓展思考273 13.5 小結(jié)274 第14章 基于基站定位數(shù)據(jù)的商圈分析275 14.1 背景與挖掘目標(biāo)275 14.2 分析方法與過(guò)程277 14.2.1 數(shù)據(jù)抽取277 14.2.2 數(shù)據(jù)探索分析278 14.2.3 數(shù)據(jù)預(yù)處理279 14.2.4 模型構(gòu)建282 14.3 上機(jī)實(shí)驗(yàn)286 14.4 拓展思考286 14.5 小結(jié)287 第15章 電商產(chǎn)品評(píng)論數(shù)據(jù)情感分析288 15.1 背景與挖掘目標(biāo)288 15.2 分析方法與過(guò)程288 15.2.1 評(píng)論數(shù)據(jù)采集289 15.2.2 評(píng)論預(yù)處理292 15.2.3 文本評(píng)論分詞297 15.2.4 模型構(gòu)建298 15.3 上機(jī)實(shí)驗(yàn)312 15.4 拓展思考313 15.5 小結(jié)314 提 高 篇 第16章 基于R語(yǔ)言的數(shù)據(jù)挖掘二次開(kāi)發(fā)316 16.1 混合編程應(yīng)用體驗(yàn)——TipDM數(shù)據(jù)挖掘平臺(tái)316 16.2 二次開(kāi)發(fā)過(guò)程環(huán)境配置320 16.3 R語(yǔ)言數(shù)據(jù)挖掘二次開(kāi)發(fā)實(shí)例322 16.4 小結(jié)325 參考資料326
使用說(shuō)明
1、下載并解壓,得出pdf文件
2、如果打不開(kāi)本文件,請(qǐng)務(wù)必下載pdf閱讀器
3、安裝后,在打開(kāi)解壓得出的pdf文件
4、雙擊進(jìn)行閱讀
- 下載地址
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
有問(wèn)題? 點(diǎn)此報(bào)錯(cuò)
發(fā)表評(píng)論
1人參與,1條評(píng)論- 第1樓山西省長(zhǎng)治市移動(dòng)網(wǎng)友發(fā)表于: 2020-03-08 18:19:10
- 非常感謝0蓋樓(回復(fù))
軟件排行榜
熱門(mén)推薦
- 瀟湘書(shū)院電腦版 v2.3.13.888官方版49.64M / 簡(jiǎn)體中文
- 南方Plus電腦版 v12.0.027.06M / 簡(jiǎn)體中文
- cnki全球?qū)W術(shù)快報(bào)電腦版 v1.0.2140.3M / 簡(jiǎn)體中文
- 得間免費(fèi)小說(shuō)電腦版 v5.3.1.372.86M / 簡(jiǎn)體中文
- 網(wǎng)易新聞電腦版 v113.297.68M / 簡(jiǎn)體中文
- 開(kāi)源閱讀電腦版 v3.2517.96M / 簡(jiǎn)體中文
- 網(wǎng)易云閱讀電腦版 v6.7.226.41M / 簡(jiǎn)體中文
- PHP語(yǔ)言精粹電子書(shū) pdf掃描版25.72M / 簡(jiǎn)體中文
- docker入門(mén)實(shí)戰(zhàn) pdf完整版1.38M / 簡(jiǎn)體中文
- Scala程序設(shè)計(jì)第二版 pdf高清完整版15.83M / 簡(jiǎn)體中文