首 頁
手機版

數(shù)據(jù)挖掘:R語言實戰(zhàn)pdf 黃文 掃描版

一本全面介紹R的數(shù)據(jù)挖掘流程、算法包的使用及相關(guān)工具應(yīng)用的教材叢書

數(shù)據(jù)挖掘:R語言實戰(zhàn)pdf是一本R語言的實戰(zhàn)手冊,由黃文和王正林兩人共同編著。本書側(cè)重使用R進行數(shù)據(jù)挖掘,重點講述了R的數(shù)據(jù)挖掘流程、算法包的使用及相關(guān)工具的應(yīng)用,同時結(jié)合大量精選的數(shù)據(jù)挖掘?qū)嵗龑軟件進行深入潛出和全面的介紹,以便讀者能深刻理解R的精髓并能快速、高效和靈活地掌握使用R進行數(shù)據(jù)挖掘的技巧。通過閱讀數(shù)據(jù)挖掘r語言實戰(zhàn),讀者不僅能掌握使用R及相關(guān)的算法包來快速解決實際問題的方法,而且能得到從實際問題分析入手,到利用R進行求解,以及對挖掘結(jié)果進行分析的全面訓(xùn)練。

數(shù)據(jù)挖掘r語言實戰(zhàn)電子版

內(nèi)容介紹

R是一個免費的開源軟件,它提供了首屈一指的統(tǒng)計計算和繪圖功能,尤其是大量的數(shù)據(jù)挖掘方面的算法包,使得它成為一款優(yōu)秀的、不可多得的數(shù)據(jù)挖掘工具軟件。本書的主要目的是向讀者介紹如何用R進行數(shù)據(jù)挖掘,通過大量的精選實例,循序漸進、全面系統(tǒng)地講述R在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用。

數(shù)據(jù)挖掘r語言實戰(zhàn)以數(shù)據(jù)預(yù)處理、基本算法及應(yīng)用和高級算法及應(yīng)用這三篇展開。

(1)上篇:數(shù)據(jù)預(yù)處理’

由第1—5章組成,首先簡要介紹數(shù)據(jù)挖掘流程、算法和工具,然后介紹R中的數(shù)據(jù)分類和數(shù)據(jù)集,以及使用R獲取數(shù)據(jù)的多種靈活的方法。最后講述對數(shù)據(jù)進行探索性分析和預(yù)處理的方法。這些內(nèi)容是使用R進行數(shù)據(jù)挖掘的最基礎(chǔ)內(nèi)容。

(2)中篇:基本算法及應(yīng)用

由第6—9章組成,主要講述數(shù)據(jù)挖掘的基本算法及應(yīng)用,包括關(guān)聯(lián)分析、聚類分析、判別分析和決策樹,這些算法也是數(shù)據(jù)挖掘使用最多最普遍的算法。R中提供了豐富的、功能強大的算法包和實現(xiàn)函數(shù),數(shù)據(jù)挖掘的初級和中級用戶務(wù)必掌握。

(3)下篇:高級算法及應(yīng)用

由第10—14章組成,主要講述數(shù)據(jù)挖掘的高級算法及應(yīng)用,包括集成學(xué)習(xí)、隨機森林、支持向量機和神經(jīng)網(wǎng)絡(luò),以及使用R中的工具對數(shù)據(jù)挖掘的模型進行評估與選擇。對于中高級的用戶,可以深入學(xué)習(xí)一下本篇的內(nèi)容。

使用說明

1、下載并解壓,得出pdf文件

2、如果打不開本文件,請務(wù)必下載pdf閱讀器

3、安裝后,在打開解壓得出的pdf文件

4、雙擊進行閱讀試讀

章節(jié)目錄

第0章 致敬,R!

致敬,肩膀!

致敬,時代!

致敬,人才!

致敬,R 瑟!

上篇 數(shù)據(jù)預(yù)處理

第1章 數(shù)據(jù)挖掘?qū)б?/strong>

1.1 數(shù)據(jù)挖掘概述

1.1.1 數(shù)據(jù)挖掘的過程

1.1.2 數(shù)據(jù)挖掘的對象

1.1.3 數(shù)據(jù)挖掘的方法

1.1.4 數(shù)據(jù)挖掘的應(yīng)用

1.2 數(shù)據(jù)挖掘的算法

1.3 數(shù)據(jù)挖掘的工具

1.3.1 工具的分類

1.3.2 工具的選擇

1.3.3 商用的工具

1.3.4 開源的工具

1.4 R 在數(shù)據(jù)挖掘中的優(yōu)勢

數(shù)據(jù)挖掘:R 語言實戰(zhàn)

VI

第2章 數(shù)據(jù)概覽

2.1 n×m 數(shù)據(jù)集

2.2 數(shù)據(jù)的分類

2.2.1 一般的數(shù)據(jù)分類

2.2.2 R 的數(shù)據(jù)分類

2.2.3 用R 簡單處理數(shù)據(jù)

2.3 數(shù)據(jù)抽樣及R 實現(xiàn)

2.3.1 簡單隨機抽樣

2.3.2 分層抽樣

2.3.3 整群抽樣

2.4 訓(xùn)練集與測試集

2.5 本章匯總

第3章 用R 獲取數(shù)據(jù)

3.1 獲取內(nèi)置數(shù)據(jù)集

3.1.1 datasets 數(shù)據(jù)集

3.1.2 包的數(shù)據(jù)集

3.2 獲取其他格式的數(shù)據(jù)

3.2.1 CSV 與TXT 格式

3.2.2 從Excel 直接獲取數(shù)據(jù)

3.2.3 從其他統(tǒng)計軟件中獲取數(shù)據(jù)

3.3 獲取數(shù)據(jù)庫數(shù)據(jù)

3.4 獲取網(wǎng)頁數(shù)據(jù)

3.5 本章匯總

第4章 探索性數(shù)據(jù)分析

4.1 數(shù)據(jù)集

4.2 數(shù)字化探索

4.2.1 變量概況

4.2.2 變量詳情

4.2.3 分布指標

4.2.4 稀疏性

4.2.5 缺失值

4.2.6 相關(guān)性

4.3 可視化探索

4.3.1 直方圖

目 錄

VII

4.3.2 累積分布圖

4.3.3 箱形圖

4.3.4 條形圖

4.3.5 點陣圖

4.3.6 餅圖

4.5 本章匯總

第5章 數(shù)據(jù)預(yù)處理

5.1 數(shù)據(jù)集加載

5.2 數(shù)據(jù)清理

5.2.1 缺失值處理

5.2.2 噪聲數(shù)據(jù)處理

5.2.3 數(shù)據(jù)不一致的處理

5.3 數(shù)據(jù)集成

5.4 數(shù)據(jù)變換

5.5 數(shù)據(jù)歸約

5.6 本章匯總

中篇 基本算法及應(yīng)用

第6章 關(guān)聯(lián)分析

6.1 概述

6.2 R 中的實現(xiàn)

6.2.1 相關(guān)軟件包

6.2.2 核心函數(shù)

6.2.3 數(shù)據(jù)集

6.3 應(yīng)用案例

6.3.1 數(shù)據(jù)初探

6.3.2 對生成規(guī)則進行強度控制

6.3.3 一個實際應(yīng)用

6.3.4 改變輸出結(jié)果形式

6.3.5 關(guān)聯(lián)規(guī)則的可視化

6.4 本章匯總

第7章 聚類分析

7.1 概述

7.1.1 K-均值聚類

數(shù)據(jù)挖掘:R 語言實戰(zhàn)

VIII

7.1.2 K-中心點聚類

7.1.3 系譜聚類

7.1.4 密度聚類

7.1.5 期望最大化聚類

7.2 R 中的實現(xiàn)

7.2.1 相關(guān)軟件包

7.2.2 核心函數(shù)

7.2.3 數(shù)據(jù)集

7.3 應(yīng)用案例

7.3.1 K-均值聚類

7.3.2 K-中心點聚類

7.3.3 系譜聚類

7.3.4密度聚類

7.3.5 期望最大化聚類

7.4 本章匯總

第8章 判別分析

8.1 概述

8.1.1 費希爾判別

8.1.2貝葉斯判別

8.1.3 距離判別

8.2 R 中的實現(xiàn)

8.2.1 相關(guān)軟件包

8.2.2 核心函數(shù)

8.2.3 數(shù)據(jù)集

8.3 應(yīng)用案例

8.3.1 線性判別分析

8.3.2 樸素貝葉斯分類

8.3.3 K 最近鄰

8.3.4 有權(quán)重的K 最近鄰算法

8.4 推薦系統(tǒng)綜合實例

8.4.1 kNN 與推薦

8.4.2 MovieLens 數(shù)據(jù)集說明

8.4.3 綜合運用

8.5 本章匯總

目 錄

IX

第9章 決策樹

9.1 概述

9.1.1 樹形結(jié)構(gòu)

9.1.2 樹的構(gòu)建

9.1.3 常用算法

9.2 R 中的實現(xiàn)

9.2.1 相關(guān)軟件包

9.2.2 核心函數(shù)

9.2.3 數(shù)據(jù)集

9.3 應(yīng)用案例

9.3.1 CART 應(yīng)用

9.3.2 C4.5 應(yīng)用

9.4 本章匯總

下篇 高級算法及應(yīng)用

第10章 集成學(xué)習(xí)

10.1 概述

10.1.1 一個概率論小計算

10.1.2 Bagging 算法

10.1.3 AdaBoost 算法

10.2 R 中的實現(xiàn)

10.2.1 相關(guān)軟件包

10.2.2 核心函數(shù)

10.2.3 數(shù)據(jù)集

10.3 應(yīng)用案例

10.3.1 Bagging 算法

10.3.2 Adaboost 算法

10.4 本章匯總

第11章 隨機森林

11.1 概述

11.1.1 基本原理

11.1.2 重要參數(shù)

11.2 R 中的實現(xiàn)

11.2.1 相關(guān)軟件包

數(shù)據(jù)挖掘:R 語言實戰(zhàn)

X

11.2.2 核心函數(shù)

11.2.3 可視化分析

11.3 應(yīng)用案例

11.3.1 數(shù)據(jù)處理

11.3.2 建立模型

11.3.3 結(jié)果分析

11.3.4 自變量的重要程度

11.3.5 優(yōu)化建模

11.4 本章匯總

第12章 支持向量機

12.1 概述

12.1.1 結(jié)構(gòu)風(fēng)險最小原理

12.1.2 函數(shù)間隔與幾何間隔

12.1.3 核函數(shù)

12.2 R 中的實現(xiàn)

12.2.1 相關(guān)軟件包

12.2.2 核心函數(shù)

12.2.3 數(shù)據(jù)集

12.3 應(yīng)用案例

12.3.1 數(shù)據(jù)初探

12.3.2 建立模型

12.3.3 結(jié)果分析

12.3.4 預(yù)測判別

12.3.5 綜合建模

12.3.6 可視化分析

12.3.7 優(yōu)化建模

12.4 本章匯總

第13章 神經(jīng)網(wǎng)絡(luò)

13.1 概述

13.2 R 中的實現(xiàn)

13.2.1 相關(guān)軟件包

13.2.2 核心函數(shù)

13.3 應(yīng)用案例

13.3.1 數(shù)據(jù)初探

目 錄

XI

13.3.2 數(shù)據(jù)處理

13.3.3 建立模型

13.3.4 結(jié)果分析

13.3.5 預(yù)測判別

13.3.6 模型差異分析

13.3.7 優(yōu)化建模

13.4 本章匯總第14章 模型評估與選擇

14.1 評估過程概述

14.2 安裝Rattle 包

14.3 Rattle 功能簡介

14.3.1 Data――選取數(shù)據(jù)

14.3.2 Explore――數(shù)據(jù)探究

14.3.3 Test――數(shù)據(jù)相關(guān)檢驗

14.3.4 Transform――數(shù)據(jù)預(yù)處理

14.3.5 Cluster――數(shù)據(jù)聚類

14.3.6 Model――模型評估

14.3.7 Evaluate――模型評估

14.3.8 Log――模型評估記錄

14.4 模型評估相關(guān)概念

14.4.1 誤判率

14.4.2 正確/錯誤的肯定判斷、正確/錯誤的否定判斷

14.4.3 精確度、敏感度及特異性

14.5 Rattle 在模型評估中的應(yīng)用

14.5.1 混淆矩陣

14.5.2 風(fēng)險圖

14.5.3 ROC 圖及相關(guān)圖表

14.5.4 模型得分數(shù)據(jù)集

14.6 綜合實例

14.6.1 數(shù)據(jù)介紹

14.6.2 模型建立

14.6.3 模型結(jié)果分析

數(shù)據(jù)挖掘:R 語言實戰(zhàn)

收起介紹展開介紹
  • 下載地址
數(shù)據(jù)挖掘:R語言實戰(zhàn)pdf 黃文 掃描版

有問題? 點此報錯

發(fā)表評論

0條評論