首 頁
手機版

數(shù)據(jù)挖掘十大算法 吳信東pdf掃描版

數(shù)據(jù)挖掘十大算法是一本數(shù)據(jù)挖掘領域的著作,由美國數(shù)據(jù)挖掘?qū)<覅切艝|和庫瑪爾編著。本書詳細介紹了在實際中用途影響十種數(shù)據(jù)挖掘算法,包括C4.5、k-means、SVM、Apriori、EM、PageRank、AdaBoost、kNN、Naive Bayes和CART十個算法,這十種算法是數(shù)據(jù)挖掘領域的專家進行投票篩選的,覆蓋了分類、聚類、統(tǒng)計學習、關聯(lián)分析和鏈接分析等重要的數(shù)據(jù)挖掘研究和發(fā)展主題,并且每一種算法都進行了多個角度的深入剖析,包括算法歷史、算法過程、算法特性、軟件實現(xiàn)、前沿發(fā)展等,另外每章末尾給出了豐富的習題和精挑細選的參考文獻,對數(shù)據(jù)挖掘、機器學習和人工智能等學科的課程的設計有指導意義。

內(nèi)容介紹

《數(shù)據(jù)挖掘十大算法》詳細介紹了在實際中用途影響十種數(shù)據(jù)挖掘算法,這十種算法是數(shù)據(jù)挖掘領域的專家進行投票篩選的,覆蓋了分類、聚類、統(tǒng)計學習、關聯(lián)分析和鏈接分析等重要的數(shù)據(jù)挖掘研究和發(fā)展主題。全書對每一種算法都進行了多個角度的深入剖析,包括算法歷史、算法過程、算法特性、軟件實現(xiàn)、前沿發(fā)展等,此外,在每章最后還給出了豐富的習題和精挑細選的參考文獻,對于讀者掌握算法基本知識和進一步研究都非常有價值,對數(shù)據(jù)挖掘、機器學習和人工智能等學科的課程的設計有指導意義。

本書的每一章都邀請兩位獨立審稿人和本書的一位編輯來審核,有的章節(jié)在此基礎上要在最終定稿前再重審一遍。我們希望這十個算法的遴選能有助于在世界范圍推動數(shù)據(jù)挖掘的應用,激勵更多數(shù)據(jù)挖掘領域的學者去擴大這些算法的影響,探索新的研究內(nèi)容。

章節(jié)目錄

第1章 C4.5

1.1 引言

1.2 算法描述

1.3 算法特性

1.3.1 決策樹剪枝

1.3.2 連續(xù)型屬性

1.3.3 缺失值處理

1.3.4 規(guī)則集誘導

1.4 軟件實現(xiàn)

1.5 示例

1.5.1 Golf數(shù)據(jù)集

1.5.2 Soybean數(shù)據(jù)集

1.6 高級主題

1.6.1 二級存儲

1.6.2 斜決策樹

1.6.3 特征選擇

1.6.4 集成方法

1.6.5 分類規(guī)則

1.6.6 模型重述

1.7 習題

參考文獻

第2章 k-means

2.1 引言

2.2 算法描述

2.3 可用軟件

2.4 示例

2.5 高級主題

2.6 小結

2.7 習題

參考文獻

第3章 SVM:支持向量機

3.1 支持向量分類器

3.2 支持向量分類器的軟間隔優(yōu)化

3.3 核技巧

3.4 理論基礎

3.5 支持向量回歸器

3.6 軟件實現(xiàn)

3.7 當前和未來的研究

3.7.1 計算效率

3.7.2 核的選擇

3.7.3 泛化分析

3.7.4 結構化支持向量機的學習

3.8 習題

參考文獻

第4章 Apriori

4.1 引言

4.2 算法描述

4.2.1 挖掘頻繁模式和關聯(lián)規(guī)則

4.2.2 挖掘序列模式

4.2.3 討論

4.3 軟件實現(xiàn)

4.4 示例

4.4.1 可行示例

4.4.2 性能評估

4.5 高級主題

4.5.1 改進Apriori類型的頻繁模式挖掘

4.5.2 無候選的頻繁模式挖掘

4.5.3 增量式方法

4.5.4 稠密表示:閉合模式和最大模式

4.5.5 量化的關聯(lián)規(guī)則

4.5.6 其他的重要性/興趣度度量方法

4.5.7 類別關聯(lián)規(guī)則

4.5.8 使用更豐富的形式:序列、樹和圖

4.6 小結

4.7 習題

參考文獻

第5章 EM

5.1 引言

5.2 算法描述

……

第6章 PageRank

第7章 AdaBoost

第8章 kNN!k-最近鄰

第9章 Naive Bayes

第10章 CART:分類和回歸樹

使用說明

1、下載并解壓,得出pdf文件

2、如果打不開本文件,請務必下載pdf閱讀器

3、安裝后,在打開解壓得出的pdf文件

4、雙擊進行閱讀

收起介紹展開介紹
  • 下載地址
數(shù)據(jù)挖掘十大算法 吳信東pdf掃描版

有問題? 點此報錯

發(fā)表評論

0條評論