首 頁(yè)
手機(jī)版

數(shù)據(jù)挖掘:概念模型方法和算法(第2版)pdf 坎塔爾季奇 高清掃描版

一本介紹數(shù)據(jù)挖掘的概念、模型、方法和算法的計(jì)算機(jī)科學(xué)經(jīng)典教材

數(shù)據(jù)挖掘:概念模型方法和算法(第2版)是一本數(shù)據(jù)挖掘原理講解書(shū)籍,由[美]坎塔爾季奇Mehmed Kantardzic著,王曉海,吳志剛共同翻譯。全書(shū)講解了DBSCAN、BIRCH和分布式DBSCAN的聚類(lèi)算法,介紹了貝葉斯網(wǎng)絡(luò),并討論了圖形中的Betweeness和Centrality參數(shù)測(cè)量算法,分析在建立決策樹(shù)時(shí)使用的cart算法和基尼指數(shù),討論relief以及pagerank算法,更詳細(xì)地講解數(shù)據(jù)挖掘技術(shù)商業(yè)、隱私、安全和法律方面的內(nèi)容等等,能夠適用于在校生,畢業(yè)生,研究人員閱讀。

數(shù)據(jù)挖掘:概念模型方法和算法pdf

內(nèi)容介紹

隨著數(shù)據(jù)集規(guī)模和復(fù)雜度的持續(xù)上升,分析員必須利用更高級(jí)的軟件工具來(lái)執(zhí)行間接的、自動(dòng)的智能化數(shù)據(jù)分析?!稊?shù)據(jù)挖掘:概念模型方法和算法(第2版)》介紹了通過(guò)分析高維數(shù)據(jù)空間中的海量原始數(shù)據(jù)來(lái)提取用于決策的新信息的尖端技術(shù)和方法。本書(shū)開(kāi)篇闡述數(shù)據(jù)挖掘原理,此后在示例的引導(dǎo)下詳細(xì)講解起源于統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯和演化計(jì)算等學(xué)科的具有代表性的、最前沿的挖掘方法和算法。本書(shū)還著重描述如何恰當(dāng)?shù)剡x擇方法和數(shù)據(jù)分析軟件并合理地調(diào)整參數(shù)。每章末尾附有復(fù)習(xí)題。

本書(shū)主要用作計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程和計(jì)算機(jī)信息系統(tǒng)專(zhuān)業(yè)的研究生數(shù)據(jù)挖掘教材,高年級(jí)本科生或具備同等教育背景的讀者也完全可以理解本書(shū)的所有主題。

使用說(shuō)明

1、下載并解壓,得出pdf文件

2、如果打不開(kāi)本文件,請(qǐng)務(wù)必下載pdf閱讀器

3、安裝后,在打開(kāi)解壓得出的pdf文件

4、雙擊進(jìn)行閱讀試讀

數(shù)據(jù)挖掘:概念模型方法和算法(第2版)章節(jié)目錄

第1章 數(shù)據(jù)挖掘的概念

1.1 概述

1.2 數(shù)據(jù)挖掘的起源

1.3 數(shù)據(jù)挖掘過(guò)程

1.4 大型數(shù)據(jù)集

1.5 數(shù)據(jù)倉(cāng)庫(kù)

1.6 數(shù)據(jù)挖掘的商業(yè)方面:為什么數(shù)據(jù)挖掘項(xiàng)目會(huì)失敗

1.7 本書(shū)結(jié)構(gòu)安排

1.8 復(fù)習(xí)題

1.9 參考書(shū)

第2章 數(shù)據(jù)準(zhǔn)備

2.1 原始數(shù)據(jù)的表述

2.2 原始數(shù)據(jù)的特性

2.3 原始數(shù)據(jù)的轉(zhuǎn)換

2.3.1 標(biāo)準(zhǔn)化

2.3.2 數(shù)據(jù)平整

2.3.3 差值和比率

2.4 丟失數(shù)據(jù)

2.5 時(shí)間相關(guān)數(shù)據(jù)

2.6 異常點(diǎn)分析

2.7 復(fù)習(xí)題

2.8 參考書(shū)目

第3章 數(shù)據(jù)歸約

3.1 大型數(shù)據(jù)集的維度

3.2 特征歸約

3.2.1 特征選擇

3 .2.2 特征提取

3.3 Relief算法

3.4 特征排列的熵度量

3.5 主成分分析

3.6 值歸約

3.7 特征離散化ChiMerge技術(shù)

3.8 案例歸約

3.9 復(fù)習(xí)題

3.10 參考書(shū)目

第4章 從數(shù)據(jù)中學(xué)習(xí)

4.1 學(xué)習(xí)機(jī)器

4.2 統(tǒng)計(jì)學(xué)習(xí)原理

4.3 學(xué)習(xí)方法的類(lèi)型

4.4 常見(jiàn)的學(xué)習(xí)任務(wù)

4.5 支持向量機(jī)

4.6 kNN:最近鄰分類(lèi)器

4.7 模型選擇與泛化

4.8 模型的評(píng)估

4.9 90%準(zhǔn)確的情形

4.9.1 保險(xiǎn)欺詐檢測(cè)

4.9.2 改進(jìn)心臟護(hù)理

4.10 復(fù)習(xí)題

4.11 參考書(shū)目

第5章 統(tǒng)計(jì)方法

5.1 統(tǒng)計(jì)推斷

5.2 評(píng)測(cè)數(shù)據(jù)集的差異

5.3 貝葉斯定理

5.4 預(yù)測(cè)回歸

5.5 方差分析

5.6 對(duì)數(shù)回歸

5.7 對(duì)數(shù)-線性模型

5.8 線性判別分析

5.9 復(fù)習(xí)題

5.10 參考書(shū)目

第6章 決策樹(shù)和決策規(guī)則

6.1 決策樹(shù)

6.2 C4.5算法:生成決策樹(shù)

6.3 未知屬性值

6.4 修剪決策樹(shù)

6.5 C4.5算法:生成決策規(guī)則

6.6 CART算法和Gini指標(biāo)

6.7 決策樹(shù)和決策規(guī)則的局限性

6.8 復(fù)習(xí)題

6.9 參考書(shū)目

第7章 人工神經(jīng)網(wǎng)絡(luò)

7.1 人工神經(jīng)元的模型

7.2 人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)

7.3 學(xué)習(xí)過(guò)程

7.4 使用ANN完成的學(xué)習(xí)任務(wù)

7.4.1 模式聯(lián)想

7.4.2 模式識(shí)別

7.5 多層感知機(jī)

7.6 競(jìng)爭(zhēng)網(wǎng)絡(luò)和競(jìng)爭(zhēng)學(xué)習(xí)

7.7 SoM

7.8 復(fù)習(xí)題

7.9 參考書(shū)目

第8章 集成學(xué)習(xí)

8.1 集成學(xué)習(xí)方法論

8.2 多學(xué)習(xí)器組合方案

8.3 bagging和boosting

8.4 AdaBoost算法

8.5 復(fù)習(xí)題

8.6 參考書(shū)目

第9章 聚類(lèi)分析

9.1 聚類(lèi)的概念

9.2 相似度的度量

9.3 凝聚層次聚類(lèi)

9.4 分區(qū)聚類(lèi)

9.5 增量聚類(lèi)

9.6 DBSCAN箅法

9.7 BIRCH算法

9.8 聚類(lèi)驗(yàn)證

9.9 復(fù)習(xí)題

9.10 參考書(shū)目

第10章 關(guān)聯(lián)規(guī)則

10.1 購(gòu)物籃分析

10.2 Apriori算法

10.3 從頻繁項(xiàng)集中得到關(guān)聯(lián)規(guī)則

10.4 提高Apriori算法的效率

10.5 FP增長(zhǎng)方法

10.6 關(guān)聯(lián)分類(lèi)方法

10.7 多維關(guān)聯(lián)規(guī)則挖掘

10.8 復(fù)習(xí)題

10.9 參考書(shū)目

第11章 Web挖掘和文本挖掘

11.1Web挖掘

11.2 Web內(nèi)容、結(jié)構(gòu)與使用挖掘

11.3 HITS和LOGSOM算法

11.4 挖掘路徑遍歷模式

11.5 PageRank算法

11.6 文本挖掘

11.7 潛在語(yǔ)義分析

11.8 復(fù)習(xí)題

11.9 參考書(shū)目

第12章 數(shù)據(jù)挖掘高級(jí)技術(shù)

12.1 圖挖掘

第13章 遺傳算法

第14章 模糊集和模糊邏輯

第15章 可視化方法

附錄A 數(shù)據(jù)挖掘工具

附錄B 數(shù)據(jù)挖掘應(yīng)用

收起介紹展開(kāi)介紹
  • 下載地址
數(shù)據(jù)挖掘:概念模型方法和算法(第2版)pdf 坎塔爾季奇 高清掃描版

有問(wèn)題? 點(diǎn)此報(bào)錯(cuò)

發(fā)表評(píng)論

1人參與,1條評(píng)論
第1樓河南省新鄉(xiāng)市移動(dòng)網(wǎng)友發(fā)表于: 2020-04-01 14:11:48
很棒啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
0蓋樓(回復(fù))

熱門(mén)推薦