图书介绍

数据挖掘原理、算法及应用2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据挖掘原理、算法及应用
  • 李爱国,厍向阳编著 著
  • 出版社: 西安:西安电子科技大学出版社
  • ISBN:9787560627311
  • 出版时间:2012
  • 标注页数:255页
  • 文件大小:29MB
  • 文件页数:262页
  • 主题词:数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘原理、算法及应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 数据挖掘的概念和定义1

1.1.1 从商业角度看数据挖掘技术1

1.1.2 数据挖掘的技术含义1

1.2 数据挖掘的历史及发展2

1.3 数据挖掘的研究内容及功能4

1.3.1 数据挖掘的研究内容4

1.3.2 数据挖掘的功能6

1.4 数据挖掘的常用技术及工具8

1.4.1 数据挖掘的常用技术8

1.4.2 数据挖掘的工具8

1.5 数据挖掘的应用热点9

1.6 小结10

习题10

第2章 数据预处理11

2.1 数据预处理的目的11

2.2 数据清理12

2.2.1 空缺值12

2.2.2 噪声数据13

2.2.3 不一致数据14

2.3 数据集成和数据变换14

2.3.1 数据集成15

2.3.2 数据变换15

2.4 数据归约17

2.4.1 维归约17

2.4.2 数据压缩18

2.4.3 数值归约19

2.5 数据离散化和概念分层22

2.5.1 数值数据的离散化和概念分层生成22

2.5.2 分类数据的概念分层生成24

2.6 特征选择与提取25

2.6.1 基本概念25

2.6.2 特征提取26

2.6.3 特征选择26

2.7 小结27

习题28

第3章 关联规则挖掘29

3.1 基本概念29

3.2 关联规则挖掘算法30

3.2.1 项目集空间理论30

3.2.2 经典的发现频繁项目集算法31

3.2.3 由频繁项集产生关联规则35

3.3 Apriori改进算法37

3.3.1 Apriori算法的瓶颈37

3.3.2 改进算法37

3.4 不候选产生挖掘频繁项集38

3.5 使用垂直数据格式挖掘频繁项集41

3.6 挖掘闭频繁项集42

3.7 挖掘各种类型的关联规则47

3.7.1 挖掘多层关联规则47

3.7.2 多维关联规则挖掘50

3.8 相关分析51

3.8.1 强关联规则不一定有趣的例子52

3.8.2 从关联分析到相关分析52

3.9 基于约束的关联规则55

3.9.1 关联规则的元规则制导挖掘55

3.9.2 规则约束制导的挖掘56

3.10 矢量空间数据库中关联规则的挖掘58

3.10.1 问题的提出58

3.10.2 面向空间数据挖掘的数据准备58

3.10.3 矢量空间数据库中关联规则挖掘60

3.10.4 应用实例61

3.11 小结62

习题64

第4章 分类和预测65

4.1 分类和预测的基本概念和步骤65

4.2 基于相似性的分类算法67

4.3 决策树分类算法69

4.3.1 决策树基本算法概述70

4.3.2 ID3算法71

4.3.3 C4.5算法77

4.4 贝叶斯分类算法80

4.4.1 贝叶斯定理80

4.4.2 朴素贝叶斯分类80

4.4.3 贝叶斯信念网83

4.5 人工神经网络(ANN)86

4.5.1 人工神经网络的基本概念86

4.5.2 感知器89

4.5.3 多层人工神经网络91

4.6 支持向量机95

4.6.1 最大边缘超平面95

4.6.2 线性支持向量机:可分情况97

4.6.3 线性支持向量机:不可分情况101

4.6.4 非线性支持向量机103

4.6.5 支持向量机的特征106

4.7 预测107

4.7.1 线性回归107

4.7.2 非线性回归109

4.7.3 其他基于回归的方法109

4.8 预测和分类中的准确率、误差的度量110

4.8.1 分类器准确率度量110

4.8.2 预测器误差度量112

4.9 评估分类器或预测器的准确率113

4.9.1 保持方法和随机子抽样113

4.9.2 交叉确认113

4.9.3 自助法113

4.10 小结114

习题115

第5章 聚类方法118

5.1 概述118

5.1.1 聚类分析在数据挖掘中的应用119

5.1.2 聚类分析算法的概念与基本分类119

5.1.3 距离与相似性的度量122

5.2 划分聚类方法123

5.2.1 k-平均算法124

5.2.2 k-中心点算法125

5.2.3 基于遗传算法的k-中心点聚类算法127

5.3 层次聚类方法130

5.3.1 凝聚和分裂层次聚类130

5.3.2 BIRCH聚类算法132

5.3.3 CURE聚类算法134

5.3.4 Chameleon聚类算法136

5.4 密度聚类方法139

5.4.1 DBSCAN139

5.4.2 OPTICS:通过点排序识别聚类结构143

5.5 基于网格聚类方法146

5.5.1 基本的基于网格聚类算法146

5.5.2 STING:统计信息网格149

5.5.3 WaveCluster:利用小波变换聚类150

5.5.4 CLIQUE:维增长子空间聚类方法151

5.6 神经网络聚类方法:SOM153

5.7 异常检测156

5.7.1 预备知识157

5.7.2 统计方法160

5.7.3 基于邻近度的离群点检测164

5.7.4 基于密度的离群点检测166

5.7.5 基于聚类的技术168

5.8 小结171

习题172

第6章 时间序列数据挖掘173

6.1 概述173

6.2 时间序列数据建模173

6.3 时间序列预测175

6.3.1 局域线性化方法175

6.3.2 局域线性化方法的改进175

6.3.3 神经网络方法177

6.4 时间序列数据库相似搜索178

6.4.1 问题描述178

6.4.2 时间序列相似性定义178

6.4.3 高级数据表示与索引178

6.4.4 相似搜索算法的性能评价181

6.5 从时间序列数据中发现感兴趣模式182

6.5.1 发现周期模式182

6.5.2 发现例外模式183

6.6 小结190

习题190

第7章 Web挖掘191

7.1 Web挖掘的分类及其数据来源191

7.1.1 Web挖掘的分类191

7.1.2 Web数据来源193

7.2 Web日志挖掘193

7.3 Web内容挖掘195

7.4 小结195

习题196

第8章 复杂类型数据挖掘197

8.1 空间数据挖掘197

8.1.1 空间数据挖掘的基础198

8.1.2 空间数据挖掘的过程202

8.1.3 空间统计学204

8.1.4 空间数据立方体构造和空间OLAP205

8.1.5 空间关联和并置模式208

8.1.6 空间聚类方法209

8.1.7 空间分类和空间趋势分析230

8.2 文本数据挖掘230

8.2.1 文本数据分析和信息检索230

8.2.2 文本的维度归约235

8.2.3 文本挖掘方法237

8.3 多媒体数据挖掘240

8.3.1 多媒体数据的相似性搜索240

8.3.2 多媒体数据的多维分析241

8.3.3 多媒体数据的分类和预测分析242

8.3.4 基于分类规则挖掘的遥感影像分类243

8.3.5 挖掘多媒体数据中的关联250

8.3.6 音频和视频数据挖掘250

8.4 小结251

习题252

参考文献254

热门推荐