图书介绍

数据挖掘:概念与技术2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据挖掘:概念与技术
  • (加)韩家炜 坎伯(Kamber,M.)著;范明等译(郑州大学) 著
  • 出版社: 北京:机械工业出版社
  • ISBN:7111090489
  • 出版时间:2001
  • 标注页数:374页
  • 文件大小:27MB
  • 文件页数:389页
  • 主题词:暂缺

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘:概念与技术PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言1

1.1 什么激发了数据挖掘,为什么它是重要的1

1.2 什么是数据挖掘3

1.3 在何种数据上进行数据挖掘6

1.3.1 关系数据库7

1.3.2 数据仓库8

1.3.3 事务数据库10

1.3.4 高级数据库系统和高级数据库应用11

1.4 数据挖掘功能—可以挖掘什么类型的模式14

1.4.1 概念/类描述:特征化和区分14

1.4.2 关联分析15

1.4.3 分类和预测16

1.4.4 聚类分析16

1.4.5 孤立点分析17

1.4.6 演变分析17

1.5 所有模式都是有趣的吗18

1.6 数据挖掘系统的分类19

1.7 数据挖掘的主要问题20

1.8 小结22

习题22

文献注释23

第2章 数据仓库和数据挖掘的OLAP技术26

2.1 什么是数据仓库26

2.1.1 操作数据库系统与数据仓库的区别27

2.1.2 为什么需要一个分离的数据仓库29

2.2 多维数据模型29

2.2.1 由表和电子数据表到数据立方体29

2.2.2 星型、雪花和事实星座:多维数据库模式32

2.2.3 定义星型、雪花和事实星座模式的例子34

2.2.4 度量的分类和计算36

2.2.5 引入概念分层37

2.2.6 多维数据模型上的OLAP操作39

2.2.7 查询多维数据库的星型网查询模型41

2.3 数据仓库的系统结构42

2.3.1 数据仓库的设计步骤和结构42

2.3.2 三层数据仓库结构44

2.3.3 OLAP服务器类型:ROLAP,MOLAP,HOLAP的比较46

2.4 数据仓库实现47

2.4.1 数据立方体的有效计算47

2.4.2 索引OLAP数据52

2.4.3 OLAP查询的有效处理54

2.4.4 元数据存储55

2.4.5 数据仓库后端工具和实用程序56

2.5 数据立方体技术的进一步发展56

2.5.1 数据立方体发现驱动的探查56

2.5.2 多粒度上的复杂聚集:多特征方59

2.5.3 其他进展61

2.6 从数据仓库到数据挖掘61

2.6.1 数据仓库的使用62

2.6.2 从联机分析处理到联机分析挖掘63

2.7 小结65

习题66

文献注释68

第3章 数据预处理70

3.1 为什么要预处理数据70

3.2 数据清理72

3.2.1 空缺值72

3.2.2 噪声数据73

3.2.3 不一致数据74

3.3 数据集成和变换75

3.3.1 数据集成75

3.3.2 数据变换76

3.4 数据归约77

3.4.1 数据立方体聚集77

3.4.2 维归约79

3.4.3 数据压缩80

3.4.4 数值归约82

3.5 离散化和概念分层生成87

3.5.1 数值数据的离散化和概念分层生成88

3.5.2 分类数据的概念分层生成91

3.6 小结93

习题93

文献注释94

第4章 数据挖掘原语、语言和系统结构96

4.1 数据挖掘原语:定义数据挖掘任务96

4.1.1 任务相关的数据98

4.1.2 要挖掘的知识的类型99

4.1.3 背景知识:概念分层100

4.1.4 兴趣度度量102

4.1.5 发现模式的表示和可视化104

4.2 一种数据挖掘查询语言105

4.2.1 任务相关数据说明的语法107

4.2.2 指定挖掘知识类型的语法107

4.2.3 概念分层说明的语法109

4.2.4 兴趣度度量说明的语法110

4.2.5 模式表示和可视化说明的语法110

4.2.6 汇集—一个DMQL查询的例子111

4.2.7 其他数据挖掘语言和数据挖掘原语的标准化112

4.3 根据数据挖掘查询语言设计图形用户界面113

4.4 数据挖掘系统的结构113

4.5 小结115

习题115

文献注释117

第5章 概念描述:特征化与比较119

5.1 什么是概念描述119

5.2 数据概化和基于汇总的特征化120

5.2.1 面向属性的归纳120

5.2.2 面向属性归纳的有效实现124

5.2.3 导出概化的表示125

5.3 解析特征化:属性相关分析128

5.3.1 为什么进行属性相关分析129

5.3.2 属性相关分析方法129

5.3.3 解析特征化:一个例子131

5.4 挖掘类比较:区分不同的类132

5.4.1 类比较方法和实现133

5.4.2 类比较描述的表示135

5.4.3 类描述:特征化和比较的表示136

5.5 在大型数据库中挖掘描述统计度量137

5.5.1 度量中心趋势138

5.5.2 度量数据的离散度139

5.5.3 基本统计类描述的图形显示141

5.6 讨论144

5.6.1 概念描述:与典型的机器学习方法比较144

5.6.2 概念描述的增量挖掘和并行挖掘145

5.7 小结146

习题146

文献注释147

第6章 挖掘大型数据库中的关联规则149

6.1 关联规则挖掘149

6.1.1 购物篮分析:一个引发关联规则挖掘的例子150

6.1.2 基本概念150

6.1.3 关联规则挖掘:一个路线图151

6.2 由事务数据库挖掘单维布尔关联规则152

6.2.1 Apriori算法:使用候选项集找频繁项集152

6.2.2 由频繁项集产生关联规则156

6.2.3 提高Apriori的有效性157

6.2.4 不产生候选挖掘频繁项集158

6.2.5 冰山查询161

6.3 由事务数据库挖掘多层关联规则162

6.3.1 多层关联规则162

6.3.2 挖掘多层关联规则的方法163

6.3.3 检查冗余的多层关联规则166

6.4 由关系数据库和数据仓库挖掘多维关联规则167

6.4.1 多维关联规则167

6.4.2 使用量化属性的静态离散化挖掘多维关联规则168

6.4.3 挖掘量化关联规则169

6.4.4 挖掘基于距离的关联规则171

6.5 由关联挖掘到相关分析172

6.5.1 强关联规则不一定是有趣的:一个例子172

6.5.2 由关联分析到相关分析173

6.6 基于约束的关联挖掘174

6.6.1 关联规则的元规则制导挖掘174

6.6.2 用附加的规则约束制导的挖掘175

6.7 小结179

习题180

文献注释183

第7章 分类和预测185

7.1 什么是分类,什么是预测185

7.2 关于分类和预测的问题187

7.2.1 准备分类和预测的数据187

7.2.2 比较分类方法187

7.3 用判定树归纳分类188

7.3.1 判定树归纳189

7.3.2 树剪枝192

7.3.3 由判定树提取分类规则192

7.3.4 基本判定树归纳的加强193

7.3.5 判定树归纳的可伸缩性194

7.3.6 集成数据仓库技术和判定树归纳195

7.4 贝叶斯分类196

7.4.1 贝叶斯定理196

7.4.2 朴素贝叶斯分类197

7.4.3 贝叶斯信念网络199

7.4.4 训练贝叶斯信念网络200

7.5 后向传播分类201

7.5.1 多层前馈神经网络201

7.5.2 定义网络拓扑202

7.5.3 后向传播202

7.5.4 后向传播和可解释性206

7.6 基于源自关联规则挖掘概念的分类207

7.7 其他分类方法209

7.7.1 k-最临近分类209

7.7.2 基于案例的推理209

7.7.3 遗传算法210

7.7.4 粗糙集方法210

7.7.5 模糊集方法211

7.8 预测212

7.8.1 线性回归和多元回归212

7.8.2 非线性回归213

7.8.3 其他回归模型214

7.9 分类法的准确性214

7.9.1 评估分类法的准确率214

7.9.2 提高分类法的准确率215

7.9.3 准确率足够判定分类法吗216

7.10 小结217

习题218

文献注释219

第8章 聚类分析223

8.1 什么是聚类分析223

8.2 聚类分析中的数据类型225

8.2.1 区间标度变量226

8.2.2 二元变量227

8.2.3 标称型、序数型和比例标度型变量228

8.2.4 混合类型的变量230

8.3 主要聚类方法的分类231

8.4 划分方法232

8.4.1 典型的划分方法:k-平均和k-中心点232

8.4.2 大型数据库中的划分方法:从k-中心点到CLARANS235

8.5 层次方法236

8.5.1 凝聚的和分裂的层次聚类236

8.5.2 BIRCH:利用层次方法的平衡迭代归约和聚类238

8.5.3 CURE:利用代表点聚类239

8.5.4 Chameleon(变色龙):一个利用动态模型的层次聚类算法240

8.6 基于密度的方法242

8.6.1 DBSCAN:一个基于高密度连接区域的密度聚类方法242

8.6.2 OPTICS:通过对象排序识别聚类结构243

8.6.3 DENCLUE:基于密度分布函数的聚类245

8.7 基于网格的方法246

8.7.1 STING:统计信息网格247

8.7.2 WaveCluster:采用小波变换聚类248

8.7.3 CLIQUE:聚类高维空间249

8.8 基于模型的聚类方法251

8.8.1 统计学方法251

8.8.2 神经网络方法253

8.9 孤立点分析254

8.9.1 基于统计的孤立点检测255

8.9.2 基于距离的孤立点检测256

8.9.3 基于偏离的孤立点检测257

8.10 小结259

习题260

文献注释261

第9章 复杂类型数据的挖掘263

9.1 复杂数据对象的多维分析和描述性挖掘263

9.1.1 结构化数据的概化263

9.1.2 空间和多媒体数据概化中的聚集和近似计算264

9.1.3 对象标识符和类/子类层次的概化265

9.1.4 类复合层次的概化265

9.1.5 对象立方体的构造与挖掘266

9.1.6 用分而治之方法对规划数据库进行基于概化的挖掘266

9.2 空间数据库挖掘269

9.2.1 空间数据立方体构造和空间OLAP270

9.2.2 空间关联分析273

9.2.3 空间聚类方法273

9.2.4 空间分类和空间趋势分析274

9.2.5 光栅数据库挖掘274

9.3 多媒体数据库挖掘274

9.3.1 多媒体数据的相似性搜索275

9.3.2 多媒体数据的多维分析276

9.3.3 多媒体数据的分类和预测分析277

9.3.4 多媒体数据中的关联规则挖掘277

9.4 时序数据和序列数据的挖掘278

9.4.1 趋势分析279

9.4.2 时序分析中的相似搜索280

9.4.3 序列模式挖掘283

9.4.4 周期分析284

9.5 文本数据库挖掘285

9.5.1 文本数据分析和信息检索285

9.5.2 文本挖掘:基于关键字的关联和文档分类289

9.6 Web挖掘290

9.6.1 挖掘Web链接结构,识别权威Web页面291

9.6.2 Web文档的自动分类293

9.6.3 多层Web信息库的构造293

9.6.4 Web使用记录的挖掘294

9.7 小结295

习题296

文献注释297

第10章 数据挖掘的应用和发展趋势301

10.1 数据挖掘的应用301

10.1.1 针对生物医学和DNA数据分析的数据挖掘301

10.1.2 针对金融数据分析的数据挖掘302

10.1.3 零售业中的数据挖掘303

10.1.4 电信业中的数据挖掘304

10.2 数据挖掘系统产品和研究原型305

10.2.1 怎样选择一个数据挖掘系统305

10.2.2 商用数据挖掘系统的例子307

10.3 数据挖掘的其他主题308

10.3.1 视频和音频数据挖掘308

10.3.2 科学和统计数据挖掘311

10.3.3 数据挖掘的理论基础312

10.3.4 数据挖掘和智能查询应答313

10.4 数据挖掘的社会影响314

10.4.1 数据挖掘是宣传出来的还是持久的稳定增长的商业314

10.4.2 数据挖掘只是经理的事还是每个人的事316

10.4.3 数据挖掘对隐私或数据安全构成威胁吗317

10.5 数据挖掘的发展趋势318

10.6 小结319

习题320

文献注释321

附录A Microsoft's OLE DB for Data Mining简介323

A.1 创建DMM对象324

A.2 向模型装入训练数据并对模型进行训练325

A.3 模型的使用325

附录B DBMiner简介328

B.1 系统结构328

B.2 输入和输出329

B.3 系统支持的数据挖掘任务329

B.4 对任务和方法选择的支持332

B.5 对KDD处理过程的支持332

B.6 主要应用332

B.7 现状332

参考文献333

索引362

热门推荐