图书介绍

数据挖掘原理2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

David Hand，Heikki Mannila，Padhraic Smyth著；张银奎等译著
出版社：机械工业出版社；中信出版社
ISBN：7111115775
出版时间：2003
标注页数：361页
文件大小：26MB
文件页数：385页
主题词：数据采集

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：e9cfced884537cc16def8e57647cbc19

下载说明

数据挖掘原理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

1.1 数据挖掘简介1

目录出版者的话专家指导委员会名单译者序中文版序言前言第1章绪论1

1.2 数据集属性3

1.3 结构类型：模型和模式5

1.4 数据挖掘任务7

1.5 数据挖掘算法的组件10

1.5.1 评分函数10

1.5.2 优化和搜索方法10

1.5.3 数据管理策略11

1.6 统计和数据挖掘的相互关系11

1.7 数据挖掘：打捞、探查还是垂钓13

1.8 本章归纳14

1.9 补充读物15

2.2 测量类型17

第2章测量和数据17

2.1 简介17

2.3 距离尺度20

2.4 数据转化25

2.5 数据形式28

2.6 单个测量的数据质量29

2.7 数据群体的数据质量30

2.8 本章归纳33

2.9 补充读物33

第3章可视化和探索数据35

3.1 简介35

3.2 总结数据：几个简单例子36

3.3 显示单个变量的一些工具37

3.4 显示两个变量间关系的工具41

3.5 显示两个以上变量间关系的工具46

3.6 主分量分析48

3.7 多维缩放54

3.8 补充读物58

第4章数据分析和不确定性61

4.1 简介61

4.2 处理不确定性61

4.3 随机变量和它们的关系63

4.4 样本和统计推理66

4.5 估计69

4.5.1 估计量的理想属性69

4.5.2 最大似然估计70

4.5.3 贝叶斯估计76

4.6 假设检验81

4.6.1 古典假设检验82

4.6.2 数据挖掘中的假设检验85

4.7 采样方法87

4.8 本章归纳90

4.9 补充读物91

第5章数据挖掘算法概览93

5.1 简介93

5.2 建立树分类器的CART算法95

5.3 数据挖掘算法的化约主义观点99

5.3.1 用于回归和分类的多层感知器99

5.3.2 关联规则学习的APriori算法102

5.3.3 检索文本的向量空间算法104

5.4 讨论105

5.5 补充读物106

6.1 概述107

第6章模型和模式107

6.2 建模基础108

6.3 用于预测的模型结构109

6.3.1 具有线性结构的回归模型109

6.3.2 用于回归的局部分段模型结构112

6.3.3 “基于记忆”的非参数局部模型113

6.3.4 模型结构的随机部分114

6.3.5 用于分类的预测模型116

6.3.6 选择适当复杂度的模型117

6.4 概率分布和密度函数模型118

6.4.1 一般概念119

6.4.2 混合模型119

6.4.3 无序范畴型数据的联合分布121

6.4.4 因式分解和高维空间中的独立性121

6.5 维度效应124

6.5.1 高维数据的变量选择125

6.5.2 高维数据的变换126

6.6 用于结构化数据的模型127

6.7 模式结构130

6.7.1 数据矩阵中的模式130

6.7.2 字符串模式132

6.8 参考读物133

第7章数据挖掘算法的评分函数135

7.1 简介135

7.2 对模式进行评价136

7 3 预测性评分函数和描述性评分函数137

7.3.1 评价预测模型的评分函数137

7.3.2 评价描述模型的评分函数139

7.4 评价不同复杂度的模型140

7.4.1 模型比较的一般概念141

7.4.2 再谈偏差-方差142

7.4.3 惩罚复杂模型的评分函数144

7.4.4 使用外部验证的评分函数145

7.5 模型和模式的评价146

7.6 鲁棒方法148

7.7 补充读物148

第8章搜索和优化方法151

8.1 简介151

8.2 搜索模型或模式152

8.2.1 搜索背景152

8.2.2 数据挖掘中的状态空间搜索154

8.2.3 简单贪婪搜索算法155

8.2.4 系统搜索和搜索启示156

8.2.5 分支定界法157

8.3 参数优化方法158

8.3.1 参数优化：背景158

8.3.2 闭合形式解和线性代数方法159

8.3.3 优化平滑函数的基于梯度方法160

8.3.4 一元参数优化160

8.3.5 多元参数优化163

8.3.6 约束优化165

8.4 存在残缺数据时的优化：EM算法166

8.5 在线和单扫描算法169

8.6 随机搜索和优化技术170

8.7 补充读物171

9.1 简介173

第9章描述建模173

9.2 通过概率分布和密度描述数据174

9.2.1 简介174

9.2.2 用来估计概率分布和密度的评分函数174

9.2.3 参数密度模型175

9.2.4 混合分布和密度178

9.2.5 混合模型的EM算法179

9.2.6 非参数的密度估计181

9.2.7 范畴型数据的联合分布183

9.3 聚类分析背景186

9.4 基于划分的聚类算法188

9.4.1 基于划分聚类的评分函数188

9.4.2 基于划分聚类的基本算法191

9.5 层次聚类196

9.5.1 凝聚方法197

9.5.2 分裂方法199

9.6 基于混合模型的概率聚类200

9.7 补充读物206

第10章用于分类的预测建模209

10.1 预测建模概览209

10.2 分类建模简介210

10.2.1 判别分类和决策边界210

10.2.2 分类的概率模型211

10.2.3 建立实际的分类器213

10.3 感知器216

10.4 线性判别式217

10.5 树模型219

10.6 最近邻方法222

10.7 logistic判别式分析224

10.8 朴素贝叶斯模型224

10.9 其他方法226

10.10 分类器的评估和比较228

10.11 高维分类的特征选取230

10.12 补充读物231

第11章用于回归的预测建模233

11.1 简介233

11.2 线性模型和最小二乘法拟合233

11.2.1 拟合模型的计算问题235

11.2.2 线性回归的概率解释236

11.2.3 拟合后模型的解释238

11.2.4 推理和泛化239

11.2.5 模型搜索和建模240

11.2.6 模型诊断和审查241

11.3 推广的线性模型243

11.4 人工神经网络247

11.5 其他高度参数化的模型249

11.5.1 推广的相加模型249

11.5.2 投影追踪回归250

11.6 补充读物251

第12章数据组织和数据库253

12.1 简介253

12.2 存储器层次253

12.3 索引结构254

12.3.1 B-树254

12.3.2 哈希索引255

12.5 关系数据库256

12.4 多维索引256

12.6 操纵表格259

12.7 结构化查询语言261

12.8 查询的执行和优化263

12.9 数据仓库和在线分析处理264

12.10 OLAP的数据结构265

12.11 字符串数据库266

12.12 海量数据集、数据管理和数据挖掘266

12.12.1 把数据都放入主存储器267

12.12.2 数据挖掘算法的可伸缩版本267

12.12.3 考虑磁盘访问的有针对性算法268

12.12.4 伪数据集和充分统计量268

12.13 补充读物269

13.1 简介271

第13章寻找模式和规则271

13.2 规则表示272

13.3 频繁项集和关联规则272

13.3.1 简介272

13.3.2 寻找频繁集和关联规则274

13.4 推广276

13.5 寻找序列中的片段277

13.6 选择发现的模式和规则278

13.6.1 简介278

13.6.2 寻找模式的启发式搜索278

13.6.3 有趣度标准279

13.7 从局部模式到全局模型280

13.8 预测规则归纳281

13.9 补充读物283

第14章根据内容检索285

14.1 简介285

14.2 检索系统的评价286

14.2.1 评价检索性能的困难之处286

14.2.2 查准率对查全率287

14.2.3 查准率和查全率的实践应用288

14.3 文本检索289

14.3.1 文本的表示289

14.3.2 匹配查询和文档292

14.3.3 隐含语义索引294

14.3.4 文档和文本分类297

14.4 对个人偏好建模297

14.4.1 相关性反馈297

14.4.2 自动推荐系统298

14.5 图像检索299

14.5.1 图像理解299

14.5.2 图像表示299

14.5.3 图像查询300

14.5.4 图像恒定性301

14.5.5 图像检索的推广301

14.6 时间序列和序列检索301

14.6.1 时间序列数据的全局模型302

14.6.2 时间序列的结构和形状303

14.7 本章归纳304

14.8 补充读物305

附录随机变量307

参考文献311

索引340