图书介绍

数据挖掘与R语言 原书第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据挖掘与R语言 原书第2版
  • (葡)路易斯·托尔戈(Luis Torgo) 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111596660
  • 出版时间:2018
  • 标注页数:346页
  • 文件大小:52MB
  • 文件页数:362页
  • 主题词:数据采集;程序语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘与R语言 原书第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 简介1

1.1如何阅读本书2

1.2重现性2

第一部分 R与数据挖掘简介6

第2章 R简介6

2.1R起步6

2.2与R控制台的简单交互8

2.3R对象和变量9

2.4R函数11

2.5向量14

2.6向量化15

2.7因子16

2.8生成序列18

2.9数据子集20

2.10矩阵和数组22

2.11列表25

2.12数据框28

2.13数据框的扩展31

2.14对象、类和方法34

2.15管理R会话35

第3章 数据挖掘简介37

3.1数据挖掘鸟瞰图37

3.2数据收集和业务理解38

3.2.1数据和数据集39

3.2.2导入数据到R40

3.3数据预处理45

3.3.1数据清洗45

3.3.2变换变量53

3.3.3生成变量55

3.3.4降维66

3.4建模74

3.4.1探索性数据分析75

3.4.2使用关联规则的依赖建模94

3.4.3聚类101

3.4.4异常检测112

3.4.5预测分析120

3.5评估147

3.5.1Holdout和随机子抽样148

3.5.2交叉验证150

3.5.3Bootstrap估计153

3.5.4推荐程序154

3.6报告和部署155

3.6.1通过动态文档进行报告155

3.6.2通过Web应用程序进行部署158

第二部分 数据挖掘案例研究164

第4章 预测海藻数量164

4.1问题描述与目标164

4.2数据说明164

4.3加载数据到R165

4.4数据可视化和总结167

4.5数据缺失173

4.5.1将缺失部分剔除173

4.5.2尝试找到缺失值最有可能的赋值175

4.5.3通过变量的相关关系填补缺失值176

4.5.4通过探索类似个案填补缺失值179

4.6获取预测模型180

4.6.1多元线性回归181

4.6.2回归树185

4.7模型评价和选择189

4.8预测7种海藻的频率200

4.9小结202

第5章 预测股票市场收益203

5.1问题描述与目标203

5.2可用的数据204

5.2.1从CSV文件读取数据205

5.2.2从网站上获取数据205

5.3定义预测任务206

5.3.1预测什么206

5.3.2预测变量是什么208

5.3.3预测任务212

5.3.4模型评价准则213

5.4预测模型215

5.4.1如何应用训练集数据来建模215

5.4.2建模工具216

5.5从预测到实践222

5.5.1如何应用预测模型222

5.5.2与交易相关的评价准则223

5.5.3模型集成:仿真交易224

5.6模型评价和选择230

5.6.1蒙特卡罗估计230

5.6.2实验比较231

5.6.3结果分析235

5.7交易系统243

5.7.1评估最终测试数据243

5.7.2在线交易系统247

5.8小结248

第6章 侦测欺诈交易249

6.1问题描述与目标249

6.2可用的数据249

6.2.1加载数据到R250

6.2.2探索数据集250

6.2.3数据问题256

6.3定义数据挖掘任务263

6.3.1问题的不同解决方法263

6.3.2评价准则265

6.3.3实验方法270

6.4计算离群值的排序271

6.4.1无监督方法271

6.4.2有监督方法280

6.4.3半监督方法290

6.5小结295

第7章 微阵列样本分类296

7.1问题描述与目标296

7.1.1微阵列实验背景简介296

7.1.2数据集ALL297

7.2可用的数据297

7.3基因(特征)选择302

7.3.1基于分布特征的简单过滤方法302

7.3.2ANOVA过滤304

7.3.3使用随机森林进行过滤306

7.3.4使用特征聚类的组合进行过滤308

7.4遗传学异常的预测309

7.4.1定义预测任务309

7.4.2模型评价标准309

7.4.3实验过程310

7.4.4建模技术311

7.4.5模型比较313

7.5小结320

参考文献321

主题索引332

数据挖掘术语索引337

R函数索引339

热门推荐