图书介绍

数据科学导论 Python语言实现原书第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

（意）阿尔贝托·博斯凯蒂，卢卡·马萨罗著；于俊伟，靳小波译著
出版社：北京：机械工业出版社
ISBN：9787111589860
出版时间：2018
标注页数：222页
文件大小：25MB
文件页数：242页
主题词：软件工具－程序设计

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：d37af6913203a1622e7f0bba35cd0c4b

下载说明

数据科学导论 Python语言实现原书第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章新手上路1

1.1 数据科学与Python简介1

1.2 Python的安装2

1.2.1 Python 2还是Python 33

1.2.2 分步安装3

1.2.3 工具包的安装4

1.2.4 工具包升级6

1.2.5 科学计算发行版6

1.2.6 虚拟环境8

1.2.7 核心工具包一瞥11

1.3 Jupyter简介17

1.3.1 快速安装与初次使用19

1.3.2 Jupyter魔术命令20

1.3.3 Jupyter Notebook怎样帮助数据科学家22

1.3.4 Jupyter的替代版本26

1.4 本书使用的数据集和代码27

1.5 小结33

第2章数据改写34

2.1 数据科学过程34

2.2 使用pandas进行数据加载与预处理36

2.2.1 数据快捷加载36

2.2.2 处理问题数据38

2.2.3 处理大数据集41

2.2.4 访问其他的数据格式43

2.2.5 数据预处理44

2.2.6 数据选择47

2.3 使用分类数据和文本数据49

2.3.1 特殊的数据类型——文本51

2.3.2 使用Beautiful Soup抓取网页56

2.4 使用NumPy进行数据处理57

2.4.1 NmuPy中的N维数组57

2.4.2 NmuPy ndarray对象基础58

2.5 创建NumPy数组59

2.5.1 从列表到一维数组60

2.5.2 控制内存大小60

2.5.3 异构列表61

2.5.4 从列表到多维数组62

2.5.5 改变数组大小63

2.5.6 利用NumPy函数生成数组64

2.5.7 直接从文件中获得数组65

2.5.8 从pandas提取数据65

2.6 NumPy快速操作和计算66

2.6.1 矩阵运算68

2.6.2 NumPy数组切片和索引69

2.6.3 NumPy数组堆叠71

2.7 小结72

第3章数据科学流程73

3.1 EDA简介73

3.2 创建新特征77

3.3 维数约简78

3.3.1 协方差矩阵79

3.3.2 主成分分析80

3.3.3 一种用于大数据的PCA变型——RandomizedPCA82

3.3.4 潜在因素分析83

3.3.5 线性判别分析84

3.3.6 潜在语义分析85

3.3.7 独立成分分析85

3.3.8 核主成分分析85

3.3.9 t-分布邻域嵌入算法87

3.3.10 受限玻尔兹曼机87

3.4 异常检测和处理89

3.4.1 单变量异常检测89

3.4.2 EllipticEnvelope90

3.4.3 OneClassSVM94

3.5 验证指标96

3.5.1 多标号分类97

3.5.2 二值分类99

3.5.3 回归100

3.6 测试和验证100

3.7 交叉验证103

3.7.1 使用交叉验证迭代器105

3.7.2 采样和自举方法107

3.8 超参数优化108

3.8.1 建立自定义评分函数110

3.8.2 减少网格搜索时间112

3.9 特征选择113

3.9.1 基于方差的特征选择113

3.9.2 单变量选择114

3.9.3 递归消除115

3.9.4 稳定性选择与基于L1的选择116

3.10 将所有操作包装成工作流程118

3.10.1 特征组合和转换链接118

3.10.2 构建自定义转换函数120

3.11 小结121

第4章机器学习122

4.1 准备工具和数据集122

4.2 线性和logistic回归124

4.3 朴素贝叶斯126

4.4 K近邻127

4.5 非线性算法129

4.5.1 基于SVM的分类算法129

4.5.2 基于SVM的回归算法131

4.5.3 调整SVM（优化）132

4.6 组合策略133

4.6.1 基于随机样本的粘合策略134

4.6.2 基于弱分类器的bagging策略134

4.6.3 随机子空间和随机分片135

4.6.4 随机森林和Extra-Trees135

4.6.5 从组合估计概率137

4.6.6 模型序列——AdaBoost138

4.6.7 梯度树提升139

4.6.8 XGBoost140

4.7 处理大数据142

4.7.1 作为范例创建一些大数据集142

4.7.2 对容量的可扩展性143

4.7.3 保持速度144

4.7.4 处理多样性145

4.7.5 随机梯度下降概述147

4.8 深度学习148

4.9 自然语言处理一瞥153

4.9.1 词语分词153

4.9.2 词干提取154

4.9.3 词性标注154

4.9.4 命名实体识别155

4.9.5 停止词156

4.9.6 一个完整的数据科学例子——文本分类156

4.10 无监督学习概览158

4.11 小结165

第5章社交网络分析166

5.1 图论简介166

5.2 图的算法171

5.3 图的加载、输出和采样177

5.4 小结179

第6章可视化、发现和结果180

6.1 matplotlib基础介绍180

6.1.1 曲线绘图181

6.1.2 绘制分块图182

6.1.3 数据中的关系散点图183

6.1.4 直方图184

6.1.5 柱状图185

6.1.6 图像可视化186

6.1.7 pandas的几个图形示例188

6.1.8 散点图190

6.1.9 平行坐标192

6.2 封装matplotlib命令193

6.2.1 Seaborn简介194

6.2.2 增强EDA性能197

6.3 交互式可视化工具Bokeh201

6.4 高级数据学习表示203

6.4.1 学习曲线204

6.4.2 确认曲线205

6.4.3 随机森林的特征重要性206

6.4.4 GBT部分依赖关系图形207

6.4.5 创建MA-AAS预测服务器208

6.5 小结212

附录A 增强Python基础213

图书介绍

数据科学导论 Python语言实现 原书第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

PDF下载

下载说明

数据科学导论 Python语言实现 原书第2版PDF格式电子书版下载

图书目录

热门推荐

数据科学导论 Python语言实现原书第2版2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

数据科学导论 Python语言实现原书第2版PDF格式电子书版下载