图书介绍
NLTK基础教程 用NLTK和Python库构建机器学习应用2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

- (印度)哈登尼亚(Nitin Hardeniya) 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115452573
- 出版时间:2017
- 标注页数:153页
- 文件大小:23MB
- 文件页数:170页
- 主题词:软件工具-程序设计
PDF下载
下载说明
NLTK基础教程 用NLTK和Python库构建机器学习应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 自然语言处理简介1
1.1 为什么要学习NLP2
1.2 先从Python开始吧5
1.2.1 列表5
1.2.2 自助功能6
1.2.3 正则表达式8
1.2.4 字典9
1.2.5 编写函数10
1.3 向NLTK迈进11
1.4 练习16
1.5 小结17
第2章 文本的歧义及其清理18
2.1 何谓文本歧义18
2.2 文本清理20
2.3 语句分离器21
2.4 标识化处理22
2.5 词干提取23
2.6 词形还原24
2.7 停用词移除25
2.8 罕见词移除26
2.9 拼写纠错26
2.10 练习27
2.11 小结28
第3章 词性标注29
3.1 何谓词性标注29
3.1.1 Stanford标注器32
3.1.2 深入了解标注器33
3.1.3 顺序性标注器35
3.1.4 Brill标注器37
3.1.5 基于机器学习的标注器37
3.2 命名实体识别(NER)38
3.3 练习40
3.4 小结41
第4章 文本结构解析43
4.1 浅解析与深解析43
4.2 两种解析方法44
4.3 为什么需要进行解析44
4.4 不同的解析器类型46
4.4.1 递归下降解析器46
4.4.2 移位-归约解析器46
4.4.3 图表解析器46
4.4.4 正则表达式解析器47
4.5 依存性文本解析48
4.6 语块分解50
4.7 信息提取53
4.7.1 命名实体识别(NER)53
4.7.2 关系提取54
4.8 小结55
第5章 NLP应用56
5.1 构建第一个NLP应用57
5.2 其他NLP应用60
5.2.1 机器翻译60
5.2.2 统计型机器翻译61
5.2.3 信息检索62
5.2.4 语音识别64
5.2.5 文本分类65
5.2.6 信息提取66
5.2.7 问答系统67
5.2.8 对话系统67
5.2.9 词义消歧67
5.2.10 主题建模68
5.2.11 语言检测68
5.2.12 光符识别68
5.3 小结68
第6章 文本分类70
6.1 机器学习71
6.2 文本分类72
6.3 取样操作74
6.3.1 朴素贝叶斯法76
6.3.2 决策树79
6.3.3 随机梯度下降法80
6.3.4 逻辑回归81
6.3.5 支持向量机81
6.4 随机森林算法83
6.5 文本聚类83
6.6 文本中的主题建模84
6.7 参考资料87
6.8 小结87
第7章 Web爬虫88
7.1 Web爬虫88
7.2 编写第一个爬虫程序89
7.3 Scrapy库中的数据流92
7.3.1 Scrapy库的shell93
7.3.2 目标项98
7.4 生成网站地图的蜘蛛程序99
7.5 目标项管道100
7.6 参考资料102
7.7 小结102
第8章 NLTK与其他Python库的搭配运用104
8.1 NumPy104
8.1.1 多维数组105
8.1.2 基本运算106
8.1.3 从数组中提取数据107
8.1.4 复杂矩阵运算108
8.2 SciPy112
8.2.1 线性代数113
8.2.2 特征值与特征向量113
8.2.3 稀疏矩阵114
8.2.4 优化措施115
8.3 pandas117
8.3.1 读取数据117
8.3.2 数列119
8.3.3 列转换121
8.3.4 噪声数据121
8.4 matplotlib123
8.4.1 子图绘制123
8.4.2 添加坐标轴124
8.4.3 散点图绘制125
8.4.4 条形图绘制126
8.4.5 3D绘图126
8.5 参考资料126
8.6 小结127
第9章 Python中的社交媒体挖掘128
9.1 数据收集128
9.2 数据提取132
9.3 地理可视化134
9.3.1 影响力检测135
9.3.2 Facebook135
9.3.3 有影响力的朋友139
9.4 小结141
第10章 大规模文本挖掘142
10.1 在Hadoop上使用Python的不同方式142
10.1.1 Python的流操作143
10.1.2 Hive/Pig下的UDF143
10.1.3 流封装器143
10.2 Hadoop上的NLTK144
10.2.1 用户定义函数(UDF)144
10.2.2 Python的流操作146
10.3 Hadoop上的Scikit-learn147
10.4 PySpark150
10.5 小结153
热门推荐
- 824791.html
- 2298204.html
- 880337.html
- 3496059.html
- 1821003.html
- 3877303.html
- 3139170.html
- 1321074.html
- 1088462.html
- 2928252.html
- http://www.ickdjs.cc/book_2498016.html
- http://www.ickdjs.cc/book_3825472.html
- http://www.ickdjs.cc/book_368707.html
- http://www.ickdjs.cc/book_1052444.html
- http://www.ickdjs.cc/book_2627356.html
- http://www.ickdjs.cc/book_1638992.html
- http://www.ickdjs.cc/book_1435266.html
- http://www.ickdjs.cc/book_3813220.html
- http://www.ickdjs.cc/book_1543428.html
- http://www.ickdjs.cc/book_1019368.html