图书介绍

文本分类技术研究2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

文本分类技术研究
  • 胥桂仙著 著
  • 出版社: 北京:中央民族大学出版社
  • ISBN:9787811088427
  • 出版时间:2010
  • 标注页数:156页
  • 文件大小:31MB
  • 文件页数:167页
  • 主题词:文字处理-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

文本分类技术研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 引言1

1.2 相关研究介绍4

1.2.1 不均衡分类4

1.2.2 基于文本的半监督学习7

1.2.3 主题句提取10

1.3 本书的组织结构11

第2章 文本分类技术14

2.1 问题描述14

2.2 文本预处理16

2.3 文本表示18

2.3.1 向量空间模型18

2.3.2 特征选择19

2.3.3 特征权重计算23

2.4 文本分类器25

2.4.1 Rocchio分类器26

2.4.2 Na?ve Bayes分类器27

2.4.3 KNN分类器28

2.4.4 关联规则30

2.4.5 决策树33

2.4.6 支持向量机35

2.4.7 Logistic回归39

2.4.8 分类器集成41

2.5 文本分类公共测试数据集42

2.6 分类性能评估43

2.6.1 评估方法43

2.6.2 评估指标44

2.7 本章小结48

第3章 蛋白质相互作用文本信息处理49

3.1 引言49

3.2 蛋白质相互作用资源库50

3.3 信息处理技术在蛋白质相互作用信息抽取中的应用53

3.4 本章小结56

第4章 基于不均衡数据集的文本分类58

4.1 引言58

4.2 基于特征类别分布的权重计算59

4.2.1 传统TFIDF权重算法分析59

4.2.2 已有的TFIDF的相关改进61

4.2.3 基于特征类别分布的权重计算63

4.3 基于I_TFIDF的SVM应用66

4.3.1 实验数据集66

4.3.2 SVM上I_TFIDF与其他权重算法的比较68

4.3.3 实验结果与分析70

4.3.4 实验结论76

4.4 基于I_TFIDF的改进KNN77

4.4.1 引言77

4.4.2 基于I_TFIDF的KNN78

4.4.3 实验设计79

4.4.4 实验结果与分析80

4.4.5 实验结论84

4.5 Logistic回归的自适应决策阈值选择87

4.5.1 引言87

4.5.2 自适应学习决策阈值的算法87

4.5.3 实验设计90

4.5.4 实验结果与分析90

4.5.5 实验结论93

4.6 本章小结93

第5章 基于混合模型的主题句提取94

5.1 引言94

5.2 基于混合模型的主题句提取算法97

5.3 实验数据集100

5.4 实验设计101

5.5 实验结果分析103

5.6 实验结论105

第6章 基于文本的半监督学习106

6.1 引言106

6.2 相关研究106

6.3 半监督学习数据集109

6.4 不均衡数据比例的分类比较110

6.5 提出的半监督学习算法118

6.5.1 AdaBoost算法118

6.5.2 提出的基于Boosting的半监督学习方法119

6.5.3 实验设计122

6.5.4 实验结果与分析124

6.5.5 实验结论130

6.6 本章小结130

第7章 文本分类工具131

7.1 Libsvm131

7.1.1 Libsvm简介131

7.1.2 Libsvm使用方法131

7.2 Rainbow134

7.2.1 Rainbow简介134

7.2.2 Rainbow使用方法135

参考文献140

热门推荐