图书介绍

深入搜索引擎海量信息的压缩、索引和查询2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

艾伦H·威顿，亚里斯蒂尔·莫夫特著著
出版社：北京：电子工业出版社
ISBN：9787121084911
出版时间：2009
标注页数：540页
文件大小：106MB
文件页数：564页
主题词：互联网络－情报检索－高等学校－教材

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：7341190f3aaedfd11897fa82ad00db9e

下载说明

深入搜索引擎海量信息的压缩、索引和查询PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章　概览1

1.1　文档数据库（document databases）7

1.2　压缩（compression）10

1.3 索引（indexes）12

1.4　文档索引16

1.5　MG海量文档管理系统20

1.6　进一步阅读21

第2章　文本压缩23

2.1 模型26

2.2 自适应模型29

2.3　哈夫曼编码32

范式哈夫曼编码38

计算哈夫曼编码长度44

总结51

2.4　算术编码51

算术编码是如何工作的53

实现算术编码56

保存累积计数59

2.5 符号模型61

部分匹配预测61

块排序压缩64

动态马尔科夫压缩69

基于单字的压缩71

2.6　字典模型73

自适应字典编码器的LZ77系列74

LZ77的Gzip变体78

自适应字典编码器的LZ78系列79

LZ78的LZW变体81

2.7 同步84

创造同步点84

自同步编码87

2.8　性能比较89

压缩性能91

压缩速度94

其他性能方面的考虑97

2.9　进一步阅读98

第3章索引102

3.1　样本文档集合106

3.2　倒排文件索引110

3.3　压缩倒排文件115

无参模型（Nonparameterized models）117

全局贝努里模型120

全局观测频率模型（Global observed frequency model）123

局部贝努里模型（Local Bernoulli model）124

有偏贝努里模型（Skewed Bernoulli model）125

局部双曲模型（Local hyperbolic model）127

局部观测频率模型（Local observed frequency model）128

上下文相关压缩（Context-sensitive compression）130

3.4　索引压缩方法的效果132

3.5　签名文件和位图134

签名文件135

位片签名文件（Bitsliced signature files）139

签名文件分析144

位图147

签名文件和位图的压缩148

3.6　索引方法的比较151

3.7　大小写折叠、词根化和停用词153

大小写折叠154

词根化154

影响索引长度的因素155

停用词（stop word）156

3.8　进一步阅读159

第4章　查询162

4.1　访问字典的方法166

访问数据结构167

前端编码（Front coding）170

最小完美哈希函数173

完美哈希函数的设计176

基于磁盘的字典存储181

4.2　部分指定的查询术语182

字符串暴力匹配（Brute-force string matching）182

用n-gram索引183

循环字典（Rotated lexicon）184

4.3 布尔查询（Boolean Query）186

合取查询（conjunctive query）187

术语处理顺序188

随机访问和快速查找189

分块倒排索引192

非合取查询（Nonconjunctive Query）194

4.4　信息检索和排名195

坐标匹配（Coordinate matching）196

内积相似度197

向量空间模型202

4.5　检索效果评价205

召回率和精确率205

召回率-精确率曲线207

TREC项目208

万维网搜索（World Wide Web Searching）212

其他有效性评价方法215

4.6　余弦法实现216

文档内频率217

余弦值的计算方法220

文档权重所需的内存222

累加器内存227

快速查询处理228

按频率排序的索引229

排序233

4.7　交互式检索236

图书介绍

深入搜索引擎 海量信息的压缩、索引和查询2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

PDF下载

下载说明

深入搜索引擎 海量信息的压缩、索引和查询PDF格式电子书版下载

图书目录

热门推荐

深入搜索引擎海量信息的压缩、索引和查询2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

深入搜索引擎海量信息的压缩、索引和查询PDF格式电子书版下载