图书介绍

高维信息几何与语音分析2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

高维信息几何与语音分析
  • 曹文明,郑能恒,冯浩著 著
  • 出版社: 北京:科学出版社
  • ISBN:9787030303868
  • 出版时间:2011
  • 标注页数:200页
  • 文件大小:13MB
  • 文件页数:209页
  • 主题词:语音信息处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

高维信息几何与语音分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 语音识别研究的重要意义1

1.2 研究背景3

1.2.1 国外语音识别研究的发展概况3

1.2.2 汉语语音识别研究的发展概况6

1.2.3 连续语音识别研究中遇到的挫折7

1.3 连续语音识别的难点10

1.3.1 连续语音的多变性和复杂性10

1.3.2 高噪声环境下语音模型的不稳定性10

1.3.3 连续语音识别技术的难点10

1.4 连续语音识别问题的解决方法12

1.4.1 传统的算法12

1.4.2 本书采用的方法13

1.5 本书的研究内容14

第2章 语音的识别与处理方法概述17

2.1 语音识别的分类17

2.2 语音识别的基本步骤19

2.3 语音的短时特性和窗函数20

2.3.1 短时特性20

2.3.2 窗函数21

2.4 语音的特征提取25

2.4.1 时域特征参数25

2.4.2 频域特征参数27

2.4.3 倒谱域特征参数29

2.5 语音识别算法简介32

2.5.1 动态时间弯折(DTW)32

2.5.2 隐马尔可夫模型(HMM)34

2.5.3 矢量量化(VQ)37

2.5.4 人工神经网络(ANN)38

第3章 隐马尔可夫模型与语音识别39

3.1 马尔可夫链39

3.2 隐马尔可夫模型41

3.3 隐马尔可夫模型的基本算法42

3.4 语音识别中的隐马尔可夫模型类型47

3.5 基于隐马尔可夫模型的语音识别系统49

3.6 混合高斯模型50

3.7 基于声激励源与声道互补性信息的说话人识别53

3.7.1 线性预测分析及声激励源信号提取53

3.7.2 说话人特征参数的提取55

3.7.3 WOCOR和MFCC区分不同说话人的性能分析58

3.7.4 基于WOCOR和MFCC的说话人辨认实验65

3.7.5 基于WOCOR和MFCC的说话人确认实验69

3.8 总结与讨论71

第4章 高维信息几何的欧氏空间73

4.1 点的向量表示,向量的运算73

4.2 n维欧氏空间75

4.2.1 n维欧氏空间的有关概念与基本性质75

4.2.2 基本图形的度量方程80

4.3 变换82

4.3.1 平移变换、合同变换、正交变换82

4.3.2 变换的简单应用84

4.3.3 基于高维空间几何点分布理论的图像复原算法85

4.4 子空间、凸集、凸多胞形95

4.4.1 子空间95

4.4.2 凸集96

4.4.3 凸多胞形97

4.4.4 复杂几何体神经元98

4.5 点距关系101

4.6 同调连续性理论105

4.6.1 同调连续原理105

4.6.2 拓扑流形的训练与识别107

4.7 小结110

第5章 高维信息几何线性代数111

5.1 n维欧氏空间公理化系统及基本性质111

5.1.1 公理化系统111

5.1.2 n维欧氏空间基本性质112

5.2 基本几何术语及符号113

5.3 点到平面及平面间距离116

5.3.1 点到平面的距离116

5.3.2 两平面间距离117

5.4 平面间夹角121

5.4.1 直线与平面间夹角121

5.4.2 两平面间夹角122

5.4.3 两平面及其夹角125

5.5 k_平行四边形:k_矢量125

5.5.1 Rn中矢量的线性相关或独立的测试126

5.5.2 k_平行四边形的k_维体积127

5.5.3 k_矢量128

5.6 k_单形几何学和三角学131

5.6.1 k_单形的k_维体积131

5.6.2 Dihedral角132

5.6.3 投影定律133

5.6.4 余弦定律134

5.6.5 正弦定律136

5.7 重心坐标137

5.7.1 Rn的点在重心坐标和直角坐标之间的变换139

5.7.2 n_单形在重心坐标下的体积及其应用141

5.7.3 在重心坐标下两点之间的距离143

5.7.4 重心、内心和外接球心145

5.8 点覆盖147

5.8.1 覆盖147

5.8.2 覆盖比147

5.8.3 局部顶点覆盖150

5.8.4 覆盖积150

5.9 主元分析法及其高维空间几何意义151

5.9.1 主元分析法简介151

5.9.2 主元分析法的高维空间几何意义153

5.10 语音在高维空间中的形态分析153

5.10.1 语音点在高维空间中的分布概况154

5.10.2 不同类语音覆盖区的覆盖方法158

5.10.3 采用点覆盖方法的优点159

第6章 基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别160

6.1 数字语音分析160

6.2 连续数字语音识别的特征提取方法和高维空间分类覆盖区的神经网络构筑161

6.2.1 构筑神经网络所用样本库的建立161

6.2.2 构筑神经网络所用样本的特征提取方法162

6.2.3 构造特征空间识别覆盖区164

6.3 高维空间语音搜索算法及实现164

6.3.1 被识别的连续语音样本库的建立164

6.3.2 被识别的连续语音样本的特征提取方法165

6.3.3 高维空间点覆盖动态搜索识别方法165

6.4 实验结果与讨论168

6.4.1 本实验的统计结果与讨论168

6.4.2 与隐马尔可夫模型方法的比较结果及讨论169

第7章 基于多权值神经网络的语音情感识别及其比较176

7.1 情感类型的划分176

7.2 语音情感特征的选择和提取177

7.3 语音情感识别所用的样本库的建立177

7.4 多权值神经网络的构建与识别过程178

7.4.1 多权值神经网络的构建具体算法描述178

7.4.2 多权值神经网络的识别179

7.5 实验结果与讨论180

7.5.1 本实验的统计结果与讨论180

7.5.2 与SVM模型的比较结果185

7.6 小结191

参考文献192

热门推荐