图书介绍

语音识别及语音可视化技术研究2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

语音识别及语音可视化技术研究
  • 韩志艳著 著
  • 出版社: 沈阳:东北大学出版社
  • ISBN:9787551715393
  • 出版时间:2017
  • 标注页数:212页
  • 文件大小:30MB
  • 文件页数:226页
  • 主题词:语音识别-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

语音识别及语音可视化技术研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1语音信号研究背景概述1

1.2国内外研究现状3

1.2.1语音识别技术研究3

1.2.2语音可视化技术研究4

1.2.3语音信号特征参数提取技术研究6

1.3课题的研究意义7

1.4课题研究需要解决的难题8

1.5章节安排9

第2章 语音信号预处理技术13

2.1概述13

2.2语音生成系统和语音感知系统13

2.2.1语音生成系统13

2.2.2语音感知系统15

2.3语音信号生成的产生模型18

2.4语音信号的时域波形20

2.5语音信号的采样和量化22

2.6语音信号的预加重23

2.7语音信号的分帧和加窗处理23

2.8语音信号端点检测技术25

2.8.1短时能零积法26

2.8.2信息熵法27

2.8.3频带方差法28

2.8.4 HMM模型法29

2.8.5倒谱距离测量法30

2.8.6基于DWT的互相关函数法31

2.9一种低信噪比下的语音端点检测算法33

2.9.1降噪方法33

2.9.2子带能量的计算34

2.9.3鉴别信息的计算34

2.9.4算法描述35

2.9.5实验结果对比及分析36

2.10本章小结41

第3章 语音静态特征参数提取46

3.1问题的提出46

3.2短时能量47

3.3短时平均幅度47

3.4短时过零率47

3.5短时自相关函数48

3.6短时平均幅度差函数48

3.7倒谱特征49

3.7.1基于线性预测的倒谱参数LPCC49

3.7.2基于Mel频率的倒谱参数MFCC50

3.8感知线性预测参数52

3.9共振峰特征参数53

3.10谐振强度特征参数54

3.11基于单边自相关序列的语音特征56

3.12基于独立分量分析的鲁棒语音特征57

3.12.1模型描述58

3.12.2频域独立分量分析58

3.12.3特征提取算法描述61

3.13基于线谱频率参数的语音特征提取69

3.13.1线谱频率参数分析70

3.13.2求解线谱频率参数的常用算法70

3.13.3求解线谱频率参数的快速算法71

3.14基于脉冲耦合神经网络的语音特征73

3.14.1 PCNN模型结构及其原理74

3.14.2 PCNN在图像特征提取中的应用75

3.14.3运用PCNN从语谱图中提取特征参数77

3.14.4语谱图77

3.14.5运用PCNN提取特征参数78

3.15 耳蜗滤波器倒谱系数78

3.15.1耳蜗滤波器倒谱特征原理框图78

3.15.2听觉变换78

3.15.3耳蜗滤波器81

3.15.4毛细胞窗口84

3.15.5非线性响度变换和DCT84

3.16加权组合过零峰值幅度特征参数84

3.16.1 CZCPA语音特征参数提取原理85

3.16.2差分原理88

3.16.3 WCZCPA特征参数提取原理89

3.17基于二维根倒谱和CCBC的特征参数90

3.17.1二维根倒谱(TDRC)90

3.17.2 CCBC算法91

3.17.3特征参数提取流程91

3.18基于改进LDA和PCA的语音特征参数92

3.18.1基于数据驱动线性特征转换的语音特征变换92

3.18.2改进的算法及其实现94

3.19基于MUSIC和感知特性的鲁棒特征参数95

3.19.1感知处理95

3.19.2 PMUSIC-MFCC特征提取流程96

3.19.3实验结果对比98

3.20基于小波包变换的鲁棒特征参数100

3.20.1小波包分解100

3.20.2新参数的算法构想102

3.20.3小波包对频带的划分103

3.20.4小波函数的选取105

3.20.5新参数提取流程108

3.20.6实验结果对比110

3.21本章小结112

第4章 语音动态特征参数提取121

4.1问题的提出121

4.2基于MUSIC和调制谱滤波的动态特征参数121

4.2.1 MUSIC谱估计122

4.2.2调制谱原理124

4.2.3 MMS-MFCC特征提取流程126

4.3基于共振峰曲线的语音信号动态特征参数130

4.3.1动态特征提取流程130

4.3.2仿真实验131

4.4组合特征参数优化选择方法134

4.4.1基本正交实验设计简介135

4.4.2因子和水平的选择137

4.4.3正交表的选用及构造137

4.4.4正交实验结果与分析138

4.4.5对比实验结果与分析143

4.5本章小结144

第5章 基于小波包变换和K-L展开的语音识别方法148

5.1问题的提出148

5.2小波包变换148

5.3特征提取149

5.4 K-L展开150

5.5仿真实验结果151

5.6本章小结152

第6章 基于小波混沌神经网络的语音识别方法155

6.1问题的提出155

6.2动态时间规整155

6.3小波混沌神经网络模型155

6.4 WCNN学习算法156

6.4.1小波神经网络部分学习算法156

6.4.2混沌神经网络部分学习算法157

6.5实验结果及结论159

6.6本章小结160

第7章 基于遗传算法和Fisher投影的语音识别方法162

7.1问题的提出162

7.2遗传算法162

7.3基于Fisher准则函数的最佳鉴别矢量163

7.3.1 Fisher准则函数163

7.3.2最佳鉴别矢量基164

7.4混沌神经网络模型164

7.5实验及结果分析165

7.6本章小结167

第8章 语音可视化技术研究170

8.1问题的提出170

8.2基于语谱图的可视化方法170

8.3基于LLE和模糊核聚类的可视化方法171

8.3.1局部线性嵌入(LLE)方法172

8.3.2改进LLE方法173

8.3.3核方法173

8.3.4模糊核聚类算法175

8.3.5仿真实验结果与分析176

8.4基于集成特征和神经网络的可视化方法178

8.4.1音素与音节179

8.4.2基音与四声179

8.4.3可视化系统结构模块180

8.4.4神经网络设计181

8.4.5图案信息编码181

8.4.6主颜色编码184

8.4.7图像位置信息映射185

8.4.8图像合成185

8.4.9仿真实验及结果分析185

8.5基于颜色和图案的汉语声韵母可视化方法190

8.5.1可视化系统结构190

8.5.2 BP神经网络设计191

8.5.3共振峰特征映射主颜色信息192

8.5.4谐振强度和音长映射图像长和宽信息192

8.5.5组合特征映射图案信息193

8.5.6图像合成193

8.5.7仿真实验及结果分析193

8.6基于神经网络的汉语声韵母可视化方法198

8.6.1可视化系统总体结构198

8.6.2语音信号获取及预处理199

8.6.3语音特征提取及PCA降维199

8.6.4神经网络设计200

8.6.5位置信息映射200

8.6.6颜色信息获取201

8.6.7图像合成201

8.6.8仿真实验及结果分析201

8.5本章小结203

第9章 结论与展望209

9.1本书主要工作及创新点209

9.2进一步研究的展望211

热门推荐