一、一种基于能频积实现连续语音端点检测的方法(论文文献综述)
王福钊[1](2020)在《ROS地面移动机器人藏语语音控制的研究与实现》文中研究指明近年来,各种智能机器人如雨后春笋般涌现,正在不断改变着我们的生产和生活。越来越多的企业和科研机构投入大量人力和物力到智能机器人的研究中,相关实验室也在高校中纷纷成立。语音是人类进行交流时最直接、最简便、最高效的表达方式,是最丰富的信息传递载体,也是智能机器人与人类进行人机交互的重要方式。藏族是中华民族大家庭的重要成员,藏语是国内使用人数最多的民族语言。随着藏区社会经济的发展,各类智能技术和产品本地化的研究就显得更加紧迫。由于藏区经济、社会和科技的发展相对国内其它地区滞后,目前尚未有正式发布的、面向藏语的智能机器人产品,也没有成立机器人研究相关课题和团队。本文结合地区特色,研究和实现了基于机器人操作系统(ROS)的地面移动机器人藏语语音控制系统,其包括藏语语音识别的研究与实现、地面移动机器人的移动控制设计与实现两部分内容。对于藏语语音识别,本文研究了基于动态时间规划(DTW)算法和基于高斯混合隐马尔可夫(GMM-HMM)模型的两种语音识别方法。首先,结合机器人控制的实际应用需要,收集了100条控制命令(其中拉萨话49条,安多语51条),录制创建了5000个语音文件的语料库。其次,选取其中1000个语料作为测试集,其余4000个语料作为训练集。最后,在基于DTW的语音识别中使用偶然模板训练法进行模型训练,并验证了该方法的语音识别率为90.9%;在基于高斯混合隐马尔可夫模型的语音识别中进行模型训练,并验证了该方法的语音识别率为94.4%。在ROS地面移动机器人控制方面,本文着重研究了机器人操作系统ROS1.0架构特点、工程结构和通信机制,并分别设计实现了基于DTW和基于GMM-HMM的藏语语音命令词识别的移动机器人控制系统,并在Turtle Bot2移动机器人平台上进行了测试。测试表明,系统具有良好的可用性,对藏语语音指令的识别率较高,地面移动机器人接收指令后运动顺畅无误。
刘丽[2](2019)在《低信噪比下语音多路信号端点切分仿真》文中研究指明针对当前语音信号端点切分相关方法存在召回率与准确率低的问题,提出基于短时相对能频积的低信噪比下语音多路信号端点切分方法。依据听觉掩蔽原理,利用语音多路信号端点检测方式在静音阶段得到噪声幅度,采用基本谱减法提升信噪比。计算听觉掩蔽阈值调节谱减系数,并得到语音信号谱评估值,对信号谱评估值进行傅里叶反变换获得增强之后的语音信号。基于增强后的语音信号,引入短时相对能频积,定义并提取语音信号特征参数。根据信号特征参数中的能量、过零率与能频积设置端点检测与切分合理阈值,利用所得阈值分别判断语音信号初始端点和结尾端点,以此实现语音多路信号端点检测切分。实验结果表明,所提方法具备很高的召回率和准确率,综合性能优于当前相关研究成果,鲁棒性强。
张紫莹[3](2019)在《基于语音关键词检测的监所报警系统软件研发》文中提出在我国司法体系中,监所担负着执行法纪、维护社会稳定的重要职责,建设一套完善的监所安防报警系统对保障监所的安全稳定运行具有重要意义。传统的以人工触发报警与监控视频分析报警相结合的报警系统具有误报率高、实时性不足、存在监控盲区等问题。引入语音关键词检测技术可有效解决上述问题,因此,研发基于语音关键词检测的监所报警系统对完善监所安防报警系统具有重要意义与工程应用价值。本论文针对当前监所对报警系统可靠性、实时性、完整性的要求,设计研发了基于语音关键词检测的监所报警系统软件。软件采用B/S架构设计,主要实现了语音报警分析、实时报警推送、历史报警回溯等功能。软件通过设备接入层实时采集语音数据,通过基于GMM建模的语音端点检测方法实现断句,采用并发编程技术设计实现了多路并行的基于CNN的语音关键词检测方法,并通过对检测结果进行策略分析生成报警或预警事件,同时进行实时推送与记录存储。系统针对监所应用场景的特点,改进了训练数据集的构建方案与数据模型的构建方法,并针对报警实时性需求对基于Kaldi框架的语音关键词检测流程进行了优化,有效提升了算法的检测准确率与执行效率。另外,系统针对语音监控需求,设计实现了一套基于MSE+WebSocket的流式音频播放框架,满足用户对语音实时播放与报警记录回放的需求。经测试,系统的语音关键词检测准确率达到了 97%以上,8路并行语音报警分析任务耗时为1.2s~1.6s,实时音频播放延时在1.5s以内,在功能和性能上均满足系统需求。
韩心梓[4](2016)在《移动通信端到端语音加密传输技术研究》文中进行了进一步梳理近年来,随着移动通信业务的普及,手机等移动终端设备已逐渐渗透到人们生活的方方面面。然而,公众在享受移动语音业务带来的方便快捷的同时,也面临着语音通话中不可忽视的安全问题,语音通话内容被窃听便是最常见的安全问题之一。而如今,随着公众安全意识的提升,移动终端的通话安全已成为了信息安全领域的一项研究热点。对移动通信网的整体改造、重新设计和对移动终端的改造等方法,都常见于各类移动通信保密方案中。其中,针对移动终端的端到端语音加密方式具有易于实现、成本较小等优点,尤为得到关注。本文正是将端到端语音加密以及传输作为研究方向,进行了理论研究和方案设计与实验。本文首先研究了移动通信中的各类声码器标准,以及移动语音传输中的VAD检测技术,初步了解了移动语音网络的传输特性,从而确立了加密语音需要满足的特点,为端到端语音加密传输完成了需求分析。其次,提出了一种基于修改语音频谱形态的加密方案,并在该方案中研究了语音的多项短时特征参数,设计了基于语音短时特征参数的音节分割方法,用以辅助加密。统计和研究了语音信号的频谱形态与分布特征,设计了语音频谱形态的修改方法,并进行了仿真实验,验证该方法具有一定的加密效果,且密文语音可在移动语音通道中有效传输。本文还研究了语音压缩编码算法和流加密算法,提出了一种对压缩语音数据做流加密并利用OFDM调制进行传输的方案。在对使用GSM全速率声码器的传输信道进行研究和测试后,进行了相应的OFDM符号结构和参数设计,使密文信号能在该信道中更加稳定有效地传输。在对提出的方案进行仿真实验后,比较了不同调制方式下的解调误码率结果,并以QPSK方式生成的传输信号为对象,分析了其在GSM增强型全速率声码器信道中的解调误码情况,提出了针对信号频率的修改方法。此外还在AMR声码器信道中测试了解调误码率随编码速率变化的情况。
熊威[5](2016)在《复杂噪声环境下语音端点的检测算法的研究》文中研究说明语音端点检测是语音分析、语音合成和语音识别中的一个必要环节。尽管语音端点检测技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时由于噪声的引入和环境的改变通常会使系统性能显着下降。语音端点检测技术要走向实用,就必须克服鲁棒性问题,因此低信噪比噪声环境下的语音端点检测技术的意义非常重要。本文以应用型语音端点检测技术为目标,以系统鲁棒性为研究重点,对噪声环境下的孤立词和连续语句的端点检测的各个方面都做了深入的研究。通过对鲁棒性语音端点检测的系统研究和实验,本文形成了一套完整的复杂噪声环境下的语音端点的检测研究体系,包括了语音数据库的建立、自适应滤波算法、基于分类标准的延迟分割策略等,并在此基础上构建了一套完整的语音端点检测系统。其具体的研究成果包括以下几个方面:⑴端点检测实验系统深入研究语音信号数学模型和不同语音信号的特征值及提取,收集到了TIMIT标准纯净语音库和NOISEX-92标准噪声库,给出了噪声的度量标准,建立了混噪语音平台,保证了后期实验的可重复性。⑵语音增强算法针对常规的自适应滤波算法在收敛速度和稳定精度以及计算复杂度上不可协调性,引入了欧式搜索算法,对算法做了多处改进,降低计算精度,大大改善了收敛速度和稳定性,经过对比实验验证其性能接近RLS算法,而其计算量却小很多。在MOS和SNR评价方法中,也获得了较高的表现。⑶端点检测算法详细地分析了常用的双门限端点检测方法、基于谱熵的端点检测算法和基于分形理论的端点检测算法。引入了排列熵,一种作为非线性动力学参数能够很好的表示出语音信号的非线性特征。提出了一种延迟分割策略:以能频比为特征参数确定粗端点,并在此基础上使用排列熵差分算法确定精确端点,以精确端点为起始点分割语音信号,对所得到的语音片段信号按照分类标准消除噪声信号带来的错误分割。⑷系统实现利用Matlab GUI工具实现整个端点检测系统界面,利用第二章的语音数据库开展端点检测不同方法的对比试验。实验表明文中提出的方法比基于常规的双门限、谱熵的方法有更好的检测效果,特别是在低信噪比的情况下,基本能达到基于分形的方法效果。但是加上滤波效果后文中的方案的效果远超其他方法。同时由于排列熵算法的简单易实现,算法的实时性表现非常好,其计算的复杂度远小于分形方法。
熊威,郑建立[6](2015)在《一种复杂噪声环境下的语音端点检测方法》文中指出为了提高端点检测的鲁棒性和实时性,提出了一种延迟分割策略:以能频比为特征参数确定粗端点,并在此基础上使用排列熵算法确定精确端点,以精确端点为起始点分割语音信号,对所得到的语音片段信号按照分类标准消除噪声信号带来的错误分割。在TIMIT连续语音库与NOISEX-92标准噪声库上的实验表明,文中提出的方法比基于常规的基于零能与谱熵的方法有更好的检测效果,特别是在低信噪比的情况下,效果尤为突出。
王海旭[7](2015)在《基于卷积神经网络的语音端点检测方法研究》文中研究说明在语音识别系统中一项非常重要的预处理技术就是语音端点检测。语音端点检测,就是要从掺杂有复杂背景噪声的语音信号中,分离出语音信号和非语音信号,确定出语音信号的起始点和终止点。因此,作为语音识别系统的第一步,语音端点检测,尤其是噪声环境下的语音端点检测,是至关重要的,它的准确性在很大程度上直接影响着后续的识别工作能否有效进行。本文实现了一些常用的语音端点检测算法,并分析了其各自的优缺点。基于时域的短时能量和过零率的方法,结合了语音段的能量比噪声段的能量大,以及清音、鼻音、摩擦音等能量值较小的语音段的短时平均过零率值较高的优点,在纯净语音下可以得到较好的检测效果,但随着噪声的增大,该方法的检测效果也随之下降。基于信息熵的语音端点检测算法利用语音帧的信息熵值小于背景噪声帧的信息熵值的特点来进行语音端点检测,在低信噪比下仍可以得到较好的效果,但对于某些噪声,检测结果较差。基于短时能频值的语音端点检测算法将时域和频域特征参数结合在一起,实验表明,在噪声环境下也可较好的进行语音端点检测,但没有很好的方法来确定门限值。针对上述三种方法的不足,本文将卷积神经网络应用到语音端点检测算法中,以连续的几个语音帧作为输入,交替地进行卷积和降采样,逐步提取出多种复杂特征,从而提升网络性能。本文所采用的带噪语音是实验室录制的纯净语音与NOISEX-92标准噪声库中的噪声混合而成的,并使用Matlab工具进行仿真实验,实验表明,由于该方法提取的特征更全面,自由参数的数量较少,所以在进行语音端点检测时可得到较高的准确率。
雷文钿[8](2014)在《复杂环境下高效端点检测算法研究及应用》文中研究表明端点检测是为了从待测语音信号中准确的检测出有效语音的起止点,从而提升语音识别系统的识别精度并尽可能的缩减识别时间。现有的端点检测算法虽在理想环境下有较高的检测准确率,但在伴随着噪声的实际应用系统中,算法的性能急剧下降。同时,移动端应用系统对算法的时间和空间复杂度都有较高的要求。因此,在实际应用环境中,寻找一种高效、鲁棒的端点检测算法是本课题的研究重点。本文从噪声估计、维纳滤波、端点检测算法三个方面进行研究,采用一系列行之有效的方法,探寻一种实用的语音端点检测算法。首先,为了进一步降低背景噪声对语音信号的影响,本文针对基于传统的VAD噪声估计方法对噪声估计不准确的问题,结合最小值控制的递归平均算法,得到一种快速且有效的噪声估计算法。在不损害增强后语音感知质量的条件下,融合了TSNR和非线性谐波增强算法,使得基于维纳滤波的语音增强算法得到最大的平均分段信噪比提升。然后,对语音信号中的常用的音频特征参数进行归纳总结,重点分析了短时信息熵,同时引入了短时幅度相对值的概念。而后提出了一种结合时域和频域特征,且在复杂背景噪声环境下能够有效区分语音和非语音的音频特征参数,称之为短时时频值。在短时时频值的基础上,提出了一种能够在复杂环境下对语音的起止点做出高效判断的语音端点检测算法。最后,用带噪语音数据库和自行采集整理的语音数据库对上述的方法进行验证,并对检测结果进行分析和评价。实验表明,本文中提出的端点检测算法高效、鲁棒,在复杂的噪声环境下不仅能实时快速的完成计算,又能提高实际应用系统的性能。
吕婧一[9](2014)在《高阶统计量分析及其应用研究》文中认为高阶统计量(Higher Order Statistics, HOS)作为信号处理学的一个数学工具,以其优于一阶、二阶统计量的在抗噪声方面的一些重要特性近年来获得了广泛的关注和应用,特别是在处理背景噪声为高斯噪声的观测信号时效果更为显着。论文研究了高阶统计量分析的特点、估计方法及性质,基于matlab高阶谱分析工具箱测试并理解高阶统计量分析在抗噪声性能方面的性能。将高阶统计量分别应用于信号处理,包括典型的一维语音信号处理和多维地震勘探信号处理。在语音信号处理方面,将高阶累积量参数应用于语音端点检测,与传统特征参数相结合,以提高端点检测算法的抗噪声性能。基于matlab仿真验证,对实际语料进行测试,实现低信噪比下的语音端点检测的良好效果;在地震信号处理上,结果表明基于三阶累积量实现的语音端点检测,在低信噪比下有良好效果。针对地震勘探反射波的多维信号,为通过地震信号参数分析地震断层,传统采用互相关时延计算方法。论文基于文献中的互四阶累积量的时延估计理论检测断层,对比传统方法,引入互四阶累积量的时延估计获取的地震时间延迟剖面、地震断层检测效果图主观效果明显好于传统方法。
刘泽国,张会庆,张环,张兆基[10](2010)在《结合语音学知识的藏语语音端点检测方法研究》文中研究说明端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响。本文将藏语语音学知识融入了端点检测过程中,同时综合时域频域特征,根据短时能频值和语音能量集中区的频域谱幅采取自适应门限方法,改进了端点检测的方法,实验表明该方法提高了端点检测的识别率,对于藏语语音识别起到了很好的辅助作用。
二、一种基于能频积实现连续语音端点检测的方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种基于能频积实现连续语音端点检测的方法(论文提纲范文)
(1)ROS地面移动机器人藏语语音控制的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 论文的研究背景 |
1.2 论文的研究目的和意义 |
1.3 论文研究内容和组织结构 |
第二章 藏语语音识别简介 |
2.1 藏语概述 |
2.1.1 文字特性 |
2.1.2 语音特性 |
2.2 语音识别概述 |
2.2.1 语音识别概念 |
2.2.2 语音识别分类 |
2.3 语音识别技术 |
2.3.1 基于模板匹配的语音识别 |
2.3.2 基于隐马尔可夫的语音识别 |
2.3.3 基于神经网络的语音识别 |
2.3.4 语音识别技术小结 |
2.4 藏语语音识别研究现状 |
第三章 ROS概述 |
3.1 ROS介绍 |
3.1.1 ROS特点 |
3.1.2 ROS架构 |
3.1.3 ROS消息通信机制 |
3.1.4 ROS工程结构 |
3.2 ROS研究与应用现状 |
第四章 藏语语音识别模块的实现 |
4.1 语料库建设 |
4.1.1 文本语料库 |
4.1.2 语音语料库 |
4.2 语音前期处理 |
4.2.1 语音预加重 |
4.2.2 语音端点检测 |
4.2.3 分帧加窗 |
4.2.4 特征提取 |
4.3 DTW方法语音训练与识别 |
4.3.1 创建特征模板库 |
4.3.2 动态语音匹配 |
4.3.3 实验测试 |
4.4 GMM-HMM模型训练与识别 |
4.4.1 模型训练 |
4.4.2 语音识别 |
4.4.3 实验测试 |
第五章 ROS机器人移动控制模块开发 |
5.1 系统资源 |
5.1.1 硬件资源 |
5.1.2 软件资源 |
5.2 ROS节点设计 |
5.2.1 总体设计 |
5.2.2 项目搭建 |
5.2.3 移动控制功能调试 |
第六章 移动机器人藏语语音控制的实现 |
6.1 藏语语音识别节点 |
6.2 TURTLEBOT2 移动控制节点 |
6.3 系统测试 |
第七章 总结和展望 |
参考文献 |
攻读学位期间发表的学术论文目录 |
攻读学位期间参与的科研项目 |
致谢 |
(2)低信噪比下语音多路信号端点切分仿真(论文提纲范文)
1 引言 |
2 低信噪比下语音多路信号端点切分 |
2.1 语音多路信号增强 |
2.2 语音多路信号端点检测切分 |
1) 设置合理阈值 |
2) 判断语音始端 |
3) 判断清音与浊音切分点 |
4) 判别语音音节结尾 |
5) 判定下一个音节初始端 |
6) |
3 实验结果与分析 |
4 结束语 |
(3)基于语音关键词检测的监所报警系统软件研发(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题背景和意义 |
1.2 国内外现状研究 |
1.2.1 语音识别技术的研究与发展 |
1.2.2 卷积神经网络在语音识别中的应用 |
1.3 本文的研究内容 |
1.4 本文的组织结构 |
1.5 本章小结 |
2 相关技术介绍 |
2.1 语音识别技术 |
2.1.1 语音识别基本原理 |
2.1.2 Kaldi简介 |
2.2 卷积神经网络基本理论 |
2.2.1 卷积神经网络基本结构 |
2.2.2 卷积神经网络训练算法 |
2.3 Web客户端音频处理相关技术 |
2.3.1 React+Redux+Node.js+Express开发框架 |
2.3.2 MSE+WebSocket音频流式播放方案 |
2.3.3 音频编码格式 |
2.4 本章小结 |
3 监所报警系统总体架构设计 |
3.1 系统应用架构 |
3.2 系统软件总体架构 |
3.3 本章小结 |
4 基于卷积神经网络的语音关键词检测算法设计 |
4.1 模型训练方法设计 |
4.1.1 训练数据集构建方案 |
4.1.2 基于N-gram的语言模型构建方法 |
4.1.3 基于CNN-HMM的声学模型训练方法 |
4.2 实时检测方法设计 |
4.2.1 基于GMM建模的语音端点检测 |
4.2.2 基于Kaldi框架的语音关键词检测 |
4.3 本章小结 |
5 监所报警系统软件详细设计 |
5.1 服务端软件详细设计 |
5.1.1 服务端软件模块设计 |
5.1.2 设备接入层设计 |
5.1.3 通信协议设计 |
5.2 Web客户端软件详细设计 |
5.2.1 Web客户端软件模块设计 |
5.2.2 业务流程设计 |
5.3 系统音频处理方案 |
5.3.1 音频编解码 |
5.3.2 语音关键词检测 |
5.3.3 音频播放方案 |
5.4 本章小结 |
6 系统测试与分析 |
6.1 测试概要 |
6.1.1 测试环境 |
6.1.2 测试内容 |
6.2 测试方案和结果 |
6.2.1 功能测试 |
6.2.2 性能测试 |
6.3 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
作者简历 |
(4)移动通信端到端语音加密传输技术研究(论文提纲范文)
摘要 |
Abstract |
缩略语表 |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.3 论文研究内容与组织结构 |
第二章 移动通信中的语音编码与传输 |
2.1 语音编码基本概况 |
2.2 语音参数编码原理 |
2.2.1 语音信号数学模型 |
2.2.2 语音信号线性预测分析 |
2.3 移动通信中的典型语音编码 |
2.3.1 RPE-LTP编码 |
2.3.2 CELP编码 |
2.3.3 ACELP编码 |
2.3.4 AMR编码 |
2.4 语音质量评价标准 |
2.4.1 绝对种类定级ACR |
2.4.2 感知语音质量评估PESQ |
2.5 移动通信中的VAD检测技术 |
2.6 本章小结 |
第三章 基于改变语音频谱形态的方案 |
3.1 方案原理与设计 |
3.2 音节分割方法研究与设计 |
3.2.1 语音信号的短时特征参数研究 |
3.2.2 音节分割方法设计 |
3.3 频谱变换方法设计 |
3.3.1 移频方法设计 |
3.3.2 级联滤波方法设计 |
3.4 仿真结果与分析 |
3.5 本章小结 |
第四章 基于加密语音数据调制解调的方案 |
4.1 方案原理与设计 |
4.2 语音压缩编码方法研究 |
4.2.1 MELP编码算法原理 |
4.2.2 抗误码压缩编码算法设计 |
4.2.3 抗误码压缩编码算法的性能分析 |
4.3 流加密方法研究 |
4.4 调制解调参数设计 |
4.5 声道滤波器研究 |
4.6 仿真结果与分析 |
4.6.1 多种调制方式下的效果比较 |
4.6.2 多种信道条件下的仿真结果 |
4.7 本章小结 |
第五章 总结与展望 |
致谢 |
参考文献 |
攻读硕士学位期间的科研经历 |
(5)复杂噪声环境下语音端点的检测算法的研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 课题的目的与意义 |
1.2 国内外研究现状 |
1.2.1 语音增强的发展及现状 |
1.2.2 语音端点检测发展及现状 |
1.3 本文的研究主要内容和创新点 |
1.4 论文结构和章节安排 |
第二章 语音信号处理以及语音库的建立 |
2.1 语音信号的特点和模型 |
2.1.1 语音的主要特性 |
2.1.2 噪声的主要特性 |
2.1.3 语音信号模型 |
2.2 语音信号数字化以及预处理 |
2.2.1 语音信号的数字化 |
2.2.2 语音信号预处理 |
2.3 语音信号分析 |
2.3.1 时域分析 |
2.3.2 频域分析 |
2.3.3 同态分析 |
2.4 实验语音库 |
2.4.1 语音库的建立 |
2.4.2 语音与噪声的合成 |
第三章 基于快速欧式搜索算法的自适应滤波 |
3.1 自适应滤波系统 |
3.1.1 滤波器 |
3.1.2 滤波算法 |
3.2 自适应滤波系统改进 |
3.2.1 滤波算法的改进 |
3.2.2 结构的改进 |
3.3 语音增强算法的评价指标 |
3.3.1 MOS评价方法 |
3.3.2 SNR评价方法 |
3.4 实验结果分析 |
3.4.1 自适应滤波实验 |
3.4.2 结果及分析 |
第四章 基于分类标准的延迟分割策略 |
4.1 端点检测算法 |
4.1.1 基于双门限的语音端点检测方法 |
4.1.2 基于谱熵的语音端点检测方法 |
4.1.3 基于分形的语音端点检测方法 |
4.2 语音特征参数的选取 |
4.2.1 能频比 |
4.2.2 排列熵 |
4.3 分类标准 |
4.4 语音端点检测过程 |
4.5 实验 |
第五章 实验结果与分析 |
5.1 实验平台 |
5.2 对比实验及结果分析 |
5.2.1 基于双门限的检测方法实验结果 |
5.2.2 基于谱熵的检测方法实验结果 |
5.2.3 基于分形的检测方法实验结果 |
5.2.4 基于分类标准的延迟分割策略检测方法实验结果 |
第六章 总结与展望 |
参考文献 |
致谢 |
研究生期间主要成果 |
(6)一种复杂噪声环境下的语音端点检测方法(论文提纲范文)
1 引言 |
2 延时分割策略 |
2. 1 能频比 |
2. 2 排列熵算法 |
2. 3 分类标准 |
( 1) 第1 个标准: 语音段的长度 λ。 |
( 2) 第2 个标准: 相邻语音段之间的距离dij。 |
2. 4 实现步骤 |
3 实验仿真结果 |
4 结论 |
(7)基于卷积神经网络的语音端点检测方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 语音端点检测研究背景及意义 |
1.2 语音端点检测研究动态 |
1.3 论文主要内容与组织结构 |
第二章 语音信号处理 |
2.1 语音和噪音的特征 |
2.1.1 语音的特征 |
2.1.2 噪音的特征 |
2.2 语音信号预处理 |
2.2.1 采样、量化和预加重 |
2.2.2 分帧和加窗 |
2.3 语音信号的时域分析 |
2.4 语音信号的频域分析 |
第三章 常用的语音端点检测算法 |
3.1 基于短时能量和过零率的语音端点检测算法 |
3.1.1 短时能量特征 |
3.1.2 短时平均过零率 |
3.1.3 基于短时能量和过零率的语音端点检测 |
3.2 基于信息熵的语音端点检测算法 |
3.3 基于短时能频值的语音端点检测算法 |
3.3.1 短时能频值 |
3.3.2 基于短时能频值的语音端点检测 |
3.4 本章小结 |
第四章 基于卷积神经网络的语音端点检测 |
4.1 卷积神经网络 |
4.1.1 卷积神经网络的发展 |
4.1.2 卷积神经网络结构特征 |
4.1.3 卷积神经网络的训练 |
4.2 基于卷积神经网络的语音端点检测 |
4.3 实验评价标准 |
4.4 实验结果及分析 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
(8)复杂环境下高效端点检测算法研究及应用(论文提纲范文)
摘要 |
Abstract |
Table of Contents |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 语音端点检测技术的发展和研究现状 |
1.3 语音增强算法的发展及研究现状 |
1.4 本文的主要工作及安排 |
第二章 语音信号处理基础知识 |
2.1 语音信号的数字化与预处理 |
2.1.1 语音信号的预滤波 |
2.1.2 语音信号的采样与量化 |
2.1.3 语音信号的预加重 |
2.1.4 短时分帧加窗处理 |
2.2 语音信号处理中常用的音频特征 |
2.2.1 短时能量分析 |
2.2.2 短时平均过零率分析 |
2.2.3 短时平均幅度值分析 |
2.2.4 短时信息熵分析 |
2.2.5 语谱图分析 |
2.2.6 基音周期检测 |
2.3 影响语音信号端点检测的因素以及噪音分类 |
2.3.1 影响语音信号端点检测的因素 |
2.3.2 噪声的分类 |
2.3.3 人耳的感知特性 |
2.4 小结 |
第三章 语音增强算法研究 |
3.1 噪声功率谱估计 |
3.1.1 噪声估计算法概述 |
3.1.2 改进的噪声功率谱算法 |
3.2 维纳滤波语音增强算法 |
3.2.1 维纳滤波基本原理 |
3.2.2 先验信噪比的估计 |
3.2.3 基于非线性的谐波增强算法 |
3.3 语音增强算法的性能评价标准 |
3.3.1 语音质量主观评价 |
3.3.2 语音质量客观评价 |
3.4 小结 |
第四章 短时时频值端点检测算法研究 |
4.1 传统的语音端点检测概述 |
4.2 基于短时时频值的端点检测算法 |
4.2.1 语音信号的平滑处理 |
4.2.2 短时时频值的定义 |
4.2.3 短时时频值的提取过程 |
4.2.4 基于短时时频值的端点检测算法 |
4.3 小结 |
第五章 实验结果与分析 |
5.1 语音数据库建设 |
5.1.1 NOIZEUS带噪语音数据库 |
5.1.2 Android手机录制的语音数据 |
5.1.3 实际应用中整理出的语音数据 |
5.2 基于GMM-UBM的文本相关说话人识别系统 |
5.3 实验结果分析 |
5.3.1 语音增强算法的实验 |
5.3.2 端点检测算法的实验结果与分析 |
第六章 说话人识别的应用实例 |
6.1 说话人识别技术在移动终端上的应用 |
6.2 小结 |
第七章 工作总结及展望 |
参考文献 |
致谢 |
(9)高阶统计量分析及其应用研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题背景 |
1.2 高阶统计量的研究现状 |
1.3 高阶统计量在信号处理中的应用 |
1.4 课题目标及主要研究内容 |
第二章 高阶统计量的理论基础 |
2.1 高阶统计量的定义 |
2.1.1 高阶矩和高阶累积量的定义 |
2.1.2 高阶矩谱和高阶累积量谱的定义 |
2.1.3 高斯过程的高阶矩和高阶累积量 |
2.2 高阶统计量的性质 |
2.2.1 高阶矩和高阶累积量的性质 |
2.2.2 高阶谱的性质 |
2.3 高阶累积量与高阶谱的估计 |
2.3.1 高阶累积量的估计 |
2.3.2 高阶谱的估计 |
2.4 基于Matlab平台的高阶统计工具箱的使用 |
2.4.1 Matlab工具箱中高阶累积量的估计方法 |
2.4.2 Matlab工具箱中高阶谱的估计方法 |
2.5 本章小结 |
第三章 基于高阶统计量的语音信号应用研究 |
3.1 语音信号的特点和模型 |
3.2 语音信号的端点检测 |
3.2.1 语音端点检测基本原理及流程 |
3.3 语音信号预处理 |
3.3.1 预滤波与采样 |
3.3.2 预加重 |
3.3.3 加窗分帧 |
3.4 基于高阶统计量的语音信号的端点检测 |
3.5 特征参数的计算 |
3.5.1 三阶累积量的计算 |
3.5.2 高频带与全频带能量比的计算 |
3.5.3 短时过零率的计算 |
3.6 语音信号端点检测算法步骤 |
3.7 实验结果 |
3.7.1 matlab平台仿真实验结果 |
3.7.2 基于Visual Studio平台应用实现结果 |
3.8 本章小结 |
第四章 基于高阶统计量的地震信号应用研究 |
4.1 基于高阶统计量的断层检测研究 |
4.2 地震断层检测中的时延估计理论 |
4.2.1 基于传统互相关法的时延估计方法 |
4.2.2 基于四阶累积量的时延估计方法 |
4.2.3 互四阶累积量的一维切片 |
4.3 实验过程与结果 |
4.3.1 基于互四阶累积量的一维切片时延理论的实现过程 |
4.3.2 基于Visual Studio2008平台的实际地震资料实现结果 |
4.4 本章小结 |
第五章 结论与展望 |
5.1 结论 |
5.2 不足与展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
(10)结合语音学知识的藏语语音端点检测方法研究(论文提纲范文)
0、引言 |
1、藏语语音的特点 |
2、基于藏语语音学知识的端点检测算法 |
2.1、藏语语音信号特征参数选取 |
2.1.1 时域参数 |
2.1.2 频域参数 |
2.2、藏语语音端点的自适应门限设定 |
2.2.1 起点门限设定 |
2.2.2. 终点门限设定 |
3、试验结果与分析 |
4、结论 |
四、一种基于能频积实现连续语音端点检测的方法(论文参考文献)
- [1]ROS地面移动机器人藏语语音控制的研究与实现[D]. 王福钊. 西藏大学, 2020(02)
- [2]低信噪比下语音多路信号端点切分仿真[J]. 刘丽. 计算机仿真, 2019(07)
- [3]基于语音关键词检测的监所报警系统软件研发[D]. 张紫莹. 浙江大学, 2019(03)
- [4]移动通信端到端语音加密传输技术研究[D]. 韩心梓. 东南大学, 2016(02)
- [5]复杂噪声环境下语音端点的检测算法的研究[D]. 熊威. 东华大学, 2016(07)
- [6]一种复杂噪声环境下的语音端点检测方法[J]. 熊威,郑建立. 电声技术, 2015(11)
- [7]基于卷积神经网络的语音端点检测方法研究[D]. 王海旭. 内蒙古大学, 2015(01)
- [8]复杂环境下高效端点检测算法研究及应用[D]. 雷文钿. 厦门大学, 2014(08)
- [9]高阶统计量分析及其应用研究[D]. 吕婧一. 北京邮电大学, 2014(04)
- [10]结合语音学知识的藏语语音端点检测方法研究[J]. 刘泽国,张会庆,张环,张兆基. 福建电脑, 2010(08)
标签:神经网络算法论文; 语音识别技术论文; 设备点检论文; kaldi语音识别论文; 信噪比论文;