文本无关的说话人识别开题报告

 2023-08-03 08:57:53

1. 研究目的与意义

现今,随着计算机性能的提升以及深度学习的飞速发展,语音技术逐渐在人们日常生活中普及,其中说话人识别又称声纹识别,是语音识别领域内重要分支之一。

说话人识别是一种非接触式的生物特征识别技术。

在某些特殊要求下需要使用生物认证,目前常用的生物认证方式,有血液dna认证,虹膜认证,面容识别认证,指纹认证,说话人识别认证。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

课题的关键点在于语音识别的训练模型的建立和特征提取时选取的参数,训练模型的建立将直接影响识别的成功率和准确率,而特征提取选择一个好的参数,对于识别的帮助是非常大的,将有效减少其他因素的干扰(如噪音和说话时的语气),因此,在此课题中,我认为较为重要的就是训练模型的建立和特征提取时选取的参数。

难点:1.特征提取,语音信号数字化之后做特征提取,这里的提取,主要是尽量去除掉外界的噪音干扰,从而提高语音识别的准确率。

需要考虑,应该提取什么样的信息作为特征比较合适,因为选择合适的特征参数,可以提高语音识别的准确率。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

本设计查阅调研了有关说话人识别的文献后,我发现本设计是在matlab当中设计,所以我研究了在matlab实现说话人识别技术的论文[1]。

文中基于gmm模型对说话人识别系统进行详细阐述。

在现实生活中,很多情况下都需要验证人们的身份。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

要实现文本无关的说话人识别,首要的关键技术就是声纹识别技术,需要将说话人的声纹记录下来并成功识别,相当于让计算机认识说话人,使其具备辨认说话人的能力,这样才能够为成功实现无关文本的说话人识别奠定基础。

实现文本无关的说话人识别,需要经历两个阶段:训练阶段, 实际的语音信号是模拟信号,因此在对语音信号进行数字处理之前,首先要将模拟语音信号s(t)以采样周期t采样,将其离散化为s(n),采用周期的选取应根据模拟语音信号的带宽(依奈奎斯特采样定理)来确定,以避免信号的频域混叠失真。

在对离散后的语音信号进行量化处理过程中会带来一定的量化噪声和失真。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

2022-2022-1学期:第15-16周:完成选题,查阅相关中英文资料。

第17周:与导师沟通进行课题总体规划。

第18-19周:导师下发的毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲,进行开题报告的撰写。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。