1. 研究目的与意义
随着语音识别技术的迅速发展,以计算机、手机、平板等为载体的人工智能研究日新月异。
各种人机交互不再局限于识别特定说话人语音中的单一音素或语句,如何识别语音中的情感已成为语音识别领域的新兴研究方向。
语音不仅包含说话人所要表达的语义信息,也蕴含说话人的情感状态。
2. 课题关键问题和重难点
关键问题:1)语音情感数据库作为情感特征提取与情感识别之间的关键环节,是实现情感识别的前提。
本次设计选用离散情感模型的汉语casia数据库。
2)语音情感识别中用到了opensmile进行语音情感特征的提取,作为一款已经被很多研究者使用的提取情感特征的工具箱,它以命令行形式运行,通过配置config文件,提取声音信号的各类音频特征,主要是low-level descriptors (llds)。
3. 国内外研究现状(文献综述)
伴随着语音情感识别的快速发展,近年来众多计算机使用者都重点关注了该对象。
其中正是因为语音情感识别应用广泛,例如通过关注司机的语音、表情和行为信息来识别实时状态,提醒驾驶员控制情绪、安全驾驶;当然也有利用设备来收集病人的语音信号来实时检测其异常情感状态,保证病人人身安全情况等等都是为了更好的为人类服务。
在孙晓虎,李洪均所撰写的《语音情感识别综述》[1]中,介绍了语音情感特征,归纳总结了各种语音特征参数对语音情感识别的意义。
4. 研究方案
四、方案(设计方案、研制方案、研究方案)论证(不少于100字)本课题的主要研究目标是完成特定语音信号的情感识别,设计方案分为以下三个部分:(一)语音信号的预处理关于语音信号的预处理工作,其目的是消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等等因素对语音信号质量的影响。
同时尽可能保证后续语音处理得到的信号更均匀、平滑,为信号参数提取提供优质的参数,提高语音处理质量。
预处理的常见工作包括预加重、分帧、加窗等。
5. 工作计划
2022-2022-1学期:第15-16周:完成选题,查阅相关中英文资料。
第17周:与导师沟通进行课题总体规划。
第18-19周:导师下发的毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲,进行开题报告的撰写。
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。