基于深度学习的跨模态行人检索算法研究与实现开题报告

 2023-04-08 09:55:01

1. 研究目的与意义(文献综述包含参考文献)

一、选题背景近年来,随着科技革命的兴起,人工智能应用越来越广泛,例如小区的车牌识别、支付宝的人脸识别、门禁系统的人脸识别和打卡的人脸识别。

随着人工智能时代的到来,计算机视觉技术和人工智能相结合,产生了大量的人工智能应用和技术。

比如行人检测技术和跨摄像头的行人再识别技术。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容、问题解决措施及方案

需要解决的问题:1.通过文本检索相应的图像2.结合深度学习构造跨模态检索算法3.提高跨模态行人检索算法的准确性拟采用的研究途径:1.经过查阅资料了解跨模态检索的原理,运用Python语言来实现文字特征和图片特征的提取,构造系统完成跨模态行人检索。

2.经研究发现,语义自对齐网络(SSAN)明显优于目前一般的方法,这是一种自动提取对应视觉区域的部分级文本特征的新方法,基于多视角的非局部网络来捕捉身体部位之间的关系,从而建立身体部位与名词短语之间更好的对应关系,并且引入了一种复合排名(CR)损失,它利用对相同身份的其他图像的文本描述来提供额外的监督,从而有效地减少文本特征的类内差异。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。