基于深度半监督学习算法的图像分类系统设计与实现开题报告

 2023-09-11 10:00:05

1. 研究目的与意义

现状及发展趋势:

事实一再表明,深度神经网络[1]通过利用大量的标记数据集[2],可以在某些监督学习[3]问题上达到人类或超人类水平的性能。然而,这些成功是有代价的。创建这些大型数据集通常需要大量的人力(手动标注示例)痛苦或风险(对于涉及侵入性测试的医疗数据集)或财务费用(雇用标注者或建立特定领域数据收集所需要的基础设施)。对于许多实际问题和应用,我们缺乏资源来创建一个足够大的标记数据集,这限制了深度学习技术的广泛采用。

解决数据匮乏的一个有吸引力的方法是半监督学习[4](ssl),与需要给所有例子贴标签的监督学习算法相比,ssl算法可以通过使用未贴标签的例子来提高其性能。ssl算法通常提供了一种从无标签的例子中学习数据结构的方法,减轻了对标签的需求。最近的一些结果显示,在某些情况下,ssl接近于纯监督学习的性能,即使在一个给定的数据集中的大部分标签被丢弃的情况下。这些结果是通过采用现有的分类数据集(通常是cifar-10[5]或svhn[6]),并只使用其中的一小部分作为标签数据,其余的作为无标签处理。用ssl训练的模型在有标签和无标签数据的情况下,其准确率达到了90%。然后将其与仅在小部分标签上训练的模型进行比较。这些最近的成功提出了一个自然的问题。ssl方法是否适用于“真实世界”的环境?在文本中,我们认为这种事实上的评估ssl技术的方法并没有以令人满意的方式解决这个问题。我们的目标是更直接地回答这个问题,提出了一个新的实验方法,我们认为它能更好地衡量对现实世界问提的适用性。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和问题

基本内容:

本课题预计设计一个图像分类系统。系统主要包括以下模块1.数据集创建模块,用来读取并创建数据集。2.图像预处理模块,用来对图像进行降噪处理。3.算法训练模块,分别使用vat以及pi-model算法对模型进行训练。4结果存储模块,用来存储实验结果。其中算法训练模块分别使用vat以及pi-model算法来对模型进行预训练,并在具有不同标签数据量的情况下测试分类准确率,得出较优的算法。

预计解决的难题:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 设计方案和技术路线

在了解半监督学习基本工作原理基础上,对图像分类进行算法设计,运用python语言进行算法实现,同时测试该算法的准确率。

4. 研究的条件和基础

具备了基本的编程能力,初步学习了anaconda,python。

并对SSL有了初步的了解。查阅了相关技术资料与文献。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。