清华大学研发:最先进的深度学习分类算法Meta-Semi

基于深度学习的半监督学习算法近年来显示出有希望的结果。然而,它们在真正的半监督学习场景中尚不实用,例如医学图像处理、高光谱图像分类、网络流量识别和文档识别。

在这些类型的方案中,标记的数据对于超参数搜索是稀缺的,因为它们引入了多个可调的超参数。一个研究小组提出了一种基于元学习的新型半监督学习算法,称为Meta-Semi,只需要调整一个额外的超参数。他们的Meta-Semi方法优于最先进的半监督学习算法。

该团队在CAAI Artificial Intelligence Research杂志上发表了他们的工作。

深度学习是一种机器学习技术,计算机通过示例学习,在监督任务中取得了成功。然而,数据标记过程,即识别和标记原始数据,既耗时又昂贵。当有大量带注释的训练数据可用时,监督任务中的深度学习可以成功。然而,在许多实际应用中,所有可用训练数据中只有一小部分与标签相关联。

清华大学自动化系副教授黄高表示:“深度学习最近在监督任务中的成功是由丰富的带注释的训练数据推动的”。然而,耗时、昂贵的精确标签收集是研究人员必须克服的挑战。“Meta-semi作为一种最先进的半监督学习方法,可以用少量标记样本有效地训练深度模型”。

借助研究团队的Meta-Semi分类算法,他们有效地利用了标记的数据,同时只需要一个额外的超参数即可在各种条件下实现令人印象深刻的性能。在机器学习中,超参数是其值可用于指导学习过程的参数。

黄高表示,“大多数基于深度学习的半监督学习算法引入了多个可调超参数,这使得它们在真正的半监督学习场景中不太实用,因为标记的数据对于广泛的超参数搜索来说是稀缺的”。

该团队开发了他们的算法,其工作基于这样的假设,即网络可以使用正确的伪标记未注释样本进行有效训练。首先,他们在训练过程中根据网络预测在线为未标记的数据生成软伪标签。

然后,他们过滤掉伪标签不正确或不可靠的样本,并使用具有相对可靠的伪标签的剩余数据训练模型。他们的过程自然产生了一个元学习公式,其中正确的伪标记数据与标记数据具有相似的分布。在他们的过程中,如果网络是用伪标记数据训练的,那么标记数据的最终损失也应该最小化。

该团队的Meta-Semi算法在半监督学习的各种条件下实现了竞争性能。黄高表示,“从经验上讲,Meta-Semi在具有挑战性的半监督CIFAR-100和STL-10任务上明显优于最先进的半监督学习算法,并在CIFAR-10和SVHN上实现了有竞争力的性能”。

CIFAR-10、STL-10 和 SVHN 是经常用于训练机器学习算法的数据集或图像集合。黄高表示,“我们还从理论上表明,在温和的条件下,Meta-Semi收敛到标记数据上损失函数的平稳点”。与现有的深度半监督学习算法相比,Meta-Semi 调整超参数所需的工作量要少得多,但在四个竞争数据集上实现了最先进的性能。

展望未来的工作,研究团队的目标是开发一种有效,实用和强大的半监督学习算法。黄高表示,“该算法应该需要最少的数据注释,最少的超参数调整工作,以及最少的训练时间。为了实现这一目标,我们未来的工作可能集中在降低Meta-Semi的培训成本上“。

展开阅读全文

页面更新:2024-06-07

标签:算法   可调   深度   清华大学   条件下   注释   标记   团队   参数   标签   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top