清华大学研发：最先进的深度学习分类算法Meta-Semi

基于深度学习的半监督学习算法近年来显示出有希望的结果。然而，它们在真正的半监督学习场景中尚不实用，例如医学图像处理、高光谱图像分类、网络流量识别和文档识别。

在这些类型的方案中，标记的数据对于超参数搜索是稀缺的，因为它们引入了多个可调的超参数。一个研究小组提出了一种基于元学习的新型半监督学习算法，称为Meta-Semi，只需要调整一个额外的超参数。他们的Meta-Semi方法优于最先进的半监督学习算法。

该团队在CAAI Artificial Intelligence Research杂志上发表了他们的工作。

深度学习是一种机器学习技术，计算机通过示例学习，在监督任务中取得了成功。然而，数据标记过程，即识别和标记原始数据，既耗时又昂贵。当有大量带注释的训练数据可用时，监督任务中的深度学习可以成功。然而，在许多实际应用中，所有可用训练数据中只有一小部分与标签相关联。

清华大学自动化系副教授黄高表示：“深度学习最近在监督任务中的成功是由丰富的带注释的训练数据推动的”。然而，耗时、昂贵的精确标签收集是研究人员必须克服的挑战。“Meta-semi作为一种最先进的半监督学习方法，可以用少量标记样本有效地训练深度模型”。

借助研究团队的Meta-Semi分类算法，他们有效地利用了标记的数据，同时只需要一个额外的超参数即可在各种条件下实现令人印象深刻的性能。在机器学习中，超参数是其值可用于指导学习过程的参数。

黄高表示，“大多数基于深度学习的半监督学习算法引入了多个可调超参数，这使得它们在真正的半监督学习场景中不太实用，因为标记的数据对于广泛的超参数搜索来说是稀缺的”。

该团队开发了他们的算法，其工作基于这样的假设，即网络可以使用正确的伪标记未注释样本进行有效训练。首先，他们在训练过程中根据网络预测在线为未标记的数据生成软伪标签。

然后，他们过滤掉伪标签不正确或不可靠的样本，并使用具有相对可靠的伪标签的剩余数据训练模型。他们的过程自然产生了一个元学习公式，其中正确的伪标记数据与标记数据具有相似的分布。在他们的过程中，如果网络是用伪标记数据训练的，那么标记数据的最终损失也应该最小化。

该团队的Meta-Semi算法在半监督学习的各种条件下实现了竞争性能。黄高表示，“从经验上讲，Meta-Semi在具有挑战性的半监督CIFAR-100和STL-10任务上明显优于最先进的半监督学习算法，并在CIFAR-10和SVHN上实现了有竞争力的性能”。

CIFAR-10、STL-10 和 SVHN 是经常用于训练机器学习算法的数据集或图像集合。黄高表示，“我们还从理论上表明，在温和的条件下，Meta-Semi收敛到标记数据上损失函数的平稳点”。与现有的深度半监督学习算法相比，Meta-Semi 调整超参数所需的工作量要少得多，但在四个竞争数据集上实现了最先进的性能。

展望未来的工作，研究团队的目标是开发一种有效，实用和强大的半监督学习算法。黄高表示，“该算法应该需要最少的数据注释，最少的超参数调整工作，以及最少的训练时间。为了实现这一目标，我们未来的工作可能集中在降低Meta-Semi的培训成本上“。

展开阅读全文

页面更新：2024-06-07

标签：算法可调深度清华大学条件下注释标记团队参数标签数据

1 2 3 4 5

清华大学研发：最先进的深度学习分类算法Meta-Semi

请停下“按键伤人”

快递站起火网购达人的“痛”

reactor的实现

用于高效稳定钙钛矿太阳能电池的卤族-硫族异质结构

模拟芯片的未来十年

我国电气化进程呈稳步推进态势

硅谷银行倒闭引币圈大震，挤兑风暴将至？虚拟货币能扛住吗…

两位院士调研湖南海利集团以科技助力高质量发展

湖北小县城，跑出一个超级IPO！新能源造富盛宴还在继续

改善客户入场，“炒房客”淡出-济南楼市回暖背后的逻辑

机构去哪儿一周接待300家！知名投资机构扎堆儿调研这家公司，重点问了这个问题

加科思：硅谷银行现金存款余额不足40万美元，已全部转出

沪铝市场分析及后期展望20230312

“持有期”权益基金3年仍亏钱？13只产品年内到期

Hi4混动系统发布长城这场新能源发布会果然干货满满

最新发布:非农数据不好不坏

东体：新疆足球有4大优势 4支梯队的教练和工作团队达27

组建国家数据局传递了什么信号

选错了？前湖人悍将离队后数据明显下滑若能留队恐有更

SQL server数据库日志太大收缩方法

国产芯片突破！华中科技大学教授带领团队研发下一代存储

常见数据库安装

刷算法的同学们福音：labuladong 的算法小抄 - 刷算法全

国家3月最新公布的经济和金融数据背后，释放了哪些重要

2022“上海工匠”、司鉴院声像和电子数据鉴定研究室副