发现机器学习中的未知未知数

2024-05-21 18:54:04

机器学习 (ML) 模型的性能取决于学习算法以及用于训练和评估的数据。算法的作用得到了很好的研究，并且是众多挑战的焦点，例如SQuAD、GLUE、ImageNet等。此外，还努力改进数据，包括一系列解决 ML 评估问题的研讨会。相比之下，专注于用于评估 ML 模型的数据并不常见。此外，许多评估数据集包含易于评估的项目，例如具有易于识别的主题的照片，因此它们错过了现实世界上下文的自然模糊性。评估中缺乏模棱两可的真实世界示例削弱了可靠地测试机器学习性能的能力，这使得 ML 模型容易出现“弱点”，即模型难以或不可能准确评估的示例类别，因为评估集中缺少那类示例。

为了解决识别 ML 模型中的这些弱点的问题，我们最近在HCOMP 2020（对全球研究人员和开发人员开放至 2021 年 4 月 30 日）发起了机器学习众包不利测试集(CATS4ML) 数据挑战赛。挑战的目标是提高 ML 评估集的标准，并找到尽可能多的示例，这些示例使算法处理起来令人困惑或有其他问题。CATS4ML 依靠人们的能力和直觉来发现机器学习确信但实际上错误分类的新数据示例。

什么是机器学习“弱点”？

有两类弱点：已知的未知数和未知的未知数。已知未知数是模型不确定正确分类的示例。研究界继续在称为主动学习的领域中研究这一点，并找到了解决方案，概括地说，就是在不确定的例子上以交互方式从人们那里获取新标签。例如，如果模特不确定照片的主题是否是猫，则要求一个人进行验证；但如果系统是确定的，就不会问一个人。虽然这方面还有改进的余地，但令人欣慰的是模型的置信度与其性能相关，即可以看到模型不知道的东西。

另一方面，未知的未知数是模型对其答案充满信心但实际上是错误的示例。主动发现未知未知数的努力（例如Attenberg 2015和Crawford 2019）帮助发现了许多意外的机器行为。与这种发现未知未知的方法相比，生成对抗网络(GAN)生成未知的未知用于计算机视觉错觉形式的图像识别模型，这些模型会导致深度学习模型犯超出人类感知的错误。虽然 GAN 会在有意操纵的情况下发现模型漏洞，但现实世界的示例可以更好地突出模型在日常性能中的失败。这些真实世界的例子是 CATS4ML 感兴趣的未知未知数——挑战旨在收集人类可以可靠解释但许多 ML 模型肯定不同意的未经处理的例子。

CATS4ML数据挑战的第一版：打开图像数据集

的CATS4ML数据的挑战集中在视觉识别，使用图像和标签从打开图像数据集。挑战的目标图像是从开放图像数据集中选择的，以及来自同一数据集的一组 24 个目标标签。挑战参与者被邀请发明新的和创造性的方法来探索这个现有的公开可用的数据集，并专注于预先选择的目标标签列表，发现 ML 模型未知未知数的例子。

CATS4ML是FAIR最近推出的用于动态数据收集的DynaBench研究平台的补充。DynaBench 使用 ML 模型在循环中解决静态基准测试问题，CATS4ML 通过鼓励探索现有的 ML 基准测试可能是未知的不利示例，专注于改进 ML 的评估数据集。结果将有助于检测和避免未来的错误，还将为模型可解释性提供见解。

通过这种方式，CATS4ML 旨在通过提供数据集资源来提高对问题的认识，开发人员可以使用这些资源来发现其算法的弱点。这也将为研究人员提供有关如何为机器学习创建更加平衡、多样化和具有社会意识的基准数据集的信息。

参与

我们邀请全球 ML 研究人员和从业者社区与我们一起努力从开放图像数据集中发现有趣、困难的例子。在挑战网站上注册，下载目标图像和标记数据，贡献您发现的图像并参加获胜者的比赛！

为了在本次比赛中得分，参赛者应提交一组图像-标签对，由人工在环评分者确认，其投票应与多个机器上标签的平均机器得分不一致学习模型。

更新说明：优先更新微信公众号“雨夜的博客”，后更新博客，之后才会陆续分发到各个平台，如果先提前了解更多，请关注微信公众号“雨夜的博客”。

创意影片·下一代视频编辑器

- AI DISCOVERY - 你是不是也觉得人工智能在未来会取代很多东西呢? 或者在想人工智能会不会取代人类, 或者会成为一个全新的人类? eva
AI系统中的偏差与偏见

人工智能系统中存在着偏见,但是有偏见的算法系统并不是一个新现象.随着包括司法和健康等领域在内的各种组织都在采用人工智能技术,人们开始关注对基于人工智能的决策缺乏问责制和偏见.从人工智能研究人员和软件工 ...
机器都能监督自己学习，你为什么不行？

学习是人类一生的使命.谁成想,机器也同样悲惨地被人类赋予了这个使命.于是,参照人类大脑利用深度神经网络来解决特征表达的运作方式,机器从此走上了"深度学习"的路,一去不复返..... ...
什么是模式识别？

在 5 岁时,大多数孩子可以识别数字和字母--小字符.大字符.手写.机器打印或旋转--所有这些都很容易被年轻人识别. 在大多数情况下,最好的模式识别器是人类,但我们不了解人类如何识别模式. 模式识别是 ...
AI的发展（一）

人工智能是集合了计算机科学逻辑学生物学心理学和哲学等众多学科,在语音识别图像处理自然语言处理自动定理证明及智能机器人等应用领域取得了显著成果人工智能在社会发展中扮演着不可或缺的角色人工智能在提升劳动效 ...
如何避免机器学习中的「7」种数据偏差

机器学习中的数据偏差是一种错误,其中数据集的某些元素比其他元素具有更大的权重和或表示.有偏见的数据集不能准确地表示模型的用例,从而导致结果偏斜,准确性水平低和分析错误. 通常,用于机器学习项目的训练数 ...
人工智能算法：遗传算法

程序员书屋2021-01-21 19:20:37 本书的前两章从某种抽象意义上定义了演化算法.计分.选择.种群.交叉和突变都是演化算法的重要特点,但是我们尚未将所有这些特点整合到一个具体算法中. 遗传 ...
中澳专家在云南发现1万年前未知古人群

中澳专家在云南发现1万年前未知古人群近日,中澳科学家关于云南"马鹿洞人"的重大考古发现备受关注,不愿具名的研究人员称,"马鹿洞人"可能是一个过去未知的新人群. ...
在机器学习中重新“发现”量子力学

量子力学是一个描写各种微观现象的理论.像其它物理理论一样,量子力学并不是这些实验现象的直接反映.人类引入了一些革命性的抽象概念,如波函数.态叠加等等.通过这些革命性的概念,加上线性代数的数学基础,人类 ...
肾衰竭一发现就是中晚期？身体的4个求救信号，一定要懂得

器官衰竭,这四个字听起来似乎离大家非常遥远,仿佛只有老年人.生命到终点时,器官功能才会逐渐衰退.但事实上,"衰竭"这二者一直都是悬在部分慢性病患者头顶的一把"利刃&quo ...
机器学习中，有哪些特征选择的工程方法？

解析: 本题解析来源:@jasonfreak,链接:http://www.cnblogs.com/jasonfreak/p/5448385.html 目录 1 特征工程是什么? 2 数据预处理 2.1 ...
交易者的十大通病，如果发现自己“中枪”了...

交易者的十大通病,如果发现自己"中枪"了,得及时改正哦! 1.满仓操作期市有句俗话--满仓者必死! 满仓操作虽然有可能使你快速增加财富,但更有可能让你迅速暴仓. 事事无绝对,即便 ...
看过欧洲8座最古老图书馆，发现哈利波特中的场景也不过如此！

文章转自学生汇基友博物馆清单公众号ID:list-museum 感兴趣的盆友欢迎关注ta 图书馆是对人类知识的最完整,最了不起的贡献.它不仅拥有丰富的资源,还提供对城市精神和历史的深刻见识. 这些 ...
研究发现饮食中的糖类使肝脏的脂肪生成增加一倍

据外媒New Atlas报道,苏黎世大学科学家领导的一项新研究发现,适度食用果糖和蔗糖可以显著放大肝脏的脂肪生成.研究还表明,这些糖类引起的脂肪代谢变化可以持续很长时间. 之前的研究发现,果糖尤其会扰 ...
科学家发现宇宙中可能存在第五种力，能否动摇爱因斯坦相对论

网罗天下奇闻,与您一起分享,大家好,我们又见面啦.我们身边每天都会发生各种各样的奇闻怪事,不管是人或者事,都让我们感到不可思议,也希望这些事情可以给你带来一些酸甜苦辣,让正能量一直传递下去! 早在17 ...
罗大伦：从医三十年，发现古方中补气血第一良方—玉灵膏

生活中,很多朋友会发现自己脸色差,口唇颜色淡,面色萎黄或苍白无血色.平时特别懒,总是自觉疲惫,严重时甚至感觉连和别人说话的力气都没有.经常待着不动也出虚汗,偶感心慌心悸,上个楼梯都汗出喘气,女生还常常 ...

发现机器学习中的未知未知数

什么是机器学习“弱点”？

CATS4ML数据挑战的第一版：打开图像数据集

参与

相关推荐