AI模型预先部署的可靠性检测

孤菱 • 2025年08月26日 08:03 • 作者专栏 • 阅读 3

基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。但是，作...

基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。

但是，作为ChatGPT和DALL-E等强大人工智能工具的支柱，这些模型可能会提供不正确或误导性的信息。在安全关键的情况下，比如行人接近自动驾驶汽车，这些错误可能会造成严重后果。

为了防止此类错误，麻省理工学院和麻省理工学院- ibm沃森人工智能实验室的研究人员开发了一种技术，可以在将基础模型部署到特定任务之前评估其可靠性。

他们通过训练一组彼此略有不同的基础模型来做到这一点。然后，他们使用他们的算法来评估每个模型对相同测试数据点学习的表示的一致性。如果表示是一致的，就意味着模型是可靠的。

当他们将他们的技术与最先进的基线方法进行比较时，它在捕获各种分类任务的基础模型的可靠性方面表现得更好。

有人可以使用这种技术来决定一个模型是否应该应用于特定的环境，而不需要在现实世界的数据集上进行测试。当数据集可能由于隐私问题而无法访问时，例如在医疗保健环境中，这可能特别有用。此外，该技术可用于基于可靠性分数对模型进行排序，使用户能够为其任务选择最佳模型。

“所有模型都可能出错，但知道自己什么时候出错的模型更有用。对于这些基础模型来说，量化不确定性或可靠性的问题变得更加困难，因为它们的抽象表示难以比较。我们的方法可以让你量化表示模型对于任何给定输入数据的可靠性，”资深作者Navid Azizan说，他是麻省理工学院机械工程系和数据、系统和社会研究所(IDSS)的Esther和Harold E. Edgerton助理教授，也是信息和决策系统实验室(LIDS)的成员。

他与第一作者Young-Jin Park (LIDS研究生)一起撰写了一篇关于这项工作的论文;麻省理工学院- ibm沃森人工智能实验室的研究科学家王浩;以及Netflix的高级研究科学家谢尔文·阿德希尔。该论文将在人工智能不确定性会议上发表。

统计共识

传统的机器学习模型被训练来执行特定的任务。这些模型通常根据输入做出具体的预测。例如，模型可能会告诉你某张图片中是猫还是狗。在这种情况下，评估可靠性可能只是查看最终预测，看看模型是否正确。

但基金会的模式是不同的。该模型使用一般数据进行预训练，其创建者并不知道该模型将应用于的所有下游任务。用户在训练完成后就可以让它适应自己的特定任务。

与传统的机器学习模型不同，基础模型不会给出像“猫”或“狗”标签这样的具体输出。相反，它们基于输入数据点生成抽象表示。

为了评估基础模型的可靠性，研究人员使用了一种集成方法，通过训练几个模型，这些模型具有许多相同的特性，但彼此之间略有不同。

“我们的想法就像计算共识。如果所有这些基础模型对我们数据集中的任何数据都给出了一致的表示，那么我们可以说这个模型是可靠的，”Park说。

但他们遇到了一个问题:他们如何比较抽象的表示?

他补充说:“这些模型只是输出一个矢量，由一些数字组成，所以我们不能轻易地比较它们。”

他们用一种叫做邻域一致性的想法解决了这个问题。

对于他们的方法，研究人员准备了一组可靠的参考点来测试模型的集合。然后，对于每个模型，他们调查位于该模型表示的测试点附近的参考点。

通过观察相邻点的一致性，他们可以估计模型的可靠性。

对齐表示

基础模型在所谓的表示空间中映射数据点。我们可以把这个空间看成一个球体。每个模型都将相似的数据点映射到其球体的同一部分，因此猫的图像放在一个地方，狗的图像放在另一个地方。

但是每个模型会在自己的领域内绘制不同的动物地图，所以当猫可能被分组在一个球体的南极附近时，另一个模型可以在北半球的某个地方绘制猫的地图。

研究人员使用像锚一样的邻近点来对齐这些球体，这样它们就可以使表征具有可比性。如果一个数据点的邻居在多个表示中是一致的，那么应该对该点的模型输出的可靠性有信心。

当他们在大范围的分类任务中测试这种方法时，他们发现它比基线更加一致。另外，它不会因为挑战测试点而导致其他方法失败。

此外，他们的方法可用于评估任何输入数据的可靠性，因此人们可以评估模型对特定类型的个体(例如具有某些特征的患者)的效果如何。

王说:“即使所有型号的整体性能都是平均水平，从个人的角度来看，你也会更喜欢最适合自己的型号。”

然而，一个限制来自于它们必须训练一个大型基础模型的集合，这在计算上是昂贵的。在未来，他们计划找到更有效的方法来建立多个模型，也许是通过使用单个模型的小扰动。

这项工作部分由麻省理工学院- ibm沃森人工智能实验室、MathWorks和亚马逊资助。

本文来自作者[孤菱]投稿，不代表ueqvr号立场，如若转载，请注明出处：https://wap.ueqvr.cn/zlan/202508-6254.html

3 4

本文作者

孤菱签约作者

0 文章

0 评论

1 粉丝

我是ueqvr号的签约作者[孤菱],本篇文章《AI模型预先部署的可靠性检测》主要讲述了:基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。但是，作...

知识科普

班克曼-弗里德审判：加密货币监管的重大挑战

　　路透社纽约9月29日电——山姆·班克曼-弗里德(SamBankman-Fried)面临的欺诈指控审判，成为曼哈顿联邦检察官达米安·威廉姆斯(DamianWilliams)领导的打击白领犯罪行动的重要考验。威廉姆斯自2021年底担任纽约南区联邦检察官以来，表

本轩
2025年07月06日
11
常识大全

生活成本上升与游戏行业波动对索尼PlayStation 5 Pro发布的影响

　　2020年11月下旬，我是那些排队的人之一——或者更确切地说，刷新我的浏览器——希望在补充库存时能买到一台PlayStation5。当时疫情正如火如荼地蔓延，世界上大部分地区都被锁在室内，没有什么比这更好的事情可做了。最初的PS5承诺以非常流畅的帧率提供真正的4K游戏——尽管它支持8

寄文
2025年07月10日
12
经验分享

新南威尔士州塑料管理方案说明会

　　为企业提供免费信息今年早些时候，新南威尔士州环保局听取了对新南威尔士州塑料：下一步问题文件的反馈，该文件有助于为新南威尔士州塑料污染拟议行动的发展提供信息。现在已经开发了新南威尔士州塑料：前进之路。新南威尔士州政府现在发布了《新南威尔士州塑料：

梦偌
2025年07月27日
11
作者专栏

坚定回归，期待“重启未来”

最新一季《舞动奇迹》的女主持人表示，她希望该节目能从最近的争议中“走出来”，回归电视屏幕。“我并不是说一旦这部剧播出，所有人都会忘记它，”《魔法世界》的联合创始人兼第一任执行制片人凯伦·史密斯在接受BBC新闻采访时表示。“但希望人们能恢复过来，继续前进，

危沛凝
2025年08月14日
12
常识大全

尹若宁与Nasa Hataoka在LPGA赛季收官战中并列领跑

佛罗里达州那不勒斯。(美联社)——在周四的CME集团巡回锦标赛上，尹若宁在练习场的击球非常糟糕，以至于她对自己的表现并不抱太大期望。最大的惊喜是63杆低于标准杆9杆，与NasaHataoka共同争夺200万美元奖金。尹秀珍开局8洞打出5只小鸟，无柏忌，最后在第1

落花倾城
2025年08月16日
13
生活百科

今日热议“捕鱼透视血条”详细开挂玩法

捕鱼透视血条是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可以生成出手机打牌

怜露
2025年08月17日
11
生活百科

科技通报“微信十三水怎么开挂”太坑人了,真的有挂

您好：微信十三水怎么开挂这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【

南云
2025年08月17日
13
生活百科

科技通报“牛气冲天软件有挂吗？”(其实有挂)

牛气冲天软件有挂吗?是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可以生成出

寒兰
2025年08月21日
9
经验分享

重大来袭“微乐小程序怎么开挂辅助”附开挂脚本详细

家们！今天小编来为大家解答微乐小程序怎么开挂辅助这个问题咨询软件客服徽信的挂在哪里买很多人还不知道，现在让我们一起来看看吧！一、记牌器怎么全显示你需要获得记牌器才能全部显示，否则只显示前面几张牌的数据。如下图所示：获取开挂的软件方法如下：可以

浮生梦
2025年08月23日
9
常识大全

玩家点评“麻将群挂怎么买”附开挂脚本详细步骤

亲，麻将群挂怎么买这款游戏原来确实可以开挂，详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明，就是全场，公司软件防封号、防检测、正版软件、非诚勿扰。2022首推。全网独家，诚信可靠，无效果全额退款，本司推出的多功能作弊辅助软件。

尔琴
2025年08月24日
9

发表回复

本站作者后才能评论

评论列表（4条）

孤菱 2025年08月26日

我是ueqvr号的签约作者“孤菱”！

回复
孤菱 2025年08月26日

希望本篇文章《AI模型预先部署的可靠性检测》能对你有所帮助！

回复
孤菱 2025年08月26日

本站[ueqvr号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
孤菱 2025年08月26日

本文概览：基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。但是，作...

回复

AI模型预先部署的可靠性检测

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们