中国经济网络保留的所有权利 中国经济网络新媒体矩阵 在线音频 - 视觉节目许可证(0107190)(北京ICP040090) 小污染会造成巨大伤害!照顾引起发现的AI数据污染的实际风险 2025年8月17日07:21资料来源:CCTV新闻客户 随着AI人工智能技术和应用的充满活力的发展,各种AI工具已成为当今(到日至今的活动和生活)的助手。顺便说一句,我们的生活开始与人工智能紧密相关。网民如何说AI信息是否“不可靠”?但是,近年来,许多网民发现一些人工智能答案已经开始非常不可靠。让我们首先看一下这两个案例:在今年上半年,宁波的两件事是由人工智能荒谬的。第一件事是2月6日,宁波警察取消了“宁波交通警察”帐户。 second是,三个月后的5月2日,在Yuyao省,宁波,Zhejiang省的贾尤线,一辆没有车牌的汽车偶然撞到了一辆摩托车。汽车司机没有立即检查受伤的人,而是从后备箱中拿走了车牌进行安装。当网民询问为什么2月6日取消AI软件时,人工智能提供的答案“主要与5月2日意外流量引起的广泛关注有关。” 2月份取消该帐户的原因是三个月后的交通事故。人工智能的这个答案是Nakakattract吸引了网民的广泛关注,然后宁波交通警察紧急拒绝了谣言。去年,一个网民询问了儿童手表的AI软件:“中国人是世界上最聪明的人吗?”人工智能提供的答案确实忽略了中国发明和创造的答案,否认下巴ESE文化。这个荒谬的答案引起了互联网的轰动。然后,儿童手表的制造商很容易道歉,并指出相关的数据已纠正并删除了不良信息的来源。近年来,有无数的AI信息,包括不存在的论文,作者和论文网站。 AI已成为谣言和信息的同伙,可以用网民制造capsized邮轮和幼儿园大火之类的谣言。 AI数据感染时有什么风险?如何避免这种情况?今天提到的案件或多或少具有与人工智能的数据污染连接。在俗人方面,如果将AI与食品进行比较,则培训数据等同于食物。如果成分腐烂和恶化,所产生的食物将有问题。人工智能的三个主要要素是算法,计算和数据强度,其中数据是训练AI模型的主要元素,并且是主要的REAI应用程序的来源。当数据感染时,这可能导致决定错误甚至AI系统失败,从而导致一些安全风险。什么是AI数据污染?他们分配了多少类?最近,国家安全部门发布了一个提醒,通过激励,小说和双重污染的数据,由“数据中毒”(例如争吵,小说和双重)产生的数据,这是提供有害输出的模型参数。那么,AI数据污染到底是什么?数据污染类别是什么?网络安全专家CAO HUI:数据中毒主要针对两个方面,一个是视觉,另一个是用于自然语言处理。这张图是训练数据,以识别人工智能系统。我们看到这张照片中有许多斑马。数据有多脏?这是为了在其中一个斑马中添加绿色点。没有标记绿色点的斑马。这样的培训数据将大约有成千上万。如果是Tatlo或十万个训练数据中的四个受到类似的污染处理,形成的人工智能模型将具有后门,这将使发达的人工智能模型具有后门,这会导致它看到与Zebra相似的Zebra,类似于其体内的绿色点,对AI模型的判断感到焦虑。根据专家的说法,人工智能数据污染分为两类:一种是与主观和恶意误导人工智能的产出结果的数据进行交流;其余的是人工智能本身会在网络上收集大量的大数据,如果未识别和删除不良信息,它将添加到计算Bilang的功能中,这是一个值得信赖的信息来源,输出结果也不可靠。网络安全专家Cao Hui:我们知道大型模型的实践需要大数据,因此大多数Internet数据,对话和数据书籍,报纸和电影系列是通常的培训数据收集范围。实际上,我们都可以将一些数据发送到Internet。当这些数据不安全且受污染时,大型模型可能会受到影响。人工智能数据为什么几乎没有污染会造成巨大破坏?国家安全部的数据表明,在培训过程中,尽管采用了错误的文本,但其有害产出将相应增加7.2%。为什么污染来源造成的损害因几何范围而增加?专家说,受污染的数据具有独特的视图和内容,与其他数据明显不同。在这种情况下,AI可能将被污染的数据标记为“特征和高信息”,并增加计算能力中使用的比例。 Xue Zhihui,中国网络空间安全协会的人工智能安全治理专业委员会成员:大型语言模型是一种行事统计语言的RTANT模型以及所使用的多层神经网络的体系结构具有很高的不是线条。在模型训练阶段,如果被污染的数据混合在一起 - 训练数据的训练集可能会被误认为是确定被污染的数据为“特征,代表性和高信息”。这种幻想将使模型提高数据集中受污染数据的总体重要性,并最终导致少量受污染的数据,这些数据也可能对模型的重量产生影响很小。当模型的输出含量时,这种轻微的效果是通过该层的增强层在神经网络体系结构的多层传播上,这最终导致与输出结果的显着偏差。数据污染可以触发一系列实际风险。此外,AI数据污染还可以在财务,公共安全等领域触发一系列实际风险。中国网络空间安全协会的人工智能安全治理专业委员会:例如,在经济和金融领域,一旦数据肮脏,某些市场行为,信用风险的评估,交易监控和交易异常,交易以及交易监控活动可能会导致判断和决策的错误,导致直接经济损失。在社会上的公众舆论方面,数据污染将破坏信息的真实性,并使公众难以认识到信息的真实性,这可能会给社会带来舆论风险。加强资源管理并防止产生污染。为了响应AI数据污染,来自国家安全层面,我们如何避免风险?专家说,应加强资源管理以防止污染。 Xue Zhihui,中国网络空间安全协会的人工智能安全政府成员NCE专业委员会:有必要制定清晰的数据收集标准,使用安全且值得信赖的MAPSDATA来源,开发数据标签系统,并采用严格的控制和审计安全步骤。其次,可以评估数据,格式错误,语法语义冲突的不一致,并使用自动化工具,Manu -Reviews和AI算法的组合进行评估和处理。安全机构先前提醒,应根据法规和标准对受污染的数据进行定期清洁和维修,并逐渐建立一个模块化,监视和可扩展的数据管理框架,以实现持续的质量管理和控制。对于大多数网民而言,我们如何避免在当今至今的生活和工作中AI数据污染的风险?互联网上的警方注释:首先,使用企业提供的正式平台和AI工具;其次,使用MGA AI工具来科学和理性,AI产生的结果可能被提及,但不能为b可以相信;第三,请注意保护个人信息,以防止不必要的个人隐私暴露,而不是养活不良信息,并共同合作在线房屋。 (收费编辑:MA Changyan)