当前 AI(人工智能)正炙手可热。每天都有新的软件即服务(SaaS)AI 程序问世,企业也纷纷采用新的 AI 解决方案,个人消费者则利用 AI 来解决从作业辅导到制定饮食计划等各个方面的问题。
然而,AI 看似功能强大,但它也给个人、企业和数据中心带来了诸多安全问题。你可能听说过一些无良开发者利用窃取的用户数据训练 AI 的故事,或者 AI 算法抓取个人图片和私人对话的情况。此外,员工在请 AI 模型校对电子邮件、修复代码错误或分析文档时,也常常不小心泄露公司机密,这已成为常态。
由于这些安全漏洞频繁曝光且性质恶劣,人们对此类问题的认识有所提高。然而,很多人并未意识到 AI 对数据中心构成的威胁。
如果你的数据中心为客户运行 AI 应用程序、使用机器学习算法分析数据,或在任何战略、规划或管理环节中使用 AI,那么它就可能成为运营风险的目标。AI 数据中心的安全风险不胜枚举,但以下六个是较为常见的风险点。
1. 数据投毒
无论 AI 算法多么强大或复杂,无论在其开发上投入了多少资金和研究,AI 模型的好坏完全取决于它所接收的数据。换句话说,即使开发出了非常复杂且直观的算法,但如果提供给它的数据有误,该算法也会产生错误的结果。
有时,这些“不良”数据集是意外造成的。如果大型语言模型从不准确的源头(如人们坚信地球是平的互联网论坛)抓取数据,它将反复吸收这些错误知识,直到算法认为它们是事实。
然而,不良数据集往往是蓄意数据投毒攻击的结果。数据投毒发生在恶意行为者用带有偏见、误导性或故意不诚实的信息污染数据时,目的是训练 AI 模型向可能毫不知情的用户返回这些错误的“事实”。
攻击者会向 AI 算法引入大量证据来证明地球是平的,而使用该 AI 获取结果的用户可能无法辨别真伪。他们会阅读 AI 关于地球为什么是平的的解释,然后接受这些信息,并将其纳入自己的信仰体系,然后向他人重复。因此,数据投毒可能是一种非常微妙且危险的破坏手段。
这个例子很简单,但数据投毒往往非常复杂且难以检测。有时,除了向算法提供不良数据外,攻击者还会教 AI 模型改变其分析信息和做出决策的方式。无论攻击者使用其中一种还是两种方法,结果都是相同的:输出被歪曲、篡改甚至完全伪造。
数据投毒攻击可能产生毁灭性的后果。数据投毒攻击代价高昂,需要修复被污染的数据并显著提高网络安全水平。此外,一旦消费者的信任被破坏,往往很难或无法恢复。一次成功的数据投毒攻击就可能严重损害组织的声誉,使其永远无法恢复。最后,组织通常有必要在问题解决之前完全停止运营,这可能意味着数天、数周或数月的收入损失以及客户的永久流失。
2. 基础设施漏洞
AI 系统建立在三种类型的基础设施之上。
第一层是基础设施层。这包括硬件、在该硬件上运行的软件以及任何与原生软件相邻或在其内部运行的云计算服务。第二层是模型层,通常包括一般、特定和高度本地的 AI 模型。这一层负责 AI 的“思考”过程。第三层是应用层。这一层帮助人类以双方都能理解的方式与 AI 模型进行交互。应用程序为人类与计算机算法之间的沟通提供界面,反之亦然。
没有这三层,AI 模型就无法构建、训练或部署。每一层基础设施都有其独特的安全漏洞。
基础层容易受到人们可能在家庭计算机系统上看到的相同类型的攻击,但规模要大得多。数据泄露就是此类问题之一。模型层容易受到黑客入侵并窃取代码、敏感数据或对整个 AI 模型的攻击。攻击者还可能修改该层上的模型,以改变其计算数据的方式或破坏其决策过程。最后一层的应用程序容易受到旨在恶意利用系统的攻击。例如,攻击者可能会试图操纵 AI 提示用户输入的方式,从而引发各种问题。
3. 数据泄露
与数据投毒相反,数据泄露是指攻击者试图将数据集中的不良信息注入其中。与试图添加数据不同,数据泄露的攻击者通常试图访问并窃取敏感信息以供自己使用。
攻击者成功窃取数据后的行为可能各不相同。身份欺诈和金融盗窃是常见的行为。个人和敏感数据可能会被用于企业或名人的勒索和敲诈。最复杂的团队可能会利用这些数据来构建成功 AI 模型的复制品。
与数据投毒一样,数据泄露也会给组织带来毁灭性的打击。AI 客户会失去信任,组织必须实施昂贵的网络安全措施,并且在加强安全性的同时停止运营。
4. 操控结果
恶意行为者有多种方式可以操控 AI 的输出结果。数据投毒是一个主要例子,但它并不是常用的唯一方法。
有时,黑客所需要做的仅仅是识别出某个特定算法处理数据方式中的弱点,并多次利用这一漏洞。向算法中添加足够多的操控数据,最终 AI 将开始输出不准确的结果。
然而,恶意攻击者并非总是存在的。随着 AI 的普及,当前的模型经常将虚假信息作为事实输出,或编造出违背现实的声明。
这些错误的发生可能是由于 AI 模型开发中的不一致性或缺陷。例如,当 AI 系统更加关注于获取奖励而不是提供有用的信息时,它就会“学习”到可以通过操控系统来获得奖励,而无需真正回答用户的问题或执行用户要求的任务。
在其他情况下, AI 模型会根据用户输入的微妙线索进行解释,并对本应具有相似答案的问题生成截然不同的答案。一个特别典型的例子是,用户询问是什么让 AI 系统容易受到攻击(可能是出于实施更强大的网络安全系统的良好意图),却收到了关于如何黑入 AI 系统的分步指南。
5. 资源过载
许多数据中心都面临的一个问题是 AI 应用所带来的巨大资源消耗——AI 消耗大量电力和计算能力。数据中心必须不断确保冷却系统能够应对保持硬件最佳运行并避免中断和停机时间的巨大挑战。
6. 法律和监管合规问题
由于 AI 算法处理大量数据——包括个人数据、企业数据,有时甚至包括机密数据,因此,法律和监管机构对计划使用 AI 的数据中心实施了严格的合规要求。
不遵守这些要求的处罚通常包括巨额罚款、声誉损害,有时甚至会导致服务中断。
数据中心应该如何降低这些风险?
以下是一些关键方法:
优先保障网络安全。实施数据加密、访问控制、网络升级,以及对算法和数据集的持续监控。
规划可扩展性。随着 AI 应用的增加,电力、冷却和安全需求将呈滚雪球式增长。
了解并遵守道德和法律指导原则。如果数据中心在法律规定内运营,并坚持用户数据的既定道德使用原则,那么它们就可以避免许多法律问题。
虽然数据中心管理者无法为每一个可能的运营风险制定计划,但细致的规划可以应对最常见的问题。