大模型时代下的数字安全答案，藏在一本实战指南里

作者：郭思

2024/01/24 11:13

大模型时代下的数字安全答案，藏在一本实战指南里

作者：郭思

编辑：陈彩娴

在大模型不断成熟的背景下，企业也日益倾向于在云端大规模应用AI技术。这一进程中，以往可能忽视的数据资源，突显出了前所未有的战略意义，数据的价值评估随之动态调整。与此同时，企业上云后，其安全架构与业务运作模式同步转型升级，由此衍生出一系列全新的安全需求。

犹如“健康乃一切之本”的生活哲学，对于企业而言，数字安全同样扮演着基石角色——无安全，则万业皆空。构建强大的数字安全免疫系统并非临时起意，而是企业长远发展的必要工程。

1月17日，由工业和信息化部新闻宣传中心（人民邮电报社）指导，腾讯安全、腾讯研究院、中国信息安全联合三十余位业内专家、学者、企业领袖共同编制的《数字安全免疫力建设指南》正式发布。

大模型时代下的数字安全答案，藏在一本实战指南里

正如最高决策层所指出：“安全是发展的前提，发展是安全的保障”。鉴于大模型等先进技术在企业运营中的普及应用，腾讯安全提出“数字安全免疫力”框架，致力于为企业构建一套立足于数据与业务双核心、兼顾安全与发展策略的整合型理论与工具平台。

在本次行业研讨会上最新出炉的《数字安全免疫力建设指南》，便是这一框架在实践层面的具体实施工具，如同探险者手中的导航图，帮助企业穿越复杂多变的数字安全丛林，确保前进道路明晰，有效抵御各种安全风险。

AIGC背景下的数据安全新挑战

随着数字化进程在全球范围内以前所未有的速度推进，各行各业都在享受着信息技术带来的便利与效率提升，但同时也面临着日趋严峻的安全隐患和挑战。

数字化的快速发展不仅极大地拓展了数据的疆界，使得海量信息在网络空间中高速流转，而且为潜在的恶意攻击者提供了更多的切入点和隐蔽途径，这无疑对企业现有的安全防护机制构成了巨大的压力。

传统的安全建设思路主要依赖于物理边界的“严防死守”和对已知安全事件的事后响应机制。

然而，在企业资产快速数字化的阶段，边界的概念正在淡化与模糊。这种静态的、基于边界防护的方法，已经不能有效应对组织内部的信息泄露和外部发起的复杂攻击。黑客通过高级持续性威胁（APT）等方式，能够绕过传统防火墙，潜入企业网络核心区域，窃取敏感信息或者破坏关键业务流程。

无论是2017年爆发的NotPetya勒索软件事件以及2020年爆发的SolarWinds供应链攻击事件都是基于APT手段影响力非常之大的攻击事件，2021年，针对Microsoft Exchange Server的零日漏洞攻击更是震动全球，影响了至少十个国家的数千家机构。

如今，随着AIGC技术的演进，数字安全更是面临着非常多动态、未知的威胁。首先，数据规模空前庞大，暴力美学般的数据投喂模式，本身就构成了巨大的审核难题；其次，随着AI处理内容的复杂性不断提升，在模型搭建环节，不仅需要对基础特征进行精细化标注，而且对于生成文本的连贯性、逻辑合理性和整体一致性有了前所未有的高标准要求。

在内容创作应用阶段，先进的AI技术加速了各类违规内容的滋生，比如深度伪造产物、虚假新闻、违背伦理道德的素材，尤其是数据泄露事故发生的频次正急剧增长。

与此同时，AI驱动的问答系统能生成高度专业化的文本内容，这进一步扩大了传统内容风控的范畴，使得现有风控机制面临严峻考验，亟需扩展应对能力以覆盖这些新兴的风险领域。

此前，Cyberhaven 就曾针对160万名员工使用ChatGPT的情况进行了统计分析，结果显示有3.1%的员工选择将企业内部数据直接输入ChatGPT以提升工作效率或寻求解决方案。在此背景下，曾发生过一起典型事件：三星公司的员工因试图借助ChatGPT提高工作效能，不慎将包含敏感代码资料与内部会议详情的信息提交给了该AI模型，在短短几周内即导致了三起机密数据泄露事故。

另一方面，在业内人士看来，不同规模、行业、数字化程度企业遭遇的个性化安全挑战不一而同，同时伴随着外部威胁和市场环境的快速变化，能动态掌握自身的安全水位的数字安全免疫力成为了重中之重。

数字安全免疫力引发的讨论：以AI之矛攻AI之盾

在AIGC迅速席卷市场的同时，接踵而至的数据安全问题引发了公众的深切关注。除了我们所提及的AIGC 技术被恶意用来进行安全攻击外。

还有另一个维度的问题也很自然地引发了大众的思考，AIGC技术能否用于安全防护？在研讨《数字安全免疫力建设指南》过程中，多位专家对AIGC引发的安全攻防变革做了深度思考。

东华软件集团高级副总裁、东华云计算有限公司董事长兼CEO 郭浩哲指出，业界无法坐等大模型发展至全球普及时才采取行动。相反，在这一转型初期，就应该积极地将业务系统的构建与大模型技术紧密结合。尽管在此过程中可能出现的安全隐患与漏洞监管是一项不容忽视的挑战，但关键在于勇于实践和探索。需要有漏洞监管，这是另外一个问题，关键是要去做。

这也预示着未来摆在行业面前的其实只有做与不做两种抉择。而企业如果选择了全力以赴，其所面临的困难其实也可想而知。

AIGC在攻防层面及其在广义开放性网络安全的应用，由于其极高的开放性特点，导致其在策略指向性上的表现相对较弱。不论是传统AI技术还是大模型，目前在精确度和训练优化方面尚存在一定的不成熟之处。

这意味着，在较窄领域的数据安全方面，由于攻防对抗具有高度不确定性，如攻击来源、目标、行为和特征均未知，大模型在此类开放性攻防场景下应用颇具挑战。

攻击来源的不确定性意味着攻击者可能来自任何一个角落：可能是内部员工的意外操作、可能是外部黑客的蓄意袭击，甚至可能是国家级的APT（高级持续性威胁）行动。由于攻击者可能采取各种方法隐藏真实身份和位置，追踪和预防变得异常艰难。

另一方面，攻击者可能针对不同的数据类型、不同的系统组件或不同的业务流程发起攻击，这使得防护措施难以面面俱到，大模型在预测和防范未知目标时可能存在盲区。

此外，攻击行为的多样性与复杂性也是挑战之一。攻击者可能采取多种新颖且难以识别的攻击手段，如零日漏洞利用、社会工程学攻击等，这些手段在大模型尚未接触到的样本集中并无体现，因此难以通过历史数据训练出精准的防御策略。

攻击特征的未知性则意味着即便是最先进的大模型，也无法完全预见所有可能的攻击模式。尤其是在数据安全领域，许多攻击手法和漏洞利用都是首次出现，传统的特征匹配方法难以奏效，大模型需要具备更强的学习能力和泛化性能才能适应这种不断变化的威胁环境。

尽管大模型在特定情境下展现出了卓越的性能，但在面对高度动态且充满不确定性的攻防对抗环境时，仍需持续研发与优化，以期更好地结合专家智慧、实时威胁情报及高效异常检测机制，这样才能有效地破解一系列安全挑战，充分释放大模型在数据安全领域的潜能。

不过在研讨会现场，现任腾讯云安全总经理李滨也指出，在数据安全应用场景中，当访问主体、客体及行为规律具备足够的可理解性和预见性时，会为大模型技术的落地应用创造极其有利的前提。目前，腾讯已经在这一领域取得实质性的突破，利用大模型对数据进行细致的分类与分级优化工作，特别是在语义识别维度上，显著提升了分类准确率。这项已经趋于成熟的技术已被成功地整合进腾讯的产品安全服务体系，有力推动了数据安全保障能力的进步与发展。

针对数据安全与数据流通性之间的平衡问题，传统的应对策略通常依赖于插装技术配合大规模标签库进行数据对比，但这无疑加重了系统的负荷。相较之下，腾讯通过运用大模型对数据语义属性进行深度解析，成功实现了近实时的无需标签、无需插件的数据关系抽取，极大地提升了数据安全保障工作的效能。

在聚焦于有限可控范围内的数据安全事件分析时，由于数据领域中的合法主体与客体相对明确，腾讯通过融合多元技术手段，在该特定范围内实现了数据安全分析准确度的大幅跃升。

大模型时代下的数字安全答案，藏在一本实战指南里

在数据安全方面，数字安全免疫力建设指南提出数据分类、分级是数据安全建设的关键。同时要建立数据安全防护基线、建立统一化运营体系；业务安全方面，指南提出缺乏安全能力护航的业务可能成为黑灰产的“提款机”，人机识别、风控引擎、内容安全、业务安全合规等是必要的投入。

结语

在数据安全领域，尽管大模型的应用正在带来显著效果，但在高度不确定的攻防对抗场景中，依然需要不断深化研发与优化，结合专家知识、实时威胁情报以及高效的异常检测机制，以应对新的安全挑战，最大化挖掘大模型在数据安全领域的潜力。

《数字安全免疫力建设指南》就好比医生为病人定制了一套健康保养计划。这套体系鼓励企业构建起一个能自动侦测、快速抵抗和从攻击中恢复的“数字护盾”。一旦遇到内外部的“数字病菌”（即安全威胁），企业就能如同人体免疫系统般，迅速作出反应，不仅能及时修复损害，还能从中吸取教训，不断提升自身的安全防御力，确保企业在数字化旅程中稳步前行，健康壮大。

风会熄灭蜡烛，却能使火越烧越旺。对随机性、不确定性和混沌也是一样：要利用它们，而不是躲避它们。要成为火，渴望得到风的吹拂，大模型技术带给数据安全防护的除了效率极大提升之外，更多的是对未知风险的不确定性，在这个交汇点上，腾讯以其独特的方法论和工具集，带给了行业一个绝佳启示，无论是人还是企业遇到危险，真正的安全从本质上而言，其实是自己拥有的自发免疫力，面对不确定性，人人皆害怕，但从不确定性中获益，或许才是腾讯安全的真正的竞争力。

雷峰网雷峰网(公众号：雷峰网) 雷峰网