自疫情以来,全球数字经济迎来爆发式增长机遇。数字经济成为促进中国经济发展的关键力量,数据也成为我国第五大生产要素。
在大力推进数字经济建设的背景下,我们究竟该如何平衡隐私安全监管和数据产业发展之间的关系?在这个问题上,隐私计算正被政策界、产业界、投资界寄予厚望。
实际上,已经有不少互联网平台因数据安全和隐私泄露问题频频上话题热搜。各国政府对隐私和数据安全问题越来越重视。
在经历了2019年技术普及和市场教育、2020年大规模概念验证和试点部署阶段,2021年隐私计算尝试进入规模化应用阶段。
此前,IT咨询与研究机构Gartner更是将隐私增强技术列为2021年9项重要的战略科技趋势之一。据其分析,限于分析能力、隐私安全性等原因,大约有97%的数据尚未被利用起来;到2025年,将有一半的大型企业机构使用隐私计算在不受信任的环境和多方数据分析用例中处理数据。
2021年即将接近尾声,随着《数据安全法》和《个人信息保护法》的相继落地,这个因监管而生又迎政策红利的技术,这一年来发展状况如何?未来发展趋势怎样?这一技术又如何帮助企业应对法律对于数据安全和隐私保护合规挑战?
雷峰网(公众号:雷峰网)作为国内前沿的科技媒体,持续关注“智能与未来”,对全球前沿的技术和趋势进行深入观察和调研。因此关于数据安全与隐私计算技术对于行业、领域以及社会发展所带来的影响,也是我们所关注的和报道的,从而希望能够引起社会各界的思考。
2021·年12月9日至10日,由粤港澳大湾区人工智能与机器人联合会、雷峰网联合主办,深圳市人工智能与机器人研究院、深圳市机器人协会、深圳市人工智能学会支持的第六届GAIR全球人工智能与机器人大会,成功举办。
其中《数据安全与隐私计算》分论坛,作为今年新增分论坛也备受瞩目。本次论坛以《直面数据安全风险和挑战;挖掘隐私计算的100%可为》为主题,共话数据安全和隐私计算的当下与未来。会议现场我们邀请到了七位演讲嘉宾和六位圆桌论坛嘉宾畅所欲言。
信通院云大所副所长 魏凯;
加拿大工程院院士、加拿大皇家科学院院士、微众银行首席人工智能官 杨强;
小米集团副总裁、安全与隐私委员会主席、集团技术委员会主席 崔宝秋;
腾讯云安全总经理 李滨;
中国电信联邦学习发起人、研究院终端技术与标准研究员 潘碧莹;
瑞莱智慧RealA首席架构师 徐世真
同盾科技合伙人兼人工智能研究院院长,中科院医学所首席教授 李晓林;
论坛最后,信工所研究员、博导、信息安全国家重点实验室副主任侯锐作为主持人与星云CTO张骏雪;洞见科技创始人、董事长姚明;上海富数科技有限公司智能决策分析部负责人吴海斌;瑞莱智慧RealAI首席架构师徐世真;基石资本、天使基金合伙人黄依群;沸点资本董事总经理马兰从创业公司、学术、以及投资人三种不同的角度就数据安全和隐私计算这一话题展开激烈讨论,不同嘉宾的观点碰撞,以及深入浅出的分析,令人眼界大开、思维震荡!
以下是本次大会精彩回顾:
一、魏凯:数据流通的从1.0阶段到3.0阶段,隐私计算技术是关键
会议现场,信通院云大所副所长魏凯发表了《隐私计算发展现状与趋势》的主题演讲,
首先分享了数据流通从1.0时代到3.0时代,隐私计算技术发挥的重要的支撑作用,和国内外发展概况;其次从隐私计算解决了什么问题、隐私计算产品的成熟度、可用性、安全性评判、隐私计算的使用与合规以及隐私计算发展趋势进行了深入分析;最后点出了隐私计算面临的三大问题,以及信通院为推动隐私计算更好的应用从政策研究、标准制定、成立了隐私计算联盟等进行的实践。
随着国家数据战略的深化推进,大数据本身的基础设施建设和数据资源的建设,在赋能数字经济的作用价值被人们所看到。如何保障数据在不同主体之间安全可信的共享,隐私计算成为关键技术。
魏凯表示:“数据流通在1.0阶段蕴含了很多的风险,裸数据交付较多,一旦流通出去安全风险不可预估。如今数据流通模式发生改变,隐私计算让数据变成融合后的结果,因此升级进入了数据流通的3.0阶段。”
我们之所以能够跨越到数据流通的3.0阶段,很重要的一个技术前提就是隐私计算这一类技术的支撑。他认为,“虽然隐私计算改变了数据交互与融合的模式,提出了一种新的形态,保障了从数据源、数据传输渠道、数据汇聚通道和使用方等数据流通环节的安全。但实际上没有办法解决数据在流通之前和之后的权属争议,因此也不能成为一种豁免法律义务的挡箭牌,这是毫无疑问的。”
隐私计算产品的成熟度、可用性,也是我们所关注的。考察隐私计算产品的技术水平应该从综合的角度来去评判,包括性能、安全性和准确程度,这三者缺一不可。
“隐私计算的使用和合规不能划等号”。首先,法律法规不会对技术的应用做非常确切的判断,无论是隐私计算技术还是人工智能技术的使用,法律上不会从条文上判断使用是否合法,从合法性给出确切的定义。法律只看是否侵犯相关的利益。因此在实践中要趋近于法律的最小化原则,除了技术之外还要考虑商业模式是否合规、数据来源以及授权是否合法、数据使用的目的是否正当等问题。我们要持续性的看待技术的演进和法律合规落地之间的关系。
最后魏凯指出,目前隐私计算这类产品还面临安全性挑战、性能的瓶颈、互联互通三座大山。未来隐私计算发展趋势会是外部的互联互通和内部融合的发展方向。类似与云计算、大数据平台、数据库、区块链、AI等技术融合发展,平台产品间互联互通,打破隐私计算孤岛。
二、杨强:人工智能建设离不开数据,联邦学习让数据发挥价值
加拿大工程院院士、加拿大皇家科学院院士,微众银行首席人工智能官杨强,带来了主题为《数据要素与联邦学习》的演讲。
他以“人工智能离不开数据”引入,指明人工智能模型的建设需要数据,但是数据维度、样本数都非常少、数据所属和来源各不相同以及数据安全合规越来越严,因此亟需一个更强的工程和科学发展来应对这种需求,因此提出了联邦学习。联邦学习可以让数据可用而不可见。
他表示从时间上来看隐私计算基本经历了四个发展阶段:安全多方计算(MPC)、差分隐私(DP)、集中加密计算(TEE)、联邦学习(FL)。其实在数据可用而不可见的范畴内,我们可以用各种各样的技术手段来解决问题,进而随着技术不断发展,形成大数据流通和隐私计算的行业生态。
而联邦学习的方法是让“数据不动、模型动”,模型参数加密以不暴露原始数据和各方模型。杨强还介绍了横向联邦学习和纵向联邦学习带来的作用。其中有一个典型的场景:“互联网公司可以提供用户画像的信息,但它却没有银行风险控制的信息。银行有用户借款的信息以及逾期率,但却不知道用户平时上网的行为、看视频的喜好等等。如果能把两种信息聚合起来,那么风险模型就会更靠谱,坏账率也会变低,这就是纵向联邦学习的作用。”
据介绍联邦学习目前国内国外也都在建立相关标准,国内杨强团队领导IEEE建立全球首个联邦学习标准,同时也做了世界上第一个开源平台FATE,贡献给Linux Foundation,联邦学习还被纳入Gartner技术成熟度曲线,成为下一代隐私计算发展的关键。
此外联邦学习还可以应用在人工智能模型上一是语音识别,二是图像识别。具体来看主要有装备制造业、物联网AIoT、智慧安防等行业还有智能推荐、银行反洗钱、企业之间大数据合作、医疗健康、无人车、风控、等领域。
杨强表示:“微众银行FATE软件除了开源版还有商业版,可以应用于营销、保险、企业服务、物联网、智慧城市、KYC(安全保障)、投资理财等。大家可以放心的加入到生态中,让数据发挥价值。”
三、崔宝秋,安全隐私为美好生活保驾护航
随后,小米集团副总裁、安全与隐私委员会主席崔宝秋,发表了主题为《“手机x AIoT”隐私保护技术》的演讲。他分享了小米在信息安全和隐私保护领域所做的工作和发展历程,带来了小米的安全隐私实践。
“作为一家互联网公司,如果没有自己的信息安全团队,那么就像裸奔。”崔宝秋在2012年加入小米,就主推成立小米信息安全与隐私保护委员会。后来2016年小米的MIUI操作系统拿到了TRUSTe的隐私认证,之后陆陆续续拿到了更多的隐私和安全认证,因此2018年GDPR正式生效,没有对小米产生影响。
他总结了小米的隐私合规体系,主要围绕组织保障与隐私意识、管理体系与流程、信息安全与隐私保护权威验证三大方面。并沉淀了五大隐私保护原则:分别是公开透明、用户可控、企业责任、安全保障和法律合规。
他认为:“虽然行业内认为安全和隐私三分靠技术,七分靠管理。但是今天应该反过来,三分靠管理,七分靠技术,甚至更多分的要靠技术。”
接下来他分享了小米在安全隐私领域做的事情。首先在顶层,小米有一个强大的组织架构的保障,一套成熟的隐私合规体系。其次是下层全部靠技术,包括手机的全链路安全隐私防护、IoT平台化的安全隐私保护技术,以及AI算法中的各种安全隐私应用。
其中小米手机团队基于开源技术自研了小米的可信执行环境MiTee,并在手机端广泛使用差分隐私技术,同时还有米家安全芯片等硬件安全方案以及软件安全方案,像MACE移动端深度学习框架,可以把用户的隐私数据留在端上,不传到云端。用实践证明了没有技术就没有小米的安全隐私保护能力。
最后,崔宝秋表示就安全与隐私来说,小米的使命是“安全隐私为美好生活保驾护航”。
四、李滨:“新时代”数据安全与隐私计算如何破局
新时代下,我们处于百年未有之大变局,对于数据安全和隐私保护的要求也有所不同。会议现场,腾讯云安全总经理李滨发表了题为《“新时代”数据安全与隐私计算的挑战和实践》的演讲。
他表示新时代下,我们面临新环境、新技术以及全新的产业时代。数据成为新的生产要素,数据安全和网络空间安全也成为制约企业发展的关键命题。
在过去几年,针对用户数据以及用户个人信息的攻击是愈演愈烈的。2018年左右全球公开数据泄露的总量在20多亿条,2019年达到50亿条,2020年已经超过了100亿条。今年前两个月,在国内公布的一例案件里,查获涉及我国公民的数据侵权达到56亿条。
李滨表示:“我国近年来在数据安全和隐私保护的监管和合规要求越来越严格,各项技术、标准、实践落地越来越清晰,今天面临的是“五法共治”的数据安全合规体系,包括原来的《网络安全法》,以及比较今年的《数据安全法》、《个人信息保护法》、《密码法》等等,都对今后的数据安全和个人信息保护提出了纲领性指引。”
他总结了数据安全的五大风险:
一是外部攻击威胁。包括黑客攻击,数据泄露事件,以及这几年愈演愈烈的勒索软件、挖矿等攻击事件,与日俱增;
二是内部安全风险。对于企业来说,拥有大量高价值的数据,因此要考虑内部控制和反舞弊风险,防止内部对数据的滥用、误用及窃取;
三是数据第三方风险。企业数据面临大量的交换、共享以及不可控的数据边界,比如端侧App等,这其实不属于企业业务本身所属的资产范围,但是在非受控的三方环境中怎样保证数据安全,也是比较大的挑战;
四是合规/治理风险。对于诸多设施、应用、服务,如何清晰地了解数据分布的全景图,制定合理的解决方案和治理策略,也是一个挑战;
五是供应链风险。在数据供应链以及软件供应链等方面都面临一定风险。
面对如此多的风险,在数据的产生/获取、传输、存储、使用的过程中,每一个环节都需要做安全防护,数据如何安全有效治理。李滨认为,“如此多的数据安全环节都需要安全防护,每个环节涉及的产品技术都有好几种,那么这个解决方案本身就是问题所在。因此我们在数据安全和隐私保护时不仅要强调过去的安全性还要注重高效率、高性能、可靠性以及经济性。”
最后他分享了腾讯的云原生数据安全实践,讲述了腾讯云在数据安全领域的实践和探索。
五、潘碧莹:AI隐私终端安全与实践
中国电信联邦学习发起人,研究院终端技术与标准研究员潘碧莹,带来了主题是《AI隐私安全研究与实践》的演讲。主要介绍了AI数据隐私安全的背景和现状以及关键技术,还有中国电信在AI数据隐私安全的实践工作。
从2018年开始,手机开始具备AI算法的计算加速能力。随着计算能力提升和能效大幅度的提升,催生出了一波图象优化、生物特征识别、智能问答、语音合成、文本识别等等的AI应用在终端上面的广泛使用。但随之而来也引导出了AI隐私终端的安全问题。
潘碧莹从终端隐私和AI应用隐私两个方面揭露了数据安全所面临的问题,一是自动化决策的合规问题,二是数据采集和访问的合规问题。比如个人信息采集更便利、权限管理等问题,在AI应用隐私方面,存在错误授权过渡索权、超范围收集个人隐私以及在用户不知情的情况下收集个人隐私等问题。这让用户产生担忧。
目前国际主要组织,例如欧盟,还有中国、英国、美国等都在制订AI隐私安全方面的政策法规。
随着标准的完善,AI数据隐私安全相关的关键技术也逐渐成为重要支撑。但是差分隐私、多方安全计算以及联邦学习在AI终端上面的应用,还存在一些难点。比方,差分隐私是一种以损失精度为代价的隐私保护机制;多方安全计算需要各参与方在交互通信来实现加法和乘法的操作,所以如何设计协议,降低通信开销成为应用难点;联邦学习的终端的算力与模型训练的算力需求还有一定的差距以及用户数据分布的问题,导致联邦协定在AI终端上面成为一个应用难点。
潘碧莹表示:“中国电信积极参与主导标准制定,以及构建平台产品来助推AI数据隐私安全保护。”
中国电信在GSMA成立了TSGAI工作组,促进人工智能在移动设备上的实施。在今年的时候也发布了业界第一份AI终端规范。以及在今年三月份,中国电信在IEEE成立了P2986工作组,主导联邦学习隐私安全要求标准,目前有18家公司和研究机构参与。同时构建诸葛AI平台,这一平台是具备中国电信特色可商用的联邦学习平台。
最后,潘碧莹表明,目前中国电信已经在营销领域开展实践,合作伙伴可以通过中国电信诸葛AI平台,结合中国电信海量数据,在不交换原始数据和标签的前提下,进行更精确的定位营销。未来还会在更多的领域进行实践探索。
六、徐世真:隐私计算与AI互为补充,助力AI新基建
瑞莱智慧RealAI首席架构师徐世真博士发表了《隐私计算助力AI新基建》的主题演讲。他表示:“AI和隐私计算息息相关,隐私计算是AI能力的重要补充,AI是隐私计算
的核心需求。从场景角度来看,隐私计算通常和AI紧密相关,AI可以看成隐私计算的上层应用与核心技术。”
随着人工智能被纳入新基建的范畴,瑞莱智慧提出,要做一个安全AI的基础设施,其中包括数据安全、算法可靠、应用可控。
徐世真指出,目前隐私计算计算还面临着四大问题,第一,生态壁垒。第二,计算性能。第三,安全性。第四,可用性。
他表示;“AI发展趋势与隐私计算技术发展趋势有着极大的相似性,或许可以从AI的发展趋势中映射隐私计算的发展。比如采用数据流图层面的编译兼容路线,是AI提出的解决机器学习框架之间互联互通问题的方案,这对解决隐私计算的互联互通提供了有力借鉴。”同时在性能优化、算法升级以及AI自身安全性等方面,隐私计算与AI发展也有共通之处。
同时隐私计算要赋能产业,要结合具体场景和产业需求。徐世真认为,隐私计算的产业路径需要逐场景落地,并根据不同的场景选择不同的技术路线。
徐世真也强调,隐私计算虽然解决了数据流通安全性的问题,分离了数据所有权和使用权,能够避免流通过程中的资产损失,但没办法解决端到端的安全问题,很多企业更希望获得的是端到端安全保证,比如数据存储、数据采集以及流通前后的数据权属等怎么做。
目前来看,数据交易的意愿和市场还不成熟。很多企业把隐私计算当成安全合规的成本项建设。徐世真认为:“只有深度结合AI,使业务方从隐私计算中获益,才能把隐私计算从成本项变成营收项,保证企业有可持续的意愿度,保证数据价值闭环操作。”
他也指出,隐私计算的产品化,一是尽量从规范成熟、少定制化的需求场景切入,二是将隐私计算嵌入现有的成熟产品,比如在原有机器学习平台中添加隐私计算功能模块。“这是用户理想的产品形式,对外依旧输出AI建模能力,用户操作层面几乎无感,在使用原有机器学习建模技术的同时,底层已经通过密码学、MPC技术实现了隐私保护功能。”徐世真表示。
最后,徐世真还介绍了瑞莱智慧开发的首个编译级隐私保护计算平台RealSecure,底层以编译器架构与全同态加密技术为核心突破,实现与传统算法的自动编译和一键适配,性能领先业内平均水平数十倍。同时瑞莱智慧也打造了“平台+数据+服务+场景”的一体化解决方案,通过引入运营商、支付等数十种外部数据源,推动隐私计算从功能论证阶段迈向业务落地闭环,实现对金融、政务等不同业务场景的快速赋能。
七、李晓林:知识联邦“新物种”,打造基于隐私计算的共享智能平台
同盾科技合伙人兼人工智能研究院院长,中科院医学所首席教授李晓林,进行了《知识联邦:打造基于隐私计算的共享智能平台》的主题演讲。
李晓林表示:“数据作为生产要素,和其他生产要素有非常大的区别,数据容易失控,保护更难,而且数据的复制几乎是零成本。同时因为这些困难和挑战,导致数据共享的程度比较低,数据生命力在各个孤岛上面,数据的价值没有充分发挥。”
同时数据的时间和空间价值也是有差别的,今年的价值和未来一年的数据价值也是有差别的。数据要实现它的价值就必须通过时间和空间上的安全合规的流通。而联邦学习、MPC安全计算、TEE等,通过打破数据孤岛来增强数据的流通价值。但是与此同时,随着各家隐私计算平台的推出,又形成了新的数据群岛。
对于以上问题,李晓林认为,要想真正的实现知识的共享互通,互联互通的机制来充分发挥数据的价值,首要问题是要保障一致性:一个方面是连接上的一致性,另一方面是流通的数据、内容的一致性。
同盾科技打造了基于隐私计算的开放共享平台。核心是同盾智邦平台iBond,下面是智邦的内核iCore。
同时同盾提出:知识联邦是一个统一的多层次的框架,融合了多种安全多方功能,基于数据安全交换协议等等,有效利用多个参与方的协议,真正实现数据可用不可见,知识共创和共享。
李晓林表示,有了互联互通,有了iBond,有了智邦平台的支撑和知识联邦的理论框架,我们就可以进一步打通数据流通,从而形成智邦iData。
在智邦iData可以从数据的提供方、数据使用方和应用开发者、应用的提供方、使用方,把数据、应用发布在上面,使用者可以按使用收费,实现价值变现。
最后,李晓林阐述了同盾的目标是做一个连接器,通过联防联控的独立第三方角色,联邦安全交换和充分互联互通,来帮助各个行业充分发挥数据的价值,通过人工智能持续强化学习,通过前沿算法来支撑智能,并且开源、开放联盟,合作共赢。
八、学者、创业家、投资人三方对话:一场关于“隐私计算”的头脑风暴
在长达一个小时的圆桌对话中,信工所研究员、博导,信息安全国家重点实验室副主任侯锐从隐私计算的未来是什么?什么时候这一风口能够真正的把大家都吹起来?这两个问题引入。
接着杨强老师也参与到讨论中并发出两个问题:一、投资人最关心的是什么问题?在过去,投资人可能最关心的是技术和人才,但是在现在和未来的一年后、两年后,投资人怎么看这个领域的发展?二、现在的业务状态、商业状态有点“僧多粥少”的局面,业务一个需求出现就蜂拥而上,这个情况怎么破局?
针对相关问题,各位嘉宾展开了深入的交流,预知详细内容,请关注雷峰网后续报道!
总的来说,隐私计算这一新兴的技术赛道,正吸引不少企业的大力布局。这背后是数据合规监管压力的使然,更是抢占先机的发展需求。从投资角度看,目前隐私计算尚处于技术提升期,还未形成新的商业模式,但是未来可期。
与普通人而言,未来随着隐私计算应用在多种业务场景中不断推广,自己的个人信息也会得到更有效的保护。