五问隐私计算:星星之火可以燎原吗?

毛苇频道 · 2020-12-29
2020年是隐私计算元年。星星之火可以燎原吗?

本文授权自微信公众号“毛苇频道”。

在 Gartner 发布的2021年最新报告中,“隐私增强计算”(简称隐私计算)成为企业机构需要深挖的9项重要战略科技趋势之一。事实上,2020年隐私计算已经成为一个浮出水面的明星赛道。政府、金融机构、互联网巨头等都在积极拥抱这一新兴技术,嗅觉敏锐的风险资本也都踊跃下注隐私计算领域的初创公司。

隐私计算为什么突然火热?隐私计算的星星之火是否可以燎原?

在信通院联合数牍科技、阿里安全共同发布的《隐私保护计算技术研究报告》(简称报告)中,笔者找到了部分答案,同时也产生了更多的问题。本文主要就五大问题进行分析阐述,欢迎业界专家批评指正。

一、为什么隐私计算快速崛起成为热点?

根据信通院报告的解释,隐私保护计算是指在提供隐私保护的前提下,实现数据价值挖掘的技术体系。隐私保护计算并不是一种单一的技术,它是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系。隐私保护计算能够保证满足数据隐私安全的基础上,实现数据“价值”和“知识”的流动与共享,真正做到“数据可用不可见”。

报告列举了制约数据流通与协作的三大因素:数据孤岛现象普遍存在;数据合规监管日趋严格;隐私泄露频发导致信任鸿沟。报告认为这三大因素制约了数据流通与协作,而隐私计算技术提供了有效的解决之道。这较好地解释了隐私计算技术能够解决的部分现实问题,但尚不足以解释为什么隐私计算为什么会快速成为企事业机构、互联网巨头、初创企业和资本追逐的热点。

笔者认为,应该从需求侧和供给侧两个方面来分析隐私计算的快速崛起。一是需求侧,企事业机构对数据价值挖掘的巨大需求和日趋严格的安全合规监管之间的矛盾,为隐私计算技术的长期可持续发展提供了强大的驱动力。二是供给侧,算力的普及,算法和大数据技术的日趋成熟,为隐私计算技术的工程落地提供了基础设施和技术能力保障。

任何一个市场,只有在需求侧和供给侧同时到达一个临界点后,才能产生共振效应,进而形成一股推动产业进步的潮流。

隐私计算的技术理论并不新颖,需求也一直存在,但很显然,在数据价值挖掘和合规监管矛盾日趋尖锐,以及算力、算法和大数据技术日趋成熟的今天,需求侧和供给侧均到达了临界点,导致了共振效应,推动了隐私计算的快速火热。

二、隐私计算的主要价值是什么?

据信通院报告分析,隐私保护计算的目标是在完成计算任务的基础上,实现数据计算过程和数据计算结果的隐私保护。数据计算过程的隐私保护指参与方在整个计算的过程中难以得到除计算结果之外的额外信息。数据计算结果的隐私保护指参与方难以基于计算结果逆推原始输入数据和隐私信息。

隐私计算主要有三个层面的价值:

一是消除数据孤岛。隐私计算从技术角度实现了原始数据不出库、数据可用不可见的目标,有效实现跨领域多维度数据的融合,完成了数据流通向“价值”流通的升级,打破了数据孤岛,实现了数据隐私保护与价值挖掘之间的平衡。

二是合规避险。世界各国对安全合规的监管越来越严格,欧盟的GDPR、美国的CCPA相继生效,中国的数据安全法和个人信息保护法草案等陆续出台,合规避险成为企事业机构的刚需。报告列举了一个通过隐私计算技术合规避险的案例,爱沙尼亚在2015年的私人统计项目,1000万条可识别纳税记录与60万条可识别学历信息关联在一起,通过安全多方计算技术对其进行统计分析。欧洲的PRACTICE项目(欧盟第七框架计划)严格分析了安全计算技术的合规性,报告依据GDPR论证了该爱沙尼亚项目的合规性,为欧洲实现隐私保护合规的高效数据流通提供了重要范例。

三是弥合信任鸿沟。隐私计算技术凭借其坚实的理论基础和安全性证明,从技术角度实现了数据主体权利和数据使用者义务的平衡,增强了数据应用透明度,提升了数据价值挖掘下的隐私保护信任,能够很大程度上弥合当前的信任鸿沟。

三、隐私计算有哪些关键技术?

报告对当前隐私计算领域的主流关键技术进行了深入剖析,主要包括五大关键技术:联邦学习、安全多方计算、机密计算、差分隐私、同态加密。

一是联邦学习(FL)。联邦学习起源于谷歌的应用实践,即通过一个中央服务器协调众多结构松散的智能终端实现语言预测模型更新。联邦学习通常可以理解为是由两个或以上参与方共同参与,在保证数据方各自原始数据不出其定义的安全控制范围的前提下,协作构建并使用机器学习模型的技术架构。联邦学习的本质是以数据收集最小化为原则,在保持训练数据去中心化分布的基础上,实现参与方数据隐私保护的特殊分布式机器学习架构,且基于联邦学习协同构建的机器学习模型与中心化训练获得的机器学习模型相比,性能几乎是无损的。

二是安全多方计算(MPC)。MPC解决一组互不信任的参与方各自持有秘密数据,协同计算一个既定函数的问题。安全多方计算在保证参与方获得正确计算结果的同时,无法获得计算结果之外的任何信息。在整个计算过程中,参与方对其所拥有的数据始终拥有绝对的控制权。安全多方计算作为隐私计算领域的底层技术,在理论和工程实践上都得到了很好的发展。

三是机密计算(CC)。机密计算是一种基于硬件可信执行环境实现数据应用保护的技术。为了减少机密计算环境对特有软件的信任依赖,机密计算重点关注基于硬件可执行环境的安全保证。目前引入可信执行环境较为成熟的技术有 ARM 的 TrustZone 和 Intel 的 SGX(Software Guard Extensions,SGX)等。

四是差分隐私(DP)。差分隐私是量化和限制个人信息泄露的一种输出隐私保护模型,其最主要的实现方式是在计算结果中添加噪声。差分隐私被麻省理工科技评论为2020全球十大突破性技术之一,在美国2020年人口普查中的应用成为迄今为止差分隐私保护技术的最大规模应用,实现了在不损害个人隐私的前提下最大限度利用数据资源的核心诉求。

五是同态加密(HE)。同态加密是一种特殊的加密算法,它允许在加密之后的密文上直接进行计算,且计算结果解密后正好与明文的计算结果是一致的。

四、隐私计算有哪些主要应用场景?

经过大量的资料分析和专家访谈,笔者认为,总体而言国内在隐私计算领域尚处于应用场景探索的阶段。目前,少数厂商在少数领域进行了有效的场景落地,但大规模的应用普及尚有待时日。

目前来看,隐私计算主要有这样一些应用场景:

一是精准营销。企业通过联邦学习输出模型,对高意向潜在客户进行精准画像,据此进行客户线索挖掘,并对高潜客户进行精准触达和转化。这种方式不仅可用于新增客户挖掘,也可用于存量客户的挖掘。例如,据数牍科技专家介绍,数牍在汽车、保险等行业就通过联邦学习帮助客户实现了精准客户画像和线索挖掘。

二是信用风险评估。隐私计算为金融机构间甚至跨行业的数据合作、共享提供了可能性。例如,银行通过隐私求交、联邦学习等隐私计算技术,对信贷主体的信用风险进行多方数据联合建模、预测,可以更精准地评估信用风险,在提高放贷效率的同时降低违约率。据悉,在央行的发文指引下,工商银行、建设银行、招商银行等大型商业银行正在积极探索利用隐私计算技术进行金融科技创新。

三是政府治理。通过隐私保护计算和其他技术的结合,可以有效保护各部门的数据,在一定程度上解决政务“数据孤岛”问题,提高政府治理能力。例如通过视频、位置、交通等多部门数据对治安防控、突发事件进行研判,合理调配资源,提高应急处理能力和安全防范能力。

四是匿名查询。报告介绍了一个疑犯信息查询的场景,假设公安机关有一份疑犯名单,需要到其他部门查询疑犯的相关信息,但是“疑犯”这个身份信息对个人而言比较敏感。利用隐私查询技术,在查询疑犯相关信息的同时,公安机关不需要跟其他部门共享疑犯名单,保护疑犯隐私。

五是辅助诊断。报告介绍了一个医疗领域的场景,为了应对新冠肺炎疫情带来的医疗挑战,医疗机构需要在全球范围内共享新冠肺炎疫情数据。如通过人工智能识别肺部X光图像来诊断新冠肺炎。各医疗机构先在本地建立模型,再通过SMPC等技术联合其他医疗机构更新模型参数,在保护各方数据隐私安全前提下,提高图像模型诊断能力。据悉,翼方健数等在用隐私计算技术辅助诊断治疗方面进行了积极有效的探索。

实际上,隐私计算的应用场景远远不只上述几种,笔者相信,随着政府、金融机构和企业等对隐私计算技术的逐步深入理解,各行业都将不断涌现出更多的应用场景。

五、隐私计算当前面临哪些挑战?

隐私计算虽然快速发展,但依然面临如下一些挑战:

一是应用场景落地。隐私计算是一种数据协作的技术,其商业价值取决于应用场景的落地能力。目前虽然有不少厂商都推出了隐私计算产品,但能实现应用场景落地的依然寥寥。可以预见,2021年将成为隐私计算应用场景落地元年。诸如数牍科技、阿里安全等已有应用场景落地的厂商或将在竞争中占据优势地位。

二是技术标准。隐私计算解决的是数据使用方和资源方之间的安全协作问题,使用方和数据资源方都有建设隐私计算平台的需求,那么各平台之间的数据如何流通与协作就至关重要。当前看来,技术标准是关键的解决之道。能否在大的数据资源方和使用方之间形成某种事实上的标准,以及能否在各大主流标准之间实现兼容,对于推动行业整体技术标准的建立将具有重要作用。

三是市场教育。隐私计算作为一种新技术,对客户的市场教育任重而道远。Gartner的前瞻技术分析,以及信通院联合数牍科技和阿里安全的报告,无疑对教育市场、推动隐私计算技术的普及具有重要价值。

四是核心技术人才的培养。隐私计算在国内刚刚兴起,目前的核心技术人才大多来自于跨国企业的归国技术人才,或者互联网巨头内部的安全技术人才。真正拥有自主知识产权、拥有核心技术的企业少之又少。在隐私计算快速推广的过程中,不少厂商将在很长一段时间内面临缺乏核心技术人才的挑战。

2020年被称为隐私计算元年。可以预见隐私计算面临的挑战还有很多,诸如客户对安全性的顾虑、商业模式、产品化等问题,笔者将在后续陆续撰文分析。

隐私计算的星星之火,已经有了燎原之势。


+1
4

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

老玩家还在炒冷饭、新玩家已在挑战旧秩序

2020-12-29

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业