315曝光的这个问题背后,一个千亿级的产业正在崛起

混沌大学2021-03-17
既保证数据流通,又保护数据隐私,隐私计算似乎是完美的解决方案,那么,目前隐私计算目前在国内应用情况如何?未来又会有什么样的发展?

编者按:本文来自微信公众号“混沌大学”(ID:hundun-university),作者:混沌大学商业研究团队 谢宇航,36氪经授权发布。

李女士70岁了,手机玩得很溜,她在广告的引导下安装了加速软件,可是没想到,手机变得更慢了。专家检测后发现,这些“加速软件”在默默地读取李女士手机里的信息,频繁的读取降低了手机的运行速度。更大的危害在于,这类App驻扎在老人的手机里,不断在后台发送用户数据信息,对老人们进行用户画像,打上“容易被误导和诱导”的群体标签。于是,各种低俗、劣质,甚至带有欺骗套路的广告和内容就会源源不断地推送到老人的手机上。

我们每天都会进入各种各样的商店,但很少有人能意识到,最先“盯上”自己的不是服务员或者导购,而是配备了人脸识别技术的摄像头。摄像头连接着店员的手机,从进店的那一秒钟开始,你的人脸就出现在店员的手机上,旁边标注了:性别、年龄、第几次来店里、此时此刻的心情......这些数据不仅被商家用来向你推荐商品,还被第三方公司所掌握。

在刚刚结束的315晚会上,与隐私相关的灰色产业被揭开。与我们日常生活相伴的,有一个“看不见的世界”,在那里,我们的行为数据被不断抓取。

想象一个类似于黑客帝国的场景:每天,电脑、手机端口都在源源不断地流出数据,这些数据被贴上标签,频繁交换。在这个看不见的巨大世界里,每个人都有着“数据的自己”。

大数据浪潮推动了行业普及,让市场认识到了数据的价值,但同时催化了“倒卖数据”的黑产。

手机软件仅8.75秒就能读取个人信息近900次......

目前人脸识别的数据量已经上亿.....

隐私的泄露或许让人们感到恐慌,但更重要的是,我们应该思考:除了法律和道德的约束,这些因技术进步带来的问题,是否有技术手段可以解决?

隐私计算可能是答案之一。

什么是隐私计算?简单打个比方,你去商店买酒,商家需要核对你是否已成年,现在惯用的方式是出示身份证。但是,商家在确认时,你的姓名、年龄、照片、家庭住址、身份证号码也被泄露了。而隐私计算要做的事情是,通过一系列算法,把无关的信息隐藏,只给商家一个答案:这位顾客已经成年。

既保证数据流通,又保护数据隐私,隐私计算似乎是完美的解决方案,那么,目前隐私计算目前在国内应用情况如何?未来又会有什么样的发展?

01

关于隐私的担忧,其实早就已经出现了。

刚刚在吃泡面,同学问我怎么又在吃泡面,我说:“没钱了,而且想吃啊,真香。”就在此时,我刷新了一下知乎,页面上出现了推荐文章:《长期吃方便面有什么危害?》

我因为想要减肥,中午在手机上搜了一圈减肥食谱,晚上刷抖音,推荐的视频全都是:怎么制作减脂餐。

最近在跟男朋友闹分手,网易云音乐好像能感知我的心情,推荐歌单中赫然出现了“不再联系”、“孤身”、“我走后”,全都是失恋相关的歌。

想买抽油烟机,在百度搜了下哪种抽油烟机好,结果抖音快手推送视频中,不约而同地出现了家电以及做家务相关的内容。

去重庆出了一趟差,打开“大众点评”,它就反复地给我推火锅。

... ...

豆瓣“大数据时代存在哪些细思恐极的事情?”的话题下,类似的讨论内容有1900多条。

有人的总结,一语中的:在大数据时代,我们都将“一丝不挂”。

“如果不是苹果推出了iSO14,我都不会意识到,自己在网络世界的信息不仅被一览无余,而且已经被倒卖了无数次。”网民小莉告诉混沌君。

去年9月,苹果推出了正式版iOS14版更新包,其中隐私政策的变化闹得沸沸扬扬。因为苹果系统升级至iOS14后,App开发者必须告知用户他们的IDFA代码正在被记录、追踪,同时必须询问用户是否同意与开发者共享其IDFA。

什么是IDFA?它是苹果分配给设备的随机生成代码,是识别每个iPhone的唯一ID,相当于我们在互联网世界中的“身份证号”。App可以通过这个身份证号,记录下用户的访问足迹。用它来完成精准的广告推送。

“每天,我们在网络世界中的行为数据都被打上了不同类型的标签,在各家机构以及公司之间做交换,早就被卖过无数次了。”业内人士郑达(化名)向混沌君透露。

想象一个类似于黑客帝国的场景:每天,电脑、手机端口都在源源不断地流出数据,这些数据被贴上标签,频繁交换,仅一天,数据交换量就达到了万亿规模。在这个看不见的巨大世界里,每个人都有着“数据化的自己”。

“几乎所有手机上的App都是数据采集方,这些App背后,是一个个公司。相对大一点的公司本身就具备数据采集、数据分析的能力。它们采集数据后,用大数据或者AI手段,形成用户画像和标签。这些数据被用来喂养它的模型,使模型更优化。”郑达介绍。

实际上,这些被搜集的数据已经支撑起了一条产业链。苹果发布的《每日数据生活》(A Day in the Life of Your Data)报告指出,平均而言,每款移动App关联了来自第三方公司的6个追踪器,其目的是收集和追踪用户的个人信息,从而推动这个每年价值 2270 亿美元的行业发展。

这条产业链的参与者有谁呢?

郑达介绍,首先,是App的开发者,它们需要数据来支撑自身模型。另外,还有一些公司,专门以销售数据为主业。

“有些公司会通过各种比较低级的手段,简单直接地销售用户数据。大公司一般不会做这种事情,但是不排除有部分公司在业务压力大的时候,可能就放松了制度,比如前几年百度的莆田医院事件。”

除了互联网公司本身的数据部门,市场上也有专门的数据中介机构。它们通过一些互联网工具以及技术手段来搜集数据、购买数据,然后做清洗,再进行销售。

“也存在一种拼缝的机构,通过各种资源,从政府、金融机构、电信运营商、医院等原生的数据机构里,把数据通过API或者是ACC的方式拿出来,然后通过简单的包装处理来销售。通常,这种公司都是以大数据公司的面目出现。”

02

苹果iOS14的隐私政策,相当于在数据的出口处设置了一个开关,只有用户打开这个开关,数据才能流出来。这无疑给这条产业链上的各家公司带来挑战。

Facebook表示,iOS14的隐私政策将会导致其“受众网络”广告业务的收入下降50%以上。马克·扎克伯格甚至亲自站出来抨击苹果的做法,指责苹果“动机不纯”,说是为了帮助用户保护隐私,其实只是想逐利而已。

2020年12月17日,Facebook 在《纽约时报》等媒体上登了一整版的“大字报”,标题赫然写着:“为了各地的小公司,我们决定站到苹果的对立面。”

Facebook则表示,每月都有超过一千万个小公司通过他们的定向广告工具雇佣和触达新客户,而苹果iOS 上对 IDFA的限制和对应用追踪的控制,让小公司不能精准投放广告,也撼动了靠广告营利的平台提供免费服务的商业模式。

此外,据 The Information 报道,Facebook 已经聘请了律师,准备对苹果提起反垄断诉讼。理由是:苹果App Store 规则要求开发者必须使用苹果的支付系统,并且支付苹果 30%的收入分成,这涉嫌不公平竞争。

苹果也进行了有力的回击。2021年1月28日,在“数据隐私日”活动期间,苹果发表了《每日数据生活》(A Day in the Life of Your Data)的报告。这份报告的封面选用了一张父亲带着女儿在自拍的图片,自拍后,父亲选择通过照片编辑器进行修饰(比如加滤镜),并在社交媒体上进行分享。

拍照、修图、发布,这一系列操作好像我们每个人每天都会发生,看似无害,但却涉及了大量的应用程序,其中就包含了数据收集和广告追踪:

首先,在使用滤镜的过程中。提供滤镜的App不仅能访问父女俩正在处理那张照片,还能访问设备上的所有照片,以及照片相关的元数据。

随后,父亲将照片发布到社交媒体平台上,SNS 应用也会获取到相关的邮件地址、电话号码、广告标识符等大量隐私信息。

这么一通操作的结果是,当这位父亲在参与其它线上活动时,APP可能根据统计信息,分析出他的购买习惯,然后进行精准的广告推荐。

讲清楚这些无孔不入的“数据泄漏”后,苹果在这份报告中列出了iOS14的隐私功能。iOS14可以让用户能够更好地掌控数据,比如仅允许滤镜App访问特定的照片,而不是整个相册。

为了达到这样的功能,苹果提及了四项关键隐私原则,包括数据最小化、仅在本机上处理、用户透明度与控制、以及软硬件相结合的数据安全保障。

“隐私与安全总是相辅相成,而苹果致力于让用户在个人数据的处理上,始终掌握着主动权。”苹果软件工程主管 Craig Federighi 表示。

03

“无孔不入”的数据搜集难免带来恐慌。但是也有人认为,大数据带来的精准广告投放,对用户来说,不一定是坏事。

到底该如何界定数据搜集的合理性?数据搜集的边界在哪?

“数据搜集的合理性是比较难界定的。” 隐私计算和区块链技术服务商“矩阵元”创始人兼CEO孙立林说。

孙立林举了一个例子:小张与老冯打过几次交道,小张可能会知道老冯喜欢喝哪种酒,他可能就会给老冯推荐酒,说“这是我在卖的酒,您尝尝好不好”。老冯如果讨厌小张的这个行为,可以直接把小张拉黑了。只不过,放到数据世界里面来看,普通用户是被动地被各种APP推荐各种信息,没有拒绝的余地。

“如果一定要去判断数据搜集是否合理,我们可以把数据世界和物理世界做类比,在物理世界不能做的事,在数据世界也不能做。”孙立林说。

比如前不久,业内纷传某家通过大数据捕捉“违法行为”的创业公司获得了一家互联网巨头的投资。孙立林表示,传言真实性尚待考究,但关于该公司业务合法性的一个质疑在于,商家是否可以调取用户的行为数据?

“这就好比,在物理世界中,潜在嫌疑人在家里或者酒店里,监管机构是否可以冲到他的家里,去检查他有没有在做非法的事情?这中间涉及到法律、伦理等问题。关于这些问题,目前每个行业内,其实都有一些标准和共识,来规范大家对数据的使用。”

孙立林介绍,大数据并不仅限于互联网行业。目前,金融业、医疗业同样需要大数据去做支撑。我国“十四五”规划中,大数据中心建设与5G、工业互联网等一同被提及,成为未来国家“新基建”政策中的一个重要组成部分。我国大数据产业迎来新的发展机遇期。

不过,与数据隐私相关的担忧也随之而来。为此,政府出台了数据安全法等相关法律及政策文件。但另一方面,某些环节对数据的过度保护,却产生了一个不容忽视的问题:大量的数据无法被联合在一起计算,它们被留存在各个机构内部,形成了一个个“数据孤岛”。

是否存在一种既保护数据安全又有效利用数据的方式?

1980年代,中国科学院院士姚期智提出了“百万富翁”问题:两个百万富翁在街头邂逅,他们都想炫一下富,比比谁更有钱,但是出于隐私,都不想让对方知道自己到底拥有多少财富,如何在不借助第三方的情况下,让别人知道他们之间谁更有钱?

在这个经典问题之下,诞生了“安全多方计算”(Secure Multi-Party Computation,MPC),这是一门密码学的分支学科。MPC技术能够让各方的文明数据在不泄露的条件下,融合多方的密态数据进行计算,并得到明文计算结果,最终实现数据所有权和数据使用权的分离。

MPC正是孙立林公司的主要业务之一。

“简单来说,第一,看不见数据;第二,没有拿走数据;第三,甚至连数据被计算了多少次也不知道的情况下,仍然可以对这个数据做事先约定过的各种计算。

比如,清华大学有想跟美团做一个关于中国人健康饮食的分析,但这个数据不能从美团数据库里面拿走。这中间就需要用到MPC技术。”

孙立林表示,2017年,他刚开始做隐私计算时,很多人都不是很理解这个技术,“觉得这好像是一个魔术”。随着国家发改委宣布将出台“十四五”新型基础设施建设规划,大力发展数字经济。MPC相关的隐私计算技术也逐渐被更多人关注。

“如何让各个数据孤岛之间打通,人类打开通天塔,让大家愿意共享数据?这不能依靠每个孤岛上的AI大数据,而是广域意义上,由隐私计算来加持的全域数据共享的运营。”他说。

孙立林举例称,银行间、医院间也会需要隐私计算技术。比如,患者在北京协和医院拍了片子,后面转到上海华山医院去看病。原来,协和医院是不愿意把数据开放给华山医院的,华山医院又得再拍一次片,但如今在隐私计算条件下,医院之间就可以数据共享。

可以说,作为平衡数据挖掘和隐私保护有效解决方式,隐私计算技术为数据流通和价值共享提供了一条重要的技术路径。理论上,任何需要数据流通的行业都需要隐私计算。

而在大数据时代,隐私计算公司就像新的运营商。机构间在使用大数据时,为了符合相关的隐私保护法,就需要用到MPC技术。

“就像我们上网,现在需要使用宽带。未来各机构需要使用大数据,就要使用MPC。伴随着数据产业的发展,MPC技术也将逐渐普及。” 孙立林说。

从市场发展来看,国内上一轮大数据浪潮推动了行业普及,让市场认识到了数据的价值,但同时催化了“倒卖数据”的黑产,如何能够既保证数据流通,又保护数据隐私成为核心问题。政策上,中欧投资协定落地,而欧盟数据隐私保护条例GDPR早已实施,有望对我国形成促进作用;技术上,隐私计算结合安全多方计算、联邦学习和可信执行环境等多种技术,可在金融、国际贸易等多个场景开辟更多层次的应用,正在迎来新的发展机遇和环境。

国盛证券也曾发布报告指出,隐私计算贯穿整个IaaS基础算力层、BaaS、SaaS服务层,是打开数据金矿的一把钥匙,将创造更多的创新服务领域和商业模式。

不过要注意的是,隐私计算在各行业的落地,会由于行业自身的信息化、数字化程度有所差异。因此,孙立林认为,金融行业的数据规范程度和合规要求都相对较高,是当下最适合隐私计算发展的行业。

当前,我国隐私计算的发展尚处于初期,尽管在落地应用上已有不少探索,但在技术门槛、公众信任度等方面依然面临不小挑战。未来,隐私计算的发展,仍需要各方协同共同努力。

参考资料:

《Facebook都喊话怕了的iOS 14变化,出海开发者如何应对?》https://m.huxiu.com/article/379622.html

《手机变成“窃听器”?苹果iOS14要动这块蛋糕》 https://m.huxiu.com/article/382865.html

《Facebook vs 苹果,决定广告行业新标准的一战》https://m.huxiu.com/article/409318.html

+1
17

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

下一篇

杀死你的往往来自自身

2021-03-17

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业