搜索

打造隐私云计算平台,锘崴科技想让医疗、金融数据安全分享

真梓 · 2020-03-26
解决数据在存储、传输和计算全流程中的隐私保护问题,并保证计算流程的完整性和真实性。

在数据经济时代,数据对企业的意义愈发重要。不论是需要进行算法模型训练的科技公司,还是需要依赖数据进行研发的传统行业(如药企等),都需要以数据为支撑进行业务拓展。但由于数据在使用过程中容易产生C端隐私被侵犯、B端数据被泄露等隐患,通过技术的手段解决数据在合法合规前提下的高效流动与使用的需求愈发迫切。

36氪最近接触到的一家公司——锘崴科技,通过打造“锘崴信隐私云计算平台”来实现让数据在安全环境下分享、分析的效果。具体而言,这一平台采用软硬件加密的计算技术(如多方安全计算、同态加密、可信计算环境)、联盟计算技术、区块链溯源技术以及可定制的超融合基础构架技术,在合法合规框架下保护数据所有方、数据使用方和数据监管等方权益。解决数据在存储、传输和计算全流程中的隐私保护问题,并保证计算流程的完整性和真实性。

该公司目前主要在医疗、金融等领域发力,其中医疗领域是现阶段的重点方向。锘崴的两位创始人王爽博士和郑灏博士此前均在美国隐私计算和生物医学信息领域有过丰富科研、工作经历。也正在这些经历中,王爽和郑灏发现医疗领域中数据使用的痛点,即数据不能通畅流通——分散在各个医院中的数据由于担心隐私被泄露和数据所有权的丢失无法进行有效地流转、共享和分析,这在某种程度上阻碍了精准医学的发展。

举例而言,目前一些医院对大数据的安全使用诉求在于数据合规和数据协作。医生在进行科研工作时,需要足够的医疗数据(包括病历样本等)作为支撑,但由于担心隐私泄露或不合规等风险,医生也许无法拿到足够多的数据。而锘崴的平台可以使数据“可用不可见”——即对原始数据进行加密分享和计算,只反馈客户报告等相关结果,能帮助医生在使用数据的同时也打消数据分享方的安全、隐私顾虑。

具体到落地层面,医疗大数据数据种类、数据格式各不相同。医疗数据可大致分为三种,分别是基因组学数据、图像数据和临床学数据。基因组学和图像学数据本身就是比较标准的格式,该公司系统可以支持相关格式的接入和分析。而临床学数据需要客户按照国际相关标准模型做调整处理,然后再接入系统。在实际情况下一家一家做地推,请客户进行数据的标准化并不现实,所以锘崴选择和医疗集团国家队合作,这些机构本身拥有牌照,并且已经采用相关数据格式标准,锘崴可以较顺利地将数据接入系统中。医疗集团在选择技术提供方时,则主要从计算方法和数据承载量等维度考量投标企业的技术水准。

此外,要真正落地及使用,除了技术具有可用性、可靠性,产品也需具有易用性。比如在商业应用场景中,客户不一定都是做过专门训练的医生或科研人才,锘崴的方式是给不同背景的客户提供一套简单的操作系统,客户只需要将数据接入系统中,通过可视化界面进行操作,选择自己需要的可视化方案并最终形成一个数据报告。在软件层面之外,锘崴目前还在开发和测试相关硬件系统,这些硬件会通过协处理器的形式和现有系统结合,提供更高效的隐私保护计算效果。在迭代完成后会作为下一代整体解决方案的一部分提供给客户。

在大数据隐私领域,有两种传统安全计算方式较为常见,包括提供安全屋沙箱、提供数据脱敏手段。由于前者采取的隔离手段仍需管理员或用户参与其中,后者通过消除敏感字段的方式仍无法完全避免敏感信息泄露,所以目前这两种方式都无法保证数据的绝对安全。

锘巍这套系统在底层技术不变的情况下也可赋能给其他领域,比如金融行业的客户会有数据模型协作需求——一些私募基金可以把交易策略提供给锘崴方加密,加密后的模型可用来赋能第三方(如客户等),而策略拥有方既不必担心交易策略的泄露,也可以通过其他合作方式产生利润。

在商业模式方面,锘崴目前的规划是和数据资源型伙伴进行合作,由锘崴提供技术服务,对方提供相应的数据、客户资源,双方共同挖掘市场,一起进行利润分配。未来也可能对其他客户探索抽成、分润等商业模式。

要实现“让数据可用不可见”的目的,在技术上需要算法和工程能力的双重加持。团队认为,团队创始人此前通过在美国创办的全球性隐私安全计算比赛的工作,充分深入的了解该领域不同算法的优势和劣势,能将不同种类的算法组合成高性能的混合性安全计算解决方案。并且其方案此前已部署在美国西海岸一些医院中经受压力测试,这为之后的商业落地提供了前提。

锘崴科技认为,公司所在的隐私计算其未来的行业壁垒在于数据网络。目前公司先通过算法壁垒和行业经验拿到客户和数据源,在应用中逐步形成自己的数据索引平台,“比如,我们平台的索引最终会在隐私保护的前提下帮助药厂精准定位一个省市的某家医院是否能提供新药开发需要的数据或某个大数据公司是否可以提供某家银行需要做征信的需求,并且平台在提供检索服务后可以进一步无缝的支持后续的隐私计算需求。”王爽介绍。并且,由于要提供数据索引,锘崴在系统中会根据数据的质量、可用性打分、提供数据标价。如果数据的质量越好,那么相应地可用性越高,也更有机会参与进更重要的研究中,数据方得到数据转化价值也会更高。同时,一些数据提供方也可以根据数据使用的目的性持续优化数据,形成良性循环从而提高整个业内的数据质量。

目前业内针对隐私计算开展业务的还有华控清交、数牍科技等公司。其中华控清交的团队来自清华大学,主要研究、开发和营运基于现代密码学和博弈论的大数据安全融合技术、标准和平台。该公司目前的主要产品是PrivPy 标准平台,能满足广泛用户群体保护多方数据隐私且实现协同计算的需求。数牍科技通过数据科学与工程、密码学(多方安全计算、差分隐私等)、联邦学习等技术,帮助企业之间进行安全隐私的数据协作,其创始人宋一民曾就职于Facebook Ads。

+1
2

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

数牍科技

方得

征信

下一篇

镜像世界是将规划中但尚未建造的建筑、景观、装饰设计叠加在现有的实景上

2020-03-26

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业