两个百万富翁在街上相遇。他们都想知道谁更富有,但是他们不想让对方知道他们真正的财富。如何在没有第三者的情况下让对方知道谁的钱多?
这就是姚期智院士在1982年提出的“百万富翁”思想。看到这里,不要以为这个想法和你无关。
因为,这种想法的背后,本质上反映了基于用户数据挖掘的服务的数据使用权和所有权之间的矛盾(目前互联网公司提供的大部分服务都涉及用户数据挖掘):服务提供商必须得到你的数据才能提供服务。放在这个“百万富翁”的场景中,就是互联网服务必须得到两个百万富翁的财产数据,才能计算出“谁更有钱”。
有没有什么技术可以实现数据使用权和所有权的分离,让生产者保留数据的所有权,而不影响数据需求者提供的服务?简而言之,可以基于加密数据进行计算。
2008年关于安全计算协议的论文(来源:DeepTech)
在密码学领域,这个问题可以描述为“一组互不信任的参与者在保护私有信息的前提下,在没有可信第三方的情况下的合作计算问题”。正是在《安全计算协议》(安全计算协议)发表的一篇文章中,姚期智提出了“百万富翁”的思想,同时,他发布了一个名为“安全多方计算”(MPC)的理论框架。
在最近一次《人民日报》的采访中,姚期智是这样解释MPC的:“我们每个人都有一块数据,我们希望把两个人的数据合在一起,但是我们不想给对方。我们希望让这个计算成为现实,但是我们根本不公开我们的数据是什么。我提出这个概念的时候,完全是出于科学好奇心。现在,这个方向已经成为密码安全领域的一个大方向。”
姚期智认为,多方安全计算将在金融科技、人工智能、医疗保护和数据共享方面发挥重要作用。值得一提的是,姚期智当时在接受采访时表示,MPC也将是中国贡献给世界的一项原创性关键技术。
屠呦呦是第一位也是唯一一位获得图灵奖(计算机领域最高荣誉)的中国计算机科学家,曾在麻省理工学院、斯坦福大学、加州大学伯克利分校和普林斯顿大学任教,是公认的算法、密码学和量子计算专家。2004年,他回到中国全职加入清华大学。目前是中国科学院院士、美国科学院外籍院士、清华大学交叉信息研究院院长(来源:人民直播截图)
走出实验室,MPC的两次应用价值都是在80年代初,也就是MPC诞生的初期。研究人员专注于验证这项技术的可行性。
MPC提出4年后,姚期智于1986年提出了基于混淆电路的通用解决方案,进一步验证了多方安全计算的通用可行性,奠定了现代计算机密码学的理论基础。此后,经过Oded Goldreich和Shafi Goldwasser等密码学家的进一步研究和创新,多方安全计算逐渐发展成为现代密码学的一个重要分支。
姚期智解释说,在一开始,MPC并没有真正发挥作用,因为计算机的计算能力无法实现相应的计算,但现在,经过30多年的发展,“计算机终于足够快,可以开始致力于大家30年来一直在改进的方案”。
今年6月,蚂蚁金服算法专家李立春在公开场合表示,“当我了解到这项技术的时候,我就知道它在大数据时代特别有用。当时对这项技术的了解非常少,在行业内的应用也非常少。七年过去了,现在我们看到很多公司都在做这方面的研究和探索,产业已经落地。”
MPC近年来备受关注,一方面是因为工业互联网、AI等关键领域的发展越来越离不开数据云和数据挖掘,数据隐私问题的解决迫在眉睫。今年早些时候,加州大学伯克利分校发现,人工智能的发展对健康数据的隐私构成了新的威胁,但目前的法律远远不足以保护个人健康数据的隐私。
另一方面,MPC发展到一定阶段,其产业价值潜力开始显现,尤其是在涉及隐私敏感输入数据(如客户行为信息、身份信息、金融信息、征信、医疗信息)的应用场景中。
金融、物流、供应链、物联网、汽车行业这些有隐私敏感数据的行业,将是MPC有很大应用价值的地方。而且在解决数据隐私问题的同时,也可以缓解数据孤岛的困境,因为有些数据孤岛的存在是基于对数据隐私的考虑。
这将是一个好消息,尤其是对于以海量数据为训练基础,并寻求在隐私保护合规方面落地的AI技术来说。
(来源:互联网)
以医疗场景中的基因数据为例,基因数据具有隐私要求高、数据量大的特点。此前有业内人士称“生物信息是个人信息安全的最后一道防线”。目前,基因数据一般存储在研究机构或医疗公司的本地系统中,但这些“新油”的共享和流通实际上更有利于生物医学技术的发展,比如基于基因数据挖掘研究某种疾病,开发更具针对性的药物等等。
如果不同的机构可以部署MPC节点,那么这些数据就可以通过MPC协议间接共享:基因数据仍然保存在本地,但不同的机构可以协同工作,计算出所需的数据结果。
中国也出现了类似的项目。2018年,民生健康(万向区块链与民生人寿联合成立)与宁波市保险行业协会合作,以健康保险为业务场景,模拟联盟内保险公司间的数据查询,证明MPC在建立共享价值网络方面完全可行。然而,应该指出的是,由于模拟数据的规模较小,该项目没有产生实际的商业价值。
作为MPC的发起者和重要创始人,姚期智清华十字学院也有一个探索MPC实际应用的团队。据DeepTech了解,2018年6月,清华十字学院的一个团队成立了华控清教信息技术(北京)有限公司(以下简称“华控清教”)。
(来源:华空青焦)
华清交易所由清华大学、清华大学交叉信息研究院、清华五道口金融学院联合发起,专注于基于密码学的MPC技术、标准和基础设施的研究、开发和运营。该公司的首席执行官是前高盛全球合伙人张旭东,团队成员大多来自清华十字学院。
该团队综合应用密码混淆电路、偶然传输、秘密共享、同态加密、同态承诺、零知识证明等多种理论和协议,开发了软硬件结合的多方安全计算平台。结合计算机工程技术。据介绍,这种计算平台可以在不暴露输入信息的情况下进行密文计算,最终得到与明文一致的密文计算结果,可以支持包括AI算法训练在内的几乎所有计算类型和各种数据格式。目前,华控清交已在金融行业实现多方联合风控、多方联合建模,在能源行业风电能效优化、政府领域电子政务等方面有具体的落地和试点。
(来源:华空青焦)
除了中国控制清算外,国外公司如有麻省理工背景的创业公司Enigma,国内公司如蚂蚁金服、ARPA等都已经在探索MPC与产业的结合,今年已经发布了一些阶段性成果。
以蚂蚁金服为例。早在2012年,蚂蚁金服就开始研究MPC。今年5月,蚂蚁金服推出了基于MPC的安全计算平台“Moss”。据说它提供了一种全新的具有安全和隐私保护的数据合作方式。它可以在本地数据不泄露、原始数据不出域的前提下,通过密码算法高效、安全地完成数据协作。目前,“莫斯”已广泛应用于联合金融风控、快速保险理赔、民生政务、多方联合营销、多方联合科研、跨境数据合作等多个领域。
(来源:蚂蚁金服)
关于与区块链互补的自然属性,有趣的是,关于MPC的应用,人们谈论最多、最看好的方向之一是它与区块链的结合。
MPC本身与区块链有很大关系。两者本质上都属于密码学技术。而MPC在不影响计算结果的情况下,使用一系列数学函数对输入数据进行加密,保护数据隐私。其基本思想包括混淆电路、秘密共享、同态加密等。
乍一看,MPC似乎和区块链很像:他们的目标包括数据保护,理论基础是密码学,实际部署采用多节点分布.但实际上,他们是很不一样的。
最大的区别是在区块链的计算过程中没有考虑输入数据的保密性。这些输入数据在链中是透明的和可追踪的。这在追求数据透明的应用场景中自然是常规操作,比如食品安全溯源。但在某些场景下,输入的数据具有一定的保密性,不透明反而是需求。MPC强调计算过程中输入数据的保密性,输入数据被锁在一个“黑匣子”中。
由于二者在输入数据上的属性互补,两者的结合是一种新的技术趋势:区块链可以通过MPC获得数据保密能力,可以覆盖更多的应用场景;在MPC区块链技术的帮助下,冗余计算变得可验证。蚂蚁金服副总裁兼总经理刘伟光曾在接受媒体采访时表示,如果不与MPC结合,区块链技术不足以支撑金融场景。
目前,一些区块链的创业公司也在研究MPC和区块链的结合,比如Consensus Digital Letter。在现实中,已经有一些应用结合了预测控制和区块链。比如ZCash通过零知识证明的方式给比特币增加了保护交易隐私的功能。在加密货币以外的领域,如联合征信、医疗数据联合建模、拍卖结算、广告推荐等应用场景,区块链作为隐私保护的存管MPC是一个很好的解决方案。
但需要指出的是,MPC作为一种新的密码协议和工具,是近几年才开始走出实验室的,应用案例非常少,还处于非常早期的阶段,没有特别成熟的产品。在实际实施过程中,其商业可用性还需要不断验证。因为,一项新技术必须结合场景工程才能发挥作用。
此外,由于MPC的分布式计算环境涉及大量的计算和交互,因此在实际应用过程中,MPC的性能和效率还有待进一步提高。
隐私计算技术会是下一个行业热点吗?在MPC的实验室和业界关注的背后,一个更大的行业趋势是“隐私计算”的兴起。
图8隐私计算的主要技术方向(来源:通证通研究院)
计算,广义上是指面向隐私保护的计算系统,涵盖数据生产、存储、计算等信息流通过程。计算发展的动力很大一部分来自外部监管环境(去年3月脸书因为数据滥用丑闻被罚款50亿美元)。换句话说,政府的监管越严格,私人计算的市场就越大。从行业趋势来看,Gartnre将数据隐私列为2019年十大战略技术趋势之一。
让我们来看看硅谷科技巨头们在隐私票下都做了些什么。今年6月,作为支持用户隐私和安全的一部分,谷歌发布了开源MPC工具Private Join和Compute,以帮助组织更好地处理机密数据集。
谷歌工程总监萨尔瓦帕特尔(Sarvar Patel)和研究科学家默蒂容(Michael Yung)在一篇公开文章中表示,他们将继续投资新的研究,以促进有价值的数据洞察,同时保护个人隐私。“通过更广泛地共享技术,我们希望扩大安全计算的使用案例。而这只是所有可能性的开始”。
据《第一财经日报》报道,前阵子推出数字货币“Libra”的FaceBook,很可能是在押注MPC。据报道,Libra公布的内容目前还不包括这部分,但从脸书几位核心工程师的简历来看,脸书也在进行相应的研发工作。这项技术在未来的数字经济中将具有战略意义。
最近,麻省理工学院数字货币项目区块链研究的高级顾问Michael J Casey也在CoinDesk上写道:“密码学的一个非常重要的领域——MPC——取得了一些重大进展,这表明可用性和安全性是分布式系统中潜在的圣杯”。他提到的进步指的是区块链公司KZen发布的新款ZenGo钱包。这种钱包使用MPC和其他复杂的加密工具(如零知识证明和门限加密)在一组不可信实体之间分担特定加密货币地址的签名责任。
然而,在这篇名为《MPC 阐释:保护加密货币的大胆新愿景》的文章中,迈克尔J凯西(Michael J Casey)也强调,认为MPC或任何相关技术能够为安全问题提供完美且完全无错的解决方案是不明智的。“当人们自满于安全不是威胁时,安全威胁就会出现”。
目前,企业的数字化转型和产业的智能化转型仍在蓬勃发展。在挖掘更高维的数据价值和数据云的过程中,数据隐私担忧的大概率只增不减。MPC这种典型的隐私计算技术值得关注和布局,尤其是中国企业。正如姚期智院士所料,MPC也将是中国贡献给世界的一项原创性关键技术。