假设有两个百万富翁,他们都想知道谁更富有,但他们都想保护好自己的隐私,都不愿意让对方或者任何第三方知道自己真正拥有多少财富。那么,如何在保护好双方隐私的情况下,计算出谁更有钱呢?这是2000年图灵奖得主姚期智院士在1982年提出的“百万富翁”问题。
这个烧脑的问题涉及这样一个矛盾,如果想比较两人谁更富有,两人似乎就必须公布自己的真实财产数据。但是,两个人又都希望保护自己的隐私,不愿让对方或者任何第三方知道自己的财富。在普通人看来,这几乎是一个无解的悖论。然而在专业学者眼里,这是一个加密学问题,可以表述为“一组互不信任的参与方在需要保护隐私信息以及没有可信第三方的前提下进行协同计算的问题”。这也被称为“多方安全计算”(Secure Multiparty Computation,SMC)问题。
姚期智院士在提出“多方安全计算”概念的同时,也提出了自己的解决方案——混淆电路(Garbled Circuit)。随着多方安全计算问题的提出,投入到多方安全计算研究的学者越来越多。除了混淆电路之外,秘密共享)、同态加密等技术也开始被用来解决多方安全计算问题,隐私计算技术也逐步发展了起来。
数字时代,数据被视为重要的生产要素。从机构到企业,从组织到个人,或海量或零星的数据已然遍布在整个社会网络之中。然而对发展数字经济来说,只有流动的数据才能产生更大的价值。但流动本身就意味着风险:不同于其它实体生产资料,数据天然具有边际成本低、重复利用率高的优势,同时也就存在着复制成本极低、隐私安全性难保证等弱点。在世界加快加强对数据保护立法、企业和个人普遍对数据安全性开始担忧的前提下,怎样让数据以最安全的方式在流动中被利用,成了一道难题。而近年来崭露头角的「隐私计算」成为了当下最理想的答案。刘硕告诉记者,隐私计算,通常指的是在保证数据提供方不泄露原始数据的前提下,对数据进行处理和计算,完成数据价值挖掘的技术体系。其最直观的作用在于:保障数据在流通和融合过程中的“可用不可见”,实现数据所有权和数据使用权之间的分离。简单地说:你可以使用我授权给你的数据达到你想要的计算结果,但你自始至终无法一睹数据的原始“相貌”,也就最大程度上避免了授权数据的泄露。
近年来,个人隐私保护成为人们广泛关注的焦点,人们也都认识到隐私信息是大数据的重要组成部分,而隐私保护关乎个人、企业乃至国家的利益。
针对隐私保护问题,学术界开展了大量的研究工作,包括多方安全计算技术在内的隐私保护技术在逐步完善发展中得以应用。然而,隐私缺乏定量化的定义,隐私保护的效果、隐私泄露的利益损失以及隐私保护方案融合的复杂性三者缺乏系统的计算模型,这就使得隐私信息在不同系统和不同用户间的共享、交换和分析过程中难以被准确刻画和量化,阻碍了各类计算和信息服务系统对隐私进行有效、统一的评价。
针对这一问题,2016年,中国科学院信息工程研究所研究员李凤华等对隐私计算在概念上进行了界定:隐私计算是面向隐私信息全生命周期保护的计算理论和方法,具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护。隐私计算涵盖信息所有者、搜集者、发布者和使用者在信息采集、存储、处理、发布(含交换)、销毁等全生命周期中的所有计算操作,是隐私信息的所有权、管理权和使用权分离时隐私描述、度量、保护、效果评估、延伸控制、隐私泄露收益损失比、隐私分析复杂性等方面的可计算模型与公理化系统。
注:文章及图片转载自网络,如有侵权,请联系删除