北京瑞莱智慧科技有限公司基于安全多方计算、联邦学习、匿踪查询等技术,打造了隐私保护计算平台。(资料图片)
随着5G、人工智能、大数据等新技术快速发展和创新应用,各行各业积累的数据所蕴含的潜在价值越来越受到重视,数据资产成为数字经济时代的关键生产要素之一。
2020年4月份,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,将数据同土地、劳动力、资本、技术等传统生产要素并列,作为一种新型生产要素参与分配。作为释放要素价值的关键环节,数据资源的开放共享、流通计算成为重要趋势。
与此同时,数据安全正成为数字经济时代最为迫切的基础性问题。9月1日,《数据安全法》正式施行,连同已经实施的《网络安全法》和即将在11月1日实施的《个人信息保护法》,共同构建起国内的数据监管法律体系。在数据价值和安全冲突日渐加剧的当下,如何平衡好两者之间的关系,成为当前重要的研究课题。在此背景下,隐私保护计算技术的兴起,自然引发各方关注。
安全是发展数字经济基础
当前,围绕数据采集、流通和价值变现的数据要素市场,正迎来快速发展期。国家工业信息安全发展研究中心大数据研究室主任杨玫介绍,我国数据要素市场规模在2020年达到545亿元,“十三五”期间数据要素市场复合增速超过30%,预计在“十四五”期间将会达到1749亿元。
数据流通起来才能发挥价值,但数据权属不明确、数据交易机制不完善、数据安全难保障等问题制约其流通发展。在《数据安全法》施行后,我国数据要素市场全面进入“依法治理、有序发展”新阶段,但在数据合规的强监管下,如果数据拥有方“不敢共享、不愿共享、不能共享”,数据孤岛现状将加剧,难以将数据要素价值发挥出来。
如何有效平衡数据安全与数据流通?杨玫提出了两项举措:一是从全流程角度建设数据安全的管理体系和能力体系,包括数据安全定义、数据安全能力体系建设、数据安全风险识别、策略制定以及数据安全事件监测预警、后期应急响应机制;二是加强数据安全新技术的研究和应用,比如作为能够兼顾数据应用与安全保护的关键技术,隐私保护计算将为数据的互联互通提供技术解决方案。
中国信息通信研究院纪委书记王晓丽近日表示,快速发展的隐私保护计算等数据流通新技术,为产业破局提供了关键思路,正成为建设和完善数据要素市场的重要抓手,在一定程度上有助于解决数据权属界定、数据安全风险等问题,为培育数据要素市场提供了新模式。
保证数据安全流通
什么是隐私保护计算?中国信息通信研究院云计算与大数据研究所大数据部副主任闫树解释称,隐私保护计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合。从技术机制来看,隐私保护计算涉及三大技术体系的联合创新:一是人工智能算法,二是分布式系统和底层硬件,三是密码学协议设计。
隐私保护计算本质是以计算为目的的隐私协议设计,简而言之,就是实现数据可用不可见。北京瑞莱智慧科技有限公司CEO田天介绍,隐私保护计算有两层含义:数据的可用性与数据的不可见性。前者为实现计算逻辑的同时完成更复杂的互联计算,实现数据价值的转化和提炼;后者数据的流通和计算都基于密文数据而不是明文数据,很好地保证了数据的隐私安全性。
闫树认为,与传统数据使用方式相比,隐私保护计算的加密机制能够增强对于数据的保护、降低数据泄露风险。因此,包括欧盟在内的部分国家和地区将其视为“数据最小化”的一种实现方式。同时,传统数据安全手段,比如数据脱敏或匿名化处理,都要以牺牲部分数据维度为代价,导致数据信息无法有效被利用,而隐私保护计算则提供了另一种解决思路,保证在安全的前提下尽可能使数据价值最大化。
目前,隐私保护计算已经开始在不同行业进行初步应用,其中金融和医疗领域的应用场景相对成熟。杨玫介绍,国家医疗健康大数据的首批试点城市厦门,基于隐私保护计算建立了健康医疗大数据应用开放平台;在金融领域,依托隐私保护计算技术构建的风险控制模型,实现了跨行业数据链接,提升反欺诈能力,目前在互联网金融和消费金融方面得到广泛应用。
在政务方面,隐私保护计算技术为政务数据的开放提供了有效解决方案。目前,多地将隐私保护计算纳入数字化发展规划,将其作为促进数据经济的突破口,比如应用在数据流通和共享的交易所数字政府、数字社会建设等。广东省今年7月发布的《广东省数据要素市场化配置改革行动方案》中,就提出了构建包含隐私保护计算在内的新型数据基础设施;成都也将在全国率先建设基于超算中心的隐私保护计算平台。
规模化应用需平衡安全与性能
随着与数据相关的法规不断完善,各行业对合规数据流通的需求日益强烈,隐私保护计算市场迎来新机遇,但总体来看目前仍处于商业应用的初期阶段。闫树说,隐私保护计算在安全、性能和数据的互联互通等方面仍存挑战,这些难题在一定程度上限制了隐私保护计算的推广应用。
中国信息通信研究院今年7月发布的《隐私保护计算白皮书(2021)》中提到,隐私保护计算肩负着保护隐私数据安全的重要功能,而算法协议安全、开发应用安全和安全共识正成为当前隐私保护计算推广应用亟需面临的挑战。田天认为,发展瓶颈一方面在于隐私保护计算技术本身的安全不可论证,导致实际场景下存在被破解的可能性,另一方面加密状态下的数据可能导致系统出错。
如何验证隐私保护计算产品的安全性,目前尚缺乏规范标准和检验方法。闫树透露,中国信息通信研究院正积极探索建立涵盖主流隐私保护计算技术产品的系统性安全分级标准的可行性,推动形成行业信任共识,围绕算法安全、密码安全、通信安全、授权认证等关键要素,实现对隐私保护计算产品安全性的度量。
在安全的基础上,性能是衡量产品价值的关键。目前,国内隐私保护计算产品在特定场景下已基本具备可用性,未来面临更多数据方、更大数据量、更复杂场景时,性能等指标仍需进一步优化加强。
虽然隐私保护计算有望成为数据要素市场建设的关键基础设施,但若要真正成为核心底座,仍然任重道远。在闫树看来,隐私保护计算未来发展需对内实现互联互通,实现不同平台间的互认互用,破除平台壁垒,同时对外需加强隐私保护计算与人工智能、区块链、云计算等技术的交叉融合,实现新一代信息技术总体的价值释放。