利用区块链进行数据安全共享的思考

摘要

数据安全共享问题、数据孤岛的问题有解了,那就是利用区块链。

利用区块链进行数据安全共享的思考

在同行业机构间进行数据共享时,存在“数据孤岛”问题,最重要的是要保证数据的安全性,在杜绝复制泄露的基础上才有可能建立一个互信共享的数据平台。这也是一个重要并且典型应用区块链技术的方向,也就是当前AI+大数据+区块链的结合趋势,区块链作为底层平台为大数据及AI所需的数据源提供可靠保障。

当前,各家的数据基本都是在自己的域中跑,每个平台都只拥有自己的一部分信息,而非全面信息,各行业机构之间也是如此,想要打通数据间的连接,进行数据共享,实非易事。因为数据目前已成为平台或企业的核心资产和财富,没有人真的愿意共享。即使是交换数据,一些机构也会有意或无意地提供一些低质量的数据。当数据质量得不到保障时,再好的数据模型,也无法得出正确的结果。总而言之,数据共享在互联网架构下是无法得到很好解决的,因为数据是可以轻易地进行复制、传输的,无法保障数据安全。因此,以数据为核心资产的平台同行业间共享数据是存在极大风险的。

区块链及加密技术的发展,为解决这个问题提供了一些新方案,比如由区块链提供一个可信的“黑盒”,大家可以把自己数据放心地放进去,不用担心被复制或泄露;或者将双方数据共享前先加密,再进行计算,计算结果也是密文。像这样的方式既可以完成必要的数据共享、安全计算,又不会使数据或者模型泄露给其他人,从技术上有效解决这个问题,相关数据拥有方的合作动力应该会更大。

在数据共享场景中,诸多“数据共享联盟”间能否形成一个类似“数据市场”,一方是数据、算法模型的提供者们,另一方是数据、算法模型的买者们。基于区块链的数据市场可以有效避免数据的泄露复制,在区块链的保护下,安全地共享数据,并且利用区块链中的智能合约去自动执行一些逻辑,比如无可争议地去统计使用情况并计价或者进行数据交易。

区块链解决方案

关于数据安全共享,可以有几种区块链技术方案:

①同态加密

②零知识证明

③多方安全计算(MPC)

④可信执行环境(TEE硬件)

其中,①-③是密码学技术,④是一种与CPU硬件结合的技术,现较为成熟的是同态加密以及TEE技术。

举例:

密码学技术解决示例,一种方案思路:

利用区块链进行数据安全共享的思考

在该数据生态当中有众多参与者,每个用户都需要在区块链平台注册,并分配相应的公钥与私钥,区块链平台拥有每个参与者的公钥以及数字证书,因此可以轻松验证任何授权用户的交易,这是数据权限管理的关键。原始数据始终归自己私有,不上链亦不出域,链上只存储数据的地址,区块链通过请求者要求找到数据地址,并向该数据拥有者请求数据。假设有机构A、B、C各自持有数据,A发起共享请求,当A需要B的数据进行数据共享计算时,请求者A发出请求交易并附上自己的公钥A。当区块链平台收到此交易请求后,验证该请求者,若不是合法用户,拒绝交易。若通过验证,则通过智能合约查询该数据的地址。当合约查询到数据地址是B时,向其请求数据。数据拥有者B通过在其数据库中检索查询到数据,此时,B用自己的私钥与请求者A的公钥生成重加***,该**用来加密从数据库中取出的明文数据,通过加密生产加密数据并返回给区块链。区块链收到加密数据后再次请求B的私钥以及B参与计算的数据,同时开启加密计算子链,该子链只用于安全计算,不被链上任何参与方所知晓,它有着极高的计算效率与较少的共识验证,保证计算任务的高效完成,完成任务后自动销毁。当加密计算子链完成计算任务后将计算结果返回给主链,链再整合其他方的计算结果并将汇总计算结果返回给A,完成整个计算任务。在整个区块链系统中,使用智能合约对数据的使用情况进行统计及估价,若引入通证激励模式,可让贡献数据者自动获得相应的通证奖励,形成具备*规则的数据市场。