文章来源:美国政府15大区块链医疗研究论文
翻译&编辑:Renee.Hu
OPAL/ Enigma挑战了安全模式
OPAL/Enigma概述
解决数据共享和隐私之间的紧张关系,以释放数据的潜在价值,是对医疗保健的挑战。虽然集中式的数据处理数据库在概念上更简单,但使用隐私最大化算法的分布式网络可以最大化数据处理的安全性,在没有当前分布式处理平台的有限可扩展性的前提下,符合HIPAA、保密和其他管理和伦理要求。
OPAL/ Enigma设想将数据存储库架构建立在P2P网络上,数据在其存储库中加密,这样原始数据就不会被释放。在存储和分析过程中,数据仍然是安全的,因为数据可以被查询,但只有通过由数字身份凭证执行的查询,才能通过具有法律约束力的智能合同定义的特定数据操作。记录数据和运算符之间通信模式的不可更改和可审计的记录,包括凭证和数据操作,创建一个分布式的加密分类帐,或许可的区块链。
在数据存储库节点的级别上,数据由Enigma加密,并在存储和计算期间进行加密,以防止内部数据被盗。数据存储库所有者控制对查询的回答粒度和隐私。OPAL算法通过使用分布式查询处理将查询和子查询发送到数据存储库,从而将算法“移动到数据”上,在那里进行计算,以便每个数据存储库只返回去识别的聚合结果。查询可以通过智能合约或查询智能合约(QSC)进行许可,从而在数据使用协议中合法地绑定Querier(人员或组织)、数据存储库和其他实体。QSC是一种在现有的信任框架内运作的机制,尊重参与实体的核心价值、责任战略和法律原则。它为区块链提供了一个保证,QSC被授予了一个可篡改的、可审计的身份和数据访问操作的历史。
OPAL/Enigma的数据层在P2P网络或区块链之上,Enigma同时使用两个加密结构(隐私共享和MPC),因此OPAL可以直接与QCS进行数据交换。
Enigma提供密码系统
麻省理工学院的Enigma系统是麻省理工学院“OPAL-EAST”计划的一部分。(公平、问责、安全和透明度的开放算法)。麻省理工学院的Enigma在P2P上同时使用了两个核心密码结构(P2P网络节点)。这些都是隐私共享(一个la Shamir的线性隐私共享计划(LSSS))和多方计算(MPC)。尽管隐私共享和MPC是过去二十年的研究课题,但麻省理工学院之谜带来的创新是在P2P网络节点上使用这些结构的概念(例如区块链) 在提供“mpc”(如工作证明)时,一个节点正确地执行了一些计算。
在隐私共享计划中,一个给定的数据项被“分割”成多个密文(称为“共享”),然后分别存储。当数据项需要重组或重建时,需要在反向加密计算中再次获得最小或“门槛”的份额并将其合并。例如,在海军术语中,这类似于需要3个键中的2个来执行一些关键任务(例如:激活导弹)。一些隐私共享方案具有一些基本的算术运算可以在共享上执行的特性。(将共享“添加”到共享),结果不需要首先完全重构数据项。实际上,该特性允许对加密数据执行操作(类似于同态加密方案)。
麻省理工学院的Enigma系统建议使用P2P网络节点来随机存储属于数据项的相关共享。实际上,数据所有者不再需要保存数据项的集中式数据库(例如健康数据),而是将每个数据项转换为共享,并在节点的P2P网络中分散这些数据项。只有数据所有者才能知道共享的位置,并可以根据需要从节点中获取这些位置。
由于每一种共享都以混杂的密文出现在节点上,因此节点对它们的意义或重要性一无所知。P2P网络中的一个节点将获得存储成本和存储/获取操作的报酬。在麻省理工学院的Enigma中使用的第二个加密结构是多党计算(MPC)。MPC计划的研究旨在解决一组需要共享一些共同的输出(例如计算结果)的实体的问题,同时保持他们的个人数据项的隐私。例如,一组病人可能希望通过协同计算他们的平均血压信息,但是不是每个病人都将分享他们血压信息的真实原始数据。
麻省理工学院的Enigma系统将MPC计划的使用与隐私共享计划结合在一起,有效地允许使用在P2P上分发的共享进行一些计算。这三种计算范式(隐私共享、MPC和P2P节点)的结合为解决当前关于数据隐私的紧迫问题以及在存储或处理大量数据的组织中不断增加的负债问题提供了新的可能性。
OPAL 提供智能合同查询
在PMI的广泛领域中,一个重要的问题是需要维护个人(例如病人)的个人隐私,同时能够对与这些个人有关的数据进行计算(例如统计分析)。在许多研究(例如临床试验)中,通常更重要的是获得综合答案,而不是针对一小部分研究参与者的狭义答案。
麻省理工学院(MIT OPAL/ Enigma)所倡导的一种范式转变是使用“预制”查询(例如,SQL查询),这些查询已经被专家分析过,并从隐私保护的角度被审查为“安全”。“开放算法”(OPAL)这一术语意味着,通过发布这些查询(“算法”),允许其他专家对其进行审查,并允许其他研究人员在他们自己的研究环境中使用它们。
开放算法范例的下一个步骤是使用智能合同以可执行查询的形式捕获这些安全的算法,这些查询位于具有法律约束的数字契约中。查询智能合同将会要求查询器授权要求被编码到合同中并被记录到区块链上。一个经过审查的查询智能合同可以安全并由专家签名,可以存储在节点上。因此,寻求查询的实体可以找到与预期应用程序匹配的预制安全QSCs
网络
P2P网络包含数据存储库节点,其中数据被输入、加密、存储和分析。一般来说,标准化的互操作性在以后的发展中将成为数据交换的一个特性,正如在后面的讨论中提到的,许多电子健康记录都是遗留系统,它不提供与标准化API的互操作性,并且将使用替代方法来预测标准化。在处理能力有限的服务器上,节点可能是一个分区。
P2P网络中的委托节点可以有效地降低处理能力,它通过定位相关数据存储库来处理查询或子查询, 向每个数据存储库发送适当的子查询,并从这些数据存储库接收单个答案并对从这些数据存储库接收的结果进行排序,以便向查询器报告。委托节点保证了QSC的所有条件都得到满足 (例如,QSC 有有效签名; 查询器的身份被建立; 已经获得了在数据存储库中访问API的授权; 如有薪酬计划,付款条件已达成等). 委托节点的层次结构可能涉及从查询实体发出的给定查询的完成。QSC节点将维护审查的QSCs和函数作为查询的起点。
所有QSC节点将维护分类账的分布式副本; 更多的节点可以维护分类账,但需要进一步的开发来确定适当的冗余平衡,以确保协商一致作为一种安全的方式,以确保网络与效率之间的关系,以及安全与效率之间的平衡,以建立工作证明。由于OPAL/Enigma目前正在开发中,但可能的限制将是计算费用和互操作性,因为相对于其他行业来说,在医疗保健IT方面缺少标准化的api,这凸显了ONC任务的重要性。
未完待续
领取专属 10元无门槛券
私享最新 技术干货