您的当前位置:首页正文

基于区块链技术电子健康档案分布式存储方案的探讨

来源:爱够旅游网
Chinese Journal of Health Informatics and Management, Oct. 2019, Vol.16, No.5 中国卫生信息管理杂志2019年 10月第16卷第5期应用doi:10.3969/j.issn. 1672-5166.2019.05.023基于区块链技术电子健康档案分布式存储方案的探讨严梦①袁玉堂①刘智勇①彳1672-5166 (2019)05-0623-05 中图分类号:R-39; R319 文献标志码:A摘要利用基于区块链技术的星际文件系统构建一种去中心化的电子健康档案分布式存储方案。实现用户 持有自己的电子健康档案,保护用户的隐私,保证电子健康档案的完整性、真实性和稳健性,从而促进电子

健康档案的利用。关键词 区块链 星际文件系统 电子健康档案Discussion on Distributed Storage Scheme of Electronic Health Record Based on Blockchain TechnologyYAN Meng, YUAN Yutang, LIU ZhiyongTongji Medical College of Huazhong University of Science & Technology, School of Medicine and Health Management,Wuhan 430030,Hubei,ChinaAbstract This paper describes how to use a blockchain-based interplanetary file system to build a

decentralized electronic health record distributed storage scheme. It enables users to maintain their own electronic health records, protect user privacy, and ensure the integrity, authenticity, and robustness of

electronic health records, thereby facilitating the use of electronic health records.Keywords blockchain; IPFS; EHR0引言电子健康档案(electronic health record.EHR),是以电子化方式存储和管理的有关个人整个生命周期健 康状态和医疗保健行为的信息记录,包括从出生开始的体检结果、计划免疫记录、既往病史、各种检验检

查、治疗记录、药物过敏史、行为危险因素和参与健康教育活动的记录等,满足居民自我保健、健康管理和 健康决策需要的信息资源一畫电子健康档案具有提高健康档案信息的完整性和准确性、提高医疗服务的质

量和效率、促进健康档案信息的共享、满足公共卫生管理需要、优化医疗资源配置、减少医疗卫生支出等作 用少役目前的EHR存储方式是中心化的数据库存储,EHR面临着稳健性、安全性和个人隐私保护的问题。 区块链技术通过数字签名、包含前区块hash的链式结构和共识机制,共同保证交易数据的完整性、不可否①华中科技大学同济医学院医药口生管理学院,湖北省武汉市,430030作者简介:严梦(1996—),女,硕士研究生;研究方向:卫生健康信息化;E-mail: 695180111@qq.com通信作者:刘智勇(1974—),博士,副教授;研究方向:卫生健康信息管E-mail:zhiyongliu@hust.edu.cn △通信作者623©中国卫生信息管理杂志2019年10月第 1 瞇第5期 Chinese Journal of Health Informatics and Management, Oct. 2019, Vol. 16, No.5@ 中国卫生信息管理 / CHINESE MURNAl OF HEAITH INFOHmmCS AND imAGEMENT认性和安全性固。本文结合区块链技术,提出一个电子 健康档案分布式存储方案,从而保证电子健康档案稳健

性、安全性和个人隐私,探讨如何促进电子健康档案的

利用。1区块链技术2008年,中本聪(化名)在密码学邮件组发表的

论文首先提出了区块链技术冏。狭义上的区块链技术是 一种通过密码学将数据块按照时间序列以链条的方式

存储,形成不可篡改和不可伪造的数据结构,采取点

对点(Peer-to-peer, P2P)协议将该数据去中心化地 存储在网络的节点,利用共识算法更新数据的共享总

账广义上的区块链技术是通过加密技术和区块链 式结构验证与存储数据,通过分布式节点共识算法生成 和更新数据,通过自动化脚本代码(智能合约)操作数

据的去中心化基础架构与分布式计算范式回。区块链技

术的基础是链式的数据存储结构,基于加密算法的身份 验证机制、共识算法的数据更新机制和P2P协议的去 中心化架构。1.1区块链结构区块链由一个个区块(block )组成。区块是应用具 体场景下一系列数据的集合,是区块链的基本单元,由

区块头和区块体组成。区块头包含了前驱区块哈希、基 本信息部分和梅克尔树根哈希。区块体存贮着具体的数

据,例如:加密货币就是交易信息。区块链通过区块头

中前一区的哈希值将区块链接形成一条链,这种链式结 构保证了数据的完整性。1.2非对称加密及哈希算法非对称加密算法和哈希算法是区块链技术的基础, 保证了去中心化非信任网络数据安全和身份验证的需 求。哈希算法用于生成前区块地址、记录信息摘要、

用户地址和构造梅克尔树数据结构等。非对称加密算 法应用于认证、数据加密和签名。常用的非对称加密

算法有 RSA、ElgamaK 背包算法、Rabin、D-H、

ECC 等。@6241.3共识机制共识机制保证数据增加的有效性。所谓共识就是大 家决定网络上哪些链是真实的,以及数据的增加是否有 效。因为记录可以溯源,所以区块上的旧数据通过溯源

来验证有效性,但新数据的产生需要大家达成共识,只 要网络上认同新数据的产生,那么这个数据就有效,这

里认同的方法就是区块链的共识机制。目前,区块链 上采用的共识机制有工作量证明机制(proof of work,

PoW)、权益证明机制(proof of stake, PoS)、拜占庭共

识算法(practical byzantine fault tolerance, PBFT )o1.4去中心化网络结构区块链的节点间通过两两互联(P2P )形成一个巨 大的网络结构。每个节点都可以参与数据更新和身份验

证功能,通过每个节点的验证确定数据的真实性,确保 信息在网络传播的稳健性和可靠性。节点可以自由加入 网络中,节点的加入或者离开不影响网络使用。目前,

根据节点的特征可以将区块链分为共有链、联合链和私 有链。1.5 星际文件系统(Interplanetary File System, IPFS)IPFS是一个点对点的分布式超媒体分发协议,用

基于内容的寻址方式替代传统的基于域名的寻址方式, 是一种永久的、去中心化保存和共享文件的方法“I

IPFS对文件内容进行哈希运算,用生成的哈希值来标

识文件,以哈希值寻找文件,而不是通过文件的存储地 址来获取文件。IPFS存储的文件类型和文件大小都不

受限制,大的文件可以分割成更小的数据块利用点对点

的协议存储在网络上,保证了文件存储的去中心化。文 件的内容不能发生改变,如果发生改变,文件的哈希值

相应发生改变,那么文件地址(IPFS地址)也发生改变。 本方案利用IPFS文件系统来存储电子健康档案,实现

了数据分布式去中心的存储,利用文件IPFS地址构成

链式结构。2基于区块链的分布存储方案目前,个人健康档案归属于每个卫生机构,给个人Chinese Journal of HeaHh Informatics and Management Oct. 2019, Vol. 16, No.5 中国卫生信息管理杂志2019年10月第1 绥第5期\\APPLMMnOH OF NHMTECHMIUIGY 新技术臥健康档案的共享造成许多隙碍。本文所探讨的个人电子 健康档案的分布式存储方案,实现了每个人拥有自己的

电子健康档案,每个用户的电子健康档案以一条链的方 式存储。只有电子健康档案所有者才具有增加健康档案

数据的权利,其他个人或者机构只可查询,如果查询方 需要写入数据,需要向电子健康档案增加数据时,必须

将数据传输到电子健康所有者(用户),用户加密后才

能将数据增加到链中。总体结构见图1。医务工作者图1基于区块链分布式存储总体结构2.1用户的产生与证书的申请本方案中用户的角色只有两类:电子健康档案的

所有者一用户;电子健康档案的查询者一医务工作 者。用户广义上可以认为是任何一个人,只要拥有电子 健康档案的人都是用户;医务工作者是与健康相关的所

有工作人员,例如医生、护士、研究者、管理者等等, 只要是有査询电子健康档案需求权利的人都可以归

为这一类人员。广义上还包括有查询或者向用户发送需

要,添加健康信息的察物,例如经过认证的医疗设备。

不管是用户还是医务工作者,用户的产生都是利用非对 称加密算法制作出的公钥和私钥,公钥为用户身份的唯

一标识,私钥实现身份验证和数字签名。医务工作者也 具有自己的健康档案,同时也具有公钥和私钥,医务工 作者提交自己的公钥和相关认证资料向卫生行政部门的

身份认证机构(CA )申请数字证书,通过数字证书证实 医务工作者的职业身份。用户从CA获取根证书用来验

证医务工作者的数字证书有效性。2.2电?档案区块的根据区块链中区块的结构,电子健康档案的存储方

式也以区块的链式结构存储何。本方案中电子健康档 案的区块是以文件的方式存储在IPFS网络中。电子健

康档案区块的基本结构是区块头与区块体,区块头包含

了该区块的特征信息,区块体包含具体的健康活动信息

和电子健康档案的操作信息。区块头信息包含前一区块 的哈希值(前一区块文件IPFS地址}、用户公钥、时间

戳、区块数、数字签名信息和区块体加秘密信息。区块 体是对健康活动信息和操作曰志对称加密后的密文。区

块文件中前一区块IPFS地址将区块文件链接成_条链, 将1个用户的健康档案保存下来,第一个区块文件不

包含前一区块IPFS地址,区块体的内容是加密后的用

户身份等基本信息和操作日志,其他的区块主要保存着 健康活动信息和区块的操作日志信息。操作日志仅仅包

括区块写入和读取的信息,因为区块体的写入和读取是

一个加密和解密的过程,所以日志也可以说是区块体加 密和解密的记录信息,其他查询但没有解密的过程不记

录。区块文件名是以一定加密算法将用户的公钥加密后

和文件创建时间组成的字串;时间戳表示是该区块形成 的时间;区块数表示该区块在链中所在位置;数字签名

信息是用来验证文件有效性和完整性的信息;区块体加 密信息是通过用户公钥为对称加密密匙加密后的密文信

息o见图2o前一区块IPFS地址用户公钥区块头时间戳区块数数字签名信息区块体区块体加密密匙信息对称密匙加密健康信息和操作日志后的密文图2区块结构2.3区块文件签名与验证过程数字签名信息的作用证明该区块所有者是用户自625中国卫生信息管理杂志2019年10月第16®第5期 Chinese Journal of Health Informatics and Management, Oct. 2019, Vol. 16, No.5@ 中国卫生信息管理 /(MHimMHWIHWlOFHMnHHIFORMATHSANIlUUlAGEIEMT己,而且保证区块体的信息没有被修改过。区块形成的 时候,区块体的信息首先经过一次对称加密的方式(加

密解密为同一密匙)将区块体的信息加密,然后采用单 向哈希函数对密文进行运算得到数字摘要,最后使用用

户私钥对数字摘要进行加密,从而形成数字签名信息。 验证过程首先对区块体进行哈希运算得到区块体的数字 摘要,然后使用用户公钥解密数字签名信息,得到信息图3文件的签■名与验证过程2,4区块文件写入过程区块的写入过程主要是按照区块数据的结构,利用 不同算法将信息写入IPFS网络中。首先,应用非对称 加密算法为每个用户制作出公钥和私钥,并以此为基础 实现数据的操作。本方案中的文件使用json文件的方 式进行存储。json文件是一种轻量级的数据交换格式, 易于人阅读和编写,也易于机器解析和生成,体积相对

较小利于数据传输效率。对称加密的密匙使用随机函数 的方式产生密匙,产生密匙后使用用户公钥加密形成 区块体加密密匙信息。然后,使用数据加密标准(data

encryption standard, DES )算法对健康活动信息和操

作日志进行加密写入区块体。IPFS网络中文件是基于

内容寻址的,只要内容相同就认为是一个文件,文件名 可以不同,还会出现相同文件名内容不同的情况。为了 方便文件管理,本方案可采取两种方式确定文件名:第

一种以用户公钥哈希运算后结合时间形成区块名,文件 的验证利用区块头的信息进行验证;第二种以用户公钥

@626哈希运算后结合时间再结合数字签名形成文件名,文件

的验证利用文件名签名信息进行验证。第一种需要打

开文件进行验证,第二种文件名太长且存在两次验证, 消耗计算资源,所以最后采取第一种文件名命名的方

法。最后,使用IPFS的应用程序编程接口( application

programming interface, API)将文件添加到 IPFS 网络

中。区块的增加在其他区块链应用中就是共识的过程,

例如比特币等加密货币中新的区块采用PoW的共识机

制添加新的区块。但是本方案中新区块的产生必须由这

条链的所有者才能增加,所以本方案中的共识机制与加 密货币的共识机制不同,只要是区块链的所有者添加区

块,那么网络上所有的节点自动添加这个区块。区块文

件的写入过程见图4。图4区块文件写入流程2.5医务工作者与用户信息交互过程本文所讨论的方案中电子健康档案的区块文件不能

修改,不能删除,只有用户具有写入新区块的权利。医 务工作者只能从IRFS网络中获取加密的密文,通过向 用户申请密匙,经用户同意后,用户利用自己的私钥将

区块链上的区块体加密密匙信息解密,形成一串对称加

密的密匙,然后将这串密匙发给医务工作者,医务工作 者利用这串密匙解密从IPFS获取的电子健康档案密文。 非对称加密的计算量较大,不适于大的数据加密和解

密,本方案中仅仅是为对称加密的密匙经行加密,减少

运算量。区块体使用对称加密的方式也减少解密和加密 运算量。医务工作者端解密为一次性过程,解密过后密 码立即销毁,解密后的信息可以根据具体业务需求设定

保留时间,但不会造成信息外露。在健康活动中,医务 工作者需要增加新的健康信息,这时就需要按照国家相Chinese Journal of Health Informatics and Management, Oct. 2019, Vol.16, No.5 中国卫生信息管理杂志2019年10月第 16卷第5期XJPPU^TI^FNEWJEgHN^Yj^^ 应用关的电子健康档案标准将数据发送到用户端,用户对接

存储,密匙产生后需要进行备份,要加强密匙管理,防

受的信息经行验证后,自行写入IPFS网络中。止密匙的泄露。本文探讨了基于区块链的电子健康档案分布式存储

2.6 PFS网络的管理方案,实现了用户真正拥有自己的健康档案,保护了用 IPFS网络目前是免费、公开的去中心化存储网络,

户的隐私,保证了电子健康档案的完整性、真实性和稳

任何人可以添加任何文件,但也提供了私有化节点的设

健性。方案中所采用的技术目前比较成熟,基本上可实

置。为了更好地保护用户健康档案,本方案采取私有化 现方案的相关功能。但是方案中对用户端和医务工作端 节点的设置,将节点列表修改为私有节点,节点必须是 的功能探讨比较简单。后期的研究要解决用户端及医务 经过卫生行政部门认可的稳定节点,可以建议所有医疗

工作端的功能实现。该方法对于公共卫生服务方面探讨

卫生机构的数据中心提供节点服务器,同时要从地域上 还比较欠缺,如何解决人群健康档案管理及卫生统计方 和数量上保证充足的节点,节点列表需要卫生行政部门

面的需求,仍需要进一步探讨。■进行管理和维护。参考畑2.7区块文件的管理[1] Boaden R, Joyce P. Developing the electronic health record:

what about patient safety?[J]. Health Services Management

IPFS文件系统中,存储在IPFS网络中的文件都具

Research, 2006,19(2): 94-104.有一定元数据,这些元数据包含了文件名、建立时间、 [2] 董建成.医学信息学概论[M].北京:人民卫生出版社,

大小、类型等一系列信息。目前,已有一些IPFS文件

2010: 1-290.检索的工具,基本上都是以这些元数据为基础,所以本 [3] 兰蓝,周光华,范志伟,等.电子健康档案应用现狀分析[J].

方案中的区块链的文件也可以使用这些检索工具,利用 中国卫生信息管理杂志,2016,13(6): 565-568.检索工具可以帮助医务工作者快速找到每个用户链最后

[4] 姚忠烙,葛敬国.关于区块链原理及应用的综述[J],科研信

一个区块文件,从而检索出用户完整的链。息化技术与应用,2017,10(2): 3-17.[5] 肖兵,梁娜,张远鹏,等.区域全民健康信息平台应用情况

3结语分析[J].中国卫生信息管理杂志,2019,16(3): 314-317,326.[6] Nakamoto S. Bitcoin: A peer-to-peer electronic cash system卩].

区块链是数据存储的一种新形式,可以解决信息安

Consulted, 2008.全和用户隐私等问题,目前IPFS网络处于测试阶段, [7] 袁勇,王飞跃.区块链技术发展现状与展望[J].自动化学报,

技术上已经接近成熟,但是网络的节点数量还不丰富。

2016,54(4):481-494.另外,一方面由于居民电子健康档案的特殊性,虽然本 [8] 陈荃,刘硕,雷行云,等.我国区域人□健康信息化评价

文设计上认为电子健康档案的所有权属于居民,但是卫

体系构建与指标筛选[J].中国卫生信息管理杂志,2018,

生监管部门有监管的义务,所以采用了由卫生机构所有

15(3):278-282,296.的私有链的部署方式,也就是网络上同步节点由卫生机 [9] 计虹,贾末,孙震.依托互联互通路径提升医院整体信息化

构组建,这时就要面对机构间合作的问题,以及节点配

水平[J].中国卫生信息管理杂志,2018,15(4): 373-377.[10] Benet J. IPFS - Content Addressed, Versioned, P2P File

置的问题;另一方面,就是需要管理用户密匙的问题, System[EB/OL].[2018.04.15]. https://github.com/ipfs/ 新的加密技术的应用增加了用户操作的难度,以前是用 ipfs/blob/master/papers/ipfs-cap2pfs/ipfs-p2p-file-system.

户自己管理密码,但是密匙是一串随机字符,不好记

pdf?raw=true.忆,这时需要将密匙转换成电子或者物理存储方式进行[收稿日期:2019-08-02 修回日期:2019-08-30]62\"

因篇幅问题不能全部显示,请点此查看更多更全内容