国内首家医疗大数据实验室成立,分析药物副作用就靠它了

出品:“科学与中国”院士专家巡讲团

制作:中国科普博览

监制:中国科学院部工作局 中国科学院计算机网络信息中心

近日,医疗大数据应用技术国家工程实验室在北京解放军总医院正式成立,该实验室系国内首家医疗大数据应用创新研发平台。

医生诊断疾病的过程实际上是一个小数据的关联,医生根据病人的自述、检验数据、以及影像信息和自身经验,分析病人可能患有什么疾病。但是这存在着一定的局限性,因为数据量过少会导致复杂疾病诊断困难。

随着技术的发展,我们希望利用成千上万病人的数据进行关联分析,因为有效提高疾病诊断准确度,对于流行病的预测、确定治疗方案、药物作用分析等均具有重要的意义。

目前医院数据的现状存在着一定的问题。首先医院信息系统较多并且相互独立,检验设备种类多,接口与数据的格式均不相同;其次数据涉及到病人的个人隐私,不方便处理;同时医院的管理与医生的阻力对数据的采集造成了困难。

从数据类型来讲,医疗数据包括两类,其一是结构化的数据,比如规范化的表格,另一类是非结构化数据,包括电子病历,每个医生的表述都不相同。

因此,医疗数据具有大数据特征。首先,它的数据量非常大;其次,数据是实时的,医生在不断地看病,数据量在不断地递增;再者,数据具有多样性,结构化数据表、非(半)结构化文本文档、医疗影像等等都具有多样性;同时,医疗数据中隐藏着大量含有价值的数据等待着我们去挖掘。

最后,我们想做的是基于医疗数据的药物副作用研究,药物副作用是指在临床用药过程中,使用单种药物或者两种以上的药物可能引起的病人的不良反应。据文献统计,药物不良反应的发生率在门诊病人中是0.3%至5.0%,而在住院病人可以达到10%至20%。借助电子病历或者说借助大数据对药物副作用进行分析具有非常重大的意义。

“科学与中国”院士专家巡讲活动是中国科学院学部发起,由中科院、中宣部、教育部、科技部、工程院、中国科协共同主办的高层次公益性科普活动。精彩内容关注“科学与中国”官方网站(cs.kepu.cn)。中国科学院学部工作局为网站委托单位,中国科普博览为网络传播合作伙伴,中国科学院计算机网络信息中心提供技术支持。