请输入关键字

临床大数据应用平台

[ 2021-04-29 02:18 ]

一、建设背景和意义

医疗信息化的迅速发展使医疗数据呈指数型增长,医院的信息系统存储了海量临床数据和医院的运营数据,蕴含着大量医生的治疗经验、创新性的疾病诊疗方法和宝贵的医院管理经验沉淀。数据是当今时代智慧医疗的核心所在,临床研究需要大量高质量、标准化的可用数据作为基础。国务院办公厅印发的《关于促进和规范健康医疗大数据应用发展的指导意见(国办发〔2016〕47号)》提出:推进健康医疗临床和科研应用;系统加强临床和科研数据资源整合共享,提升医学科研及应用效能,推动智慧医疗发展。2020年3月4日,中共中央政治局常务委员会召开会议,会议强调,要加快5G网络、数据中心等新型基础设施建设进度。2020年3月30日,数据作为重要的生产要素也被写进了《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》。

随着国家对医疗大数据的高度重视与研究型医院的实际发展需要,我院构建了以临床科研需求为导向的全院级科研大数据平台,旨在加强医疗数据资源整合共享,为临床科研人员提供高质量、可利用的数据,推进医疗数据在临床科研中的深入应用。全院级科研大数据平台的建设为我院基于大数据的高水平科技攻关提供高质量数据基础,进一步提升临床科研效率和质量;同时,能够在确保数据安全、合规利用的基础上,从全院视角对临床科研数据进行管控。

二、建设目标

根据医院信息系统的建设现状,以患者为中心,将散落在各系统中的患者数据采集后,汇聚到统一的平台中,以临床科研需求为导向,完成清洗、结构化、模型转换等数据处理,串联患者的完整诊疗信息,形成有价值、可被利用的数据资源。全院级科研大数据平台的建设旨在全面盘点医院数据,提高数据获取效率,为临床研究提供数据支持;同时,实现全院视角下的数据可视化管理。

三、建设内容

1.基于医院数据和医疗行业的特点,遵循医院数据治理的通用规律和思路,建立医院数据标准、设计临床科研数据通用模型(Common Data Model,CDM)。

2.多源异构数据的采集。使用ETL技术将数据从多个不同的数据源经过抽取、转换、加载至目标数据库。

3.数据汇聚、映射和清洗。将HIS、LIS、EMR、RIS、PACS等系统的原始数据映射到统一的数据模型上,并通过定义标准的数据类型、完整性约束、安全性定义和清洗函数规则等对数据进行清洗。

4.数据结构化等深度加工。使用自然语言处理技术(Natural Language Process, NLP)对文本病历数据等大量非结构化数据进行结构化处理,从而将这部分数据在一定程度上变成可二维展现的数据,提高数据的可利用性。

5.数据质量管理。制定数据质量评估标准,并对数据进行完整性、准确性、唯一性、一致性和及时性校验等。

from clipboard

图 北京大学人民医院科研大数据平台的建设

截至目前,该平台共计累积了我院自2004年以来的1300万余名患者的5000万余次就诊数据;旨在保障数据安全、合规、可靠的前提下,为临床科研人员提供可查询、可提取,且准确、完整、真实的医疗数据,推进医疗数据在临床科研中的深入应用。

 

地   址: 医院地址(西直门院区):北京市西直门南大街11号
邮编:100044

官方APP

微信