成都市软件和信息技术服务业门户网站

  • “成都软件”微信公众号

  • 扫一扫 下载app

当前位置: 网站首页  >> 新闻中心  >> 产业评析

2018 医疗大数据产业报告

前言

来源:动脉网蛋壳研究院

近年来, 健康医疗大数据相关产业已经被列入国家大数据战略布局, 和医疗健康大数据相关的政策频出。 在众多健康医疗大数据相关政策中, 其中比较著名的是 2014 年国家卫计委制定“ 46312”工程,即建设国家级、省级、地级市、县级 4 级 卫生信息平台, 构建电子监控档案数据库、 电子病历数据库、 全员人口个案数据库 3 个数据库, 建立一个安全的卫生网络, 加强卫生标准体系和安全体系建设。

2018 年 9 月 13 日,国家卫生健康委印发了《 国家健康医疗大数据标准、安全和服 务管理办法( 试行)》, 对医疗健康大数据行业从规范管理和开发利用的角度出发进行规范。《 办法》 从医疗大数据标准、 医疗大数据安全、 医疗大数据服务、医疗大数据监督四个方面提出指导意见, 直击目前医疗大数据领域的痛点, 未来对数据的统筹标准管理、 落实安全责任、 规范数据服务和管理具有重要意义。

本报告从医疗大数据行业的市场出发, 收集了国内参与医疗健康大数 据的561 家企业的资料,从细分领域、大数据价值、大数据作用等维度进行梳理,分析医疗大数据的发展阶段和行业现状。

目录

第一章汹涌而来的大数据洪流

第二章医疗大数据沙漏模型

一、什么是医疗大数据

二、医疗大数据沙漏模型

三、医疗大数据的四大特征

四、顶层设计支持医疗大数据发展

第三章医疗大数据的采集

一、医疗大数据的分类

二、医疗大数据来源详解

1.电子病历数据

2.检验数据

3.影像数据

4.费用数据

5.基因测序数据

6.医药研发数据

7.药品流通数据

8.智能穿戴数据

9.移动问诊数据

10.体检数据

第四章治理数据形成知识

一、医疗大数据应用的主要挑战

二、大数据的治理

图片来源:阿里云

第五章行动——医疗大数据的价值输出

一、临床诊断辅助系统

二、医生辅助工具

三、慢病管理

四、保险

五、医药研发

六、医院管理决策辅助

七、健康管理

八、智慧养老

九、药企市场营销

十、基因大数据

第六章医疗大数据企业市场分析

一、医疗大数据企业市场布局

二、医疗大数据行业发展难点

三、医疗大数据产业目前处于发展的第二阶段

第一章 汹涌而来的大数据洪流

人类的任何表现和行为都可以产生数据,只是之前这些体征和行为并没有被合适的设备数字 化,并收集和存储起来。21 世纪初,随着信息化技术的普及,人们已经关注到数据所能带来 的价值。此时所产生的数据,局限于计算机平台和互联网。此时所能收集的,也只是人类在互 联网环境中所产生的部分数据。

大数据,顾名思义就是数量非常庞大的数据。对这些数据进行合理的应用,同时挖掘出价值, 也就形成了大数据产业。

随着传感器技术的进步、数据处理能力的增强、计算和存储成本的降低、网络的扩大,使得数 据的收集、存储和分析能力不断提升。特别是进入万物智能互联的新时代之后,产生数据的终 端越来越多,也越来越智能。现在,数字化技术已经无处不在。同时,产生数据的主体也不再 仅仅是人,还有物体。各个细分行业、经济体、传感器、个人无时无刻不在产生数据,而且消 费者也正在从这些数据中受益。因此,在 2010 年前后,互联网开始出现了汹涌而来的大数据洪流。

从上世纪 80 年代开始,每隔 40 个月,世界上存储的数据容量就会翻倍(Hibert & Lopez,2011)。 IDC 在 2014 年的一份报告中提供了一份数据,2013 年全球数据总量达到了 4.4ZB,而从 2013年发展到 2020年,全球数据总量将会增长 10 倍,达到 44ZB。越来越多的数据产生设备通过 互联网传至数据存储商。数据量的爆发增长,首先为数据存储商带来了商业机会,营收也大幅 度增加。其次,大数据在经过价值挖掘之后,还能为经济发展提供显著的动力。

这些数据来自哪里?每天有超过 9 亿的微信、4 亿的微博、20 亿的推特等社交软件的活跃用户在产生数据,每天还有 348亿 RFID设备、60亿台智能手机、数亿台支持 GPS的设备在产生数据。数据的产生源和单一数据的量级都在无限扩大。移动电话、智能手表、摄像头、音频设 备、定位设备被大量使用后,它可以方便地对人体和环境进行感知,将数据收集起来在互联网 上传送。通过工具捕获、存储、加工、管理和分析大数据之后,形成了新的大数据产业。从大 数据中萃取洞见来辅助决策,已经在各行各业发挥着重要的经济价值。数据可以为各行各业的 行为提供指导,提高效率,创造经济价值。

从产业层面来看,全球大数据领域的相关公司都在快速发展,中国信息通信研究院预估我国大 数据领域 2017年的产业规模为 4700 亿元,增长率约 30%。其中,大数据软硬件的产值约为

234 亿元人民币,增长率约为 39%。

如此巨量的数据,里面存在着宝藏,也充斥着大量的垃圾。IDC 的报告显示,有意义的数据只 占全球数据量的 1.5%。大数据的价值还需要深入的挖掘,才能将其发挥出来。大数据就像是石 油,没有经过开采的原油埋藏在地里,就不会产生价值。但是,数据原油在经过加工和提炼之 后,所产生的知识沉淀,将会对全球经济的发展提供巨大的助力。而如今,医疗大数据领域也 已经开始进入到价值输出时代,在诊疗、医院管理的过程中发挥着重要的价值。

早期,IBM定义了大数据的特性有 3 个:大量性(Volume)、多样性(Variety)、快速性(Velocity)。 后来,对大数据的特点描述经过专家的进一步完善,总结为六个特征。

高容量:数据的总容量大,单一数据集的数据总量在几十 GB,甚至几十 TB之间。未来,随着 采样率的提升,单一数据集的总量还会持续上升。

多样性:数据种类丰富,文本、日志、图片、视频等等,数字化和模拟化,结构化和非结构化 数据都有。

快速性:数据的创建速度快,更新频率快。很多数据的采样时间已经从周、月升级到分、秒, 甚至是连续性数据。同时,数据的转移速度快,也需要快速实时处理。

易变性:大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。相较传统的业务 数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。

准确性:大数据可利用的基础是数据的准确性,大数据分析的前提是准确性要得到保证。数据 质量不高,会造成数据分析质量低下。

复杂性:数据量巨大,来源渠道多,数据的管理和操作复杂程度高。想要提炼出数据的有效价 值变得挑战性巨大。

大数据从哪里来?到哪里去?本报告将从医疗大数据这个细分领域,去探讨医疗大数据的流向 和价值输出,了解医疗大数据从产生、挖掘、治理、价值利用的全过程,让我们对医疗大数据 行业产生全面的认识。

第二章医疗大数据沙漏模型

一、什么是医疗大数据

医疗大数据是指个人从出生到死亡的全生命周期过程中,因为免疫、体检、门诊、住院等健康 活动所产生的大数据。

通过对医疗大数据的分析和加工,可以挖掘出和疾病诊断、治疗、公共卫生防治等方面的重要 价值。医疗大数据的应用并不仅仅是在信息化时代才出现。早在 19 世纪,英国流行病学家、麻醉学家约翰·斯诺(John Snow)博士运用近代早期的数据科学,记录每天的死亡人数和伤患 人数,并将死亡者的地址标注在地图上,绘制了伦敦霍乱爆发的“群聚”地图。霍乱在过去被 普遍认为是由“有害”空气导致的,斯诺通过调查数据的汇总,确定了“霍乱”的元凶是被污 染的公共水井,并同时奠定了疾病细菌理论的基础。

从最早的手工统计,到计算机的出现,再到各种传感器技术的普及。数据的收集和存储更加方 便,变成了自动化、数字化、密集化的方式,来源也越来越广。在过去的十年里,随着电子病 历的实施,数字化的实验室幻灯片,高分辨率的影像图片、视频,医疗保健数据量呈指数级增 长。再加上制药企业和学术研究机构档案,以及数万亿的数据流从智能化设备、可穿戴式设备 的传感器中得到,数据洪流已经滚滚而来。

现阶段电子病历的广泛应用,使得有价值的医疗大数据实现了快速增长,可供医生、研究者和 患者使用的数据量极大地提升。EMC 和 IDC 发布的报告显示,2013 年全球医疗保健数据量为 153 EB,预计年增长率为 48%。这意味着到 2020 年,这个数字将达到 2314EB(2.26ZB)。因 此,我们计算出医疗数据的总量约占到全球所有数据容量的 5.1%。

大数据分析可以帮助医生确定治疗方案、药物种类和剂量、公共卫生防疫等临床指导。也可以 帮助医院的管理者制定更好的管理方式,帮助保险方制定更好的医疗保险支付模式。医疗服务 的提供者获取了更多的大数据信息之后,从经验医疗向循证医学进行转变。我们需要不断引入 新技术、新概念,提升对这些数据的管理和分析能力,为管理者和临床医务人员做出准确的工 作决策提供依据。

二、医疗大数据沙漏模型

动脉网从医疗大数据的从数据采集、数据治理和数据应用三个方面描述了医疗大数据的发展流 向,绘制了医疗大数据的沙漏模型。数据的采集、治理和应用这三步,反映了大数据的状态变 化,从数据形成知识,从知识指导行动的过程。

更细分一些,大数据领域可以分成数据采集、数据存储、数据治疗、数据分析、数据应用五个 方面。医疗大数据的输入端,是各种信息化系统、传感器、智能设备所产生的医疗健康数据。 庞大的医疗大数据在收集完成后存储在数据中心,然后经过清洗加工之后,挖掘其内在有用的 数据。最后,通过大数据分析之后产生的知识来指导医疗行为,从而产生价值。

通常,人们只认识到医疗大数据的数据来源越来越丰富,也认识到医疗大数据可以为医疗服务 提供有价值的参考意见。前面我们提到,大数据量虽大,但是垃圾数据居多,有价值的数据比 例不高。医疗大数据如果能够经过中间步骤的清洗和加工,那么医疗大数据所能发挥的价值会 越大。所以,医疗大数据从输入、加工到应用三个步骤缺一不可。我们所绘制的医疗大数据沙 漏模型,描绘了医疗大数据从数据形成知识,再形成行动指导的三个重要步骤。

医疗大数据行业不是一开始就形成的,在大数据解决方案出现之前,医疗大数据所能发挥的价 值很低。随着信息化、物联网、云计算、人工智能等技术的发展,大数据的利用价值在增大。 我们从数据获取时代,逐步向信息挖掘时代和价值输出时代过渡。而数据的价值,也从医疗行 为的总结,逐步升级为医疗决策的支持和全方位医疗辅助决策。

三、医疗大数据的四大特征

医疗大数据呈现以下四个特点:

第一,数据量大。从 TB 到 PB 到 EB,再到 ZB,医疗大数据以 48%的年增长率快速增长(IDC, 2014)。这些数据早已超过了人力所能处理的极限。预计到 2020 年,全球医疗大数据将达到

2314EB,已经达到了 ZB 级别。

第二,数据种类多。医疗数据中既有结构化的数据,也有非结构化的数据。结构化数据包括 Oracle、MySql 等数据库的数据,半结构化数据如 XML 文档,非结构化数据包括 Word、PDF、 音视频、影像等。多种类型的数据对数据的处理能力提出了更高的要求。

第三,数据产生快,处理快。医疗信息服务中会存在大量在线或实时数据分析处理的需求。需 对数据进行实时或准实时的处理、秒级的查询需求响应。例如临床中的诊断和处方数据,健康 指标预警等。

第四,数据缺乏标准。各个医生、各家医疗机构、各个地区的数据没有统一的规范标准,数据 的质量不佳。患者的基础信息和各种临床信息资源分散、重复、孤立,导致有效信息闲置、信 息重复或标准不一致,很难得到有效利用。

健康医疗大数据是一种高附加值的信息资产,虽然个体健康医疗数据对于医疗技术革新的价值有限,但通过对海量、来源分散、格式多样的数据进行采集、存储、深度学习和开发,可以从中发现新知识、创造新价值、提升新能力,从而进一步反哺健康医疗服务产业。因此,健康医疗大数据的发展关乎国计民生,具有重大的战略性意义。

四、顶层设计支持医疗大数据发展

当前,社会整体信息化程度不断加深,信息技术对健康医疗事业的影响日趋明显,以大数据、 云计算、移动互联等新兴信息技术为核心的新一轮科技革命,推动了人口健康信息化和健康医 疗大数据应用发展,加速了健康医疗领域新模式、新业态、新技术的涌现。国家已陆续出台关 于扶持医疗大数据发展的相关政策,初步做好顶层设计并构建出医疗大数据发展的宏伟蓝图。

2014 年国家卫计委制定“46312”工程,即建设国家级、省级、地级市、县级 4 级卫生信息平 台,依托于电子健康档案和电子病历,支撑公共卫生、医疗服务、医疗保障、药品管理、计划 生育、综合管理等 6 项业务应用,构建电子监控档案数据库、电子病历数据库、全员人口个案

数据库 3 个数据库,建立一个安全的卫生网络,加强卫生标准体系和安全体系建设。

人口数据库:主要包含人口信息,数据来源于各大部门(卫计委、公安、民政、统计、人力社 保、教育等)交互共享。

健康档案数据库:主要包含定期或不定期的健康体检记录、卫生服务过程中的各种服务记录、 专题健康或疾病调查记录。数据来源于体检机构、医院和基层。

电子病历数据库:主要包含医院诊断治疗全过程原始记录,数据来源于医院,其商业化价值最 高。

除此之外,近两年和医疗健康大数据相关的政策也出台不少,从顶层设计、具体规划指导、数 据隐私和安全、数据管理等多个方面提出了相关的指导意见。

2015 年,《“互联网+”行动计划》 第十二届全国人民代表大会上,总理提出制定“互联网+”行动计划,“互联网+医疗行业”进 一步推动互联网与传统医疗行业的融合。

2015 年 9 月,《关于促进大数据发展的行动纲要》大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推 进数据资源向社会开放。推动大数据发展和应用,在未来 5 至 10 年打造精准治理、多方协作 的社会治理新模式。

2016 年 6 月,《关于促进和规范健康医疗大数据应用发展的指导意见》健康医疗大数据是国家重要的基础性战略资源,规范和推动健康医疗大数据融合共享、开放应 用,将健康医疗大数据应用发展纳入国家大数据战略布局

2016 年 7 月,《国家信息化发展战略纲要》实施国家大数据战略,从三个方面加快推进政府数据开放,尽快建立政府数据采集质量保障和 安全管理标准,加强政府数据开放的标准化,以方便社会各方面利用。

2016 年 10 月《“健康中国 2030”规划纲要》

“健康中国 2030”是我国未来 15 年推进健康中国建设的行动纲要,其中特别强调发展健康产 业和医疗大数据、培育健康医疗大数据应用新业态。由此可见,在国家政策的引导和激励下, 医疗大数据有潜力成为未来健康医疗产业发展新的增长极。但与此同时,纲要也明确指出,需 加强健康医疗大数据相关法规和标准体系建设。

2017 年 1 月,《“十三五”全国人口健康信息化发展规划》

《规划》将明确全面建成人口健康信息平台,从人口健康信息化和健康医疗大数据基础建设、 人口健康信息化和健康医疗大数据应用方向、创新发展等三个方面着手,规范和推动“互联网+健康医疗”应用等 13 项重点任务。

2018 年 9 月,《国家健康医疗大数据标准、安全和服务管理办法(试行)》国家卫生健康委印发了《国家健康医疗大数据标准、安全和服务管理办法(试行)》,对医疗 健康大数据行业从规范管理和开发利用的角度出发进行规范。《办法》从医疗大数据标准、医 疗大数据安全、医疗大数据服务、医疗大数据监督四个方面提出指导意见,直击目前医疗大数 据领域的痛点,未来对数据的统筹标准管理、落实安全责任、规范数据服务和管理具有重要意 义。

目前,健康医疗大数据领域的法律法规存在明显的滞后性,因缺乏全面、细致、明确的指引和 规则,健康医疗大数据的发展受到严重制约。虽然很多民营企业和外资企业都已迫不及待投身 该领域并希望进行深耕布局,但受制于市场准入和产业政策的不确定性,目前尚在摸着石头过 河,市场热情和活力并未得到充分、有效的释放。

第三章医疗大数据的采集

原国家卫计委副主任、中国卫生信息与健康医疗大数据学会会长金小桃预测,在我国人口总量 峰值达到 15 亿的时候,仅是我国的健康医疗大数据总量就会达到 ZB 以上。他认为,医疗健康 大数据,因其宏大的数据总量,将产生宏大的产业规模,取得宏大的经济效益。

医疗大数据的沙漏模型描绘了医疗大数据从数据形成知识,再形成行动指导的三个重要步骤。 第一个重要的步骤,就是收集和存储医疗数据。巧妇难为无米之炊,要获得有价值的诊疗行动 指导,需要增加医疗数据的来源,扩大数据所覆盖的范围。

医疗大数据是指个人从出生到死亡的全生命周期过程中,因疾病、体检、门诊、住院等健康活 动所产生的大数据。医疗大数据狭义上是从因疾病而产生的数据,现在已经扩展到健康状态下 的人体所有体征数据,以及和医疗健康相关的所有费用数据、行为数据。

一、医疗大数据的分类

通常是和医疗行为相关的数据才被称为医疗大数据,但是现在已经扩展到健康人群的健康数 据,以及和医疗健康相关的行为、物资数据。所以,医疗大数据按类型可以分为两种,个人医 疗健康数据和物资数据。

疾病数据是生病的患者因为疾病就诊所产生的病历、影像、检验等数据,以及健康人群的通过

体检、智能设备所收集的体征、基因等健康大数据。生产数据的主体是人。

其他数据是由器械等设备的状态数据、医药流通数据组成,数据的产生主体不是个人,而是和 医疗行为相关的各种器械、物品、药品。

如果我们把医疗大数据按场景分,可以分成两类,包含院内数据和院外数据。

院内数据是在医院所产生的数据。医院的信息化程度日趋成熟,医院信息系统(HIS)、电子 病历系统(EMR)、影像采集与传输系统(PACS)、实验室检查信息系统(LIS)、病理系统(PS)、 医疗器械等信息化系统和设备所记录下来的疾病、体征数据。还包括医院物资管理、医院运营 系统所产生的数据。

院外数据主要是人类在日常生活中所产生的数据。比如通过体检机构、智能穿戴获取的人体体 征数据。还包括医药流通数据、移动问诊等行为数据。物联网和互联网的发展,也让和医、药 相关的行为数据量大大提升。

基因数据其产生环境可能在院内,也可能在院外。根据其产生的目的,用于疾病的诊断、预测, 或者健康人群的个体特征。

国内医疗系统相对较为封闭,公立医院的医疗数据单独存储在院内,数据之间互不流通、不开 放。大量优质的患者健康数据封闭在医院的围墙之内,难以利用。这固然有对患者健康信息安 全性进行考虑的因素,但大量数据躺在医院,也造成了数据的浪费。

二、医疗大数据来源详解

1.电子病历数据 这是患者就医过程中所产生的数据,包括患者基本信息、疾病主诉、检验数据、影像数据、诊

断数据、治疗数据等,这类数据一般产生及存储在医疗机构的电子病历中,这也是医疗数据最 主要的产生地。电子化的医疗病历方便了病历的存储和传输,但是并未达到进行数据分析的要 求。大约 80%的医疗数据是自由文本构成的非结构化数据,其中不仅包括大段的文字描述,也 包括包含非统一文字的表格字段。通过医学自然语言理解技术,将非结构化医疗数据转化为适 合计算机分析的结构化形式是医疗大数据分析的基础。

电子病历中所采集的数据是数据量最多、最有价值的医疗数据。通过和临床信息系统的整合, 内容涵盖了医院内的方方面面的临床数据集。在电子病历的互通互联上,出于各自的利益性(限制病人转诊),各大电子病历企业也不愿意使数据互通互联。根据美国政府相关报告显示,其 电子病历共享比例也仅为 30%左右。

数据采集难度★★★☆☆

数据价值★★★★★

案例:联众电子病历系统联众电子病历系统集成各种临床医疗系统的数据,以最终建立完整、共享的临床数据中心(CDR)为软件的核心思想。系统以病人为中心,全面整合HIS、LIS、PACS、RIS、病理、超声、内镜、病案、输血、手麻、院感、医保、体检、合理用药等系统,实现医院业务数据的共享,消除医院内部信息孤岛。联众电子病历涵盖患者在诊疗过程中的图片、文字、表格、语言等多媒体信息的实时采集、传输、存储、处理、整合和利用。

2.检验数据 医院检验机构产生了大量患者的诊断、检测数据,也有大量存在的第三方医学检验中心也在产生数据。检验数据是医疗临床子系统中的一个细分小类,但是可以通过检验数据直接患者的疾病发展和变化。目前临床检验设备得到迅速发展,通过LIS系统对检验数据进行收集,可以对疾病的早发现早诊断和正确诊断做出贡献。

数据采集难度★★☆☆☆

数据价值★★★★☆

案例:东软LIS系统

东软LIS系统由检验工作站系统、报告查询系统、采血系统、质量控制系统、微生物系统、试剂管理系统组成。以“服务临床”为核心,通过基于TAT检验样本全流程管理,以及智能化的临床支持和精细化的检验科室管理能力。东软拥有电子病历、LIS、EMR 等齐全的医疗信息化系统,并在其基础上组建了东软医疗大数据科研分析平台。借助这个平台,整合全院来自不同医疗业务系统的各类临床数据,借助大数据平台的海量数据并发处理能力,为科研医生提供一个集数据获取、探索、处理、分析、挖掘于一体的自助式分析平台,支持PB级医疗数据的存储管理,查询分析,特别适合于大型三甲医院的科研用户。

3.影像数据 随着数据库技术和计算机通讯技术的发展,数字化影像传输和电子胶片应运而生。医疗影像数据是通过影像成像设备和影像信息化系统产生的,医院影像科和第三方独立影像中心存储了大量的数字化影像数据。医学影像大数据,是由DR、CT、MR等医学影像设备产生所产生并存储

PACS系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。与检验信息系统(LIS)大数据和电子病历(EMR)等同属于医疗大数据的核心范畴。

医学影像数据量非常庞大,影像数据增速快,标准化程度高。影像数据和临床其他数据比较起来,它的标准化、格式化、统一性是最好的,价值开发也最早。

数据采集难度★★☆☆☆

数据价值★★★★★

案例:锐珂医疗锐珂医疗前身是美国柯达医疗集团。锐珂医疗推出了全新的云网信息化解决方案Carestream VueSolution,涵盖了全面的专业影像处理和流程管理应用,为医院的所有医技临床科室提供 “一站式”的全Web工作平台。锐珂医疗全球从2011年开始,就从传统PACS逐渐转型到影像云。迄今为止,锐珂在全球已经建设了14个影像云数据中心,管理的数据高达三亿人次,而且数据量每天都在飞速地增加。

4.费用数据 医院门诊费用、住院费用、单病种费用、医保费用、检查和化验收入、卫生材料收入、诊疗费用、管理费用率、资产负债率等和经济相关的数据。除了医疗服务的收入费用之外,还包含医院所提供医疗服务的成本数据,包含药品、器械、卫生人员工资等成本数据。在DRGs按疾病诊断相关组付费模式中,需要详细的成本数据核算。通过大样本量的测算,建立病种标准成本,加强病种成本核算和精细化成本管理。

数据采集难度★★★★☆

数据价值★★★★☆

案例:东软望海

东软望海作为1600余家医院HRP与成本核算软件和服务的提供商,获得了CN-DRG官方授权,通过DRG智能管理平台帮助中国医疗在支付方式上进行改革。东软望海DRG平台可以灵活支持全国各地不同编码类型的病案数据进行分组,为医疗机构、支付方和卫生部门提供成本监管、绩效评估、审核等功能。DRGs医院绩效评价通过目标管理、绩效方案、绩效考核和绩效分析等模块,可灵活设置绩效方案及其评价指标,促使医院提高医疗工作效率和整体医疗技术水平;DRGs医院控费则依托大数据,建立病组医疗费用和成本的动态分析模型,提供区域、机构及病组有效控费指标及参考值;而DRGs财政补偿可以精准测算医院补偿金额和政策性亏损,有效防止重复补偿,提高补偿资金使用效率和投放准确性;DRGs智能审核与支付从患者入院到出院的全程信息跟踪,可帮助社保和商保提升其基金使用的有效性,同时,其对基金使用情况进行实时监控,可针对异常病历进行深入挖掘分析和反馈。

5.基因测序数据 基因检测技术通过基因组信息以及相关数据系统,预测罹患多种疾病的可能性。基因测序会产生大量的个人遗传基因数据,一次全面的基因测序,产生的个人数据则达到300GB。一家基因 测序企业每月产生的数据量可以达到数百TB甚至1PB。

测序技术的发展让基因数据以远超摩尔定律的速度在积累,海量的数据亟待深度解读和挖掘。

基因大数据的价值非常巨大,但是现在的数据利用和解读都在初级阶段。

数据采集难度★★★★☆

数据价值★★★★★

案例:华大基因

资料显示,华大基因目前拥有超过200台测序仪,是世界上最大的基因测序机构。其中用于新生胎儿NIPT基因测序每天大约产生10000个样本,需要与数万个正常胎儿几十TB的基因组数据进行差异统计分析,数据计算量巨大。每月产生的基因数据高达300TB-1PB,目前累计基因 库数据22PB。

6.医药研发数据 制药公司在新药研发及临床过程中产生的数据。制药公司主要对临床试验数据进行系统分析, 收集和解读非结构化数据,从而优化生产流程,最大限度地利用研发潜力。

数据采集难度★★★★☆

数据价值★★★★☆

案例:拜耳

拜耳公司依靠大数据分析,在2017年年底推出了既重点突出又多样化的开发战略,将50多个项目几乎同期投入临床开发,最大限度地利用了研发潜力。拜耳公司的研发重点项目在肿瘤学、心血管疾病和妇科学领域,同时在营销方面拜耳也在利用大数据进行推广的辅助决策。

7.药品流通数据 药品和疫苗的运输、流通、存储、销售、接种数据。药品运输、销售数据虽然和疾病的诊治无关,但是医药流通企业可以通过物流数据、库存数据、销售数据中进行挖掘,获取药品流向、用户健康等关键信息,实现系统智能化引导满足顾客准确选药、合理用药、健康保健的多元化服务需求。

数据采集难度★★★★☆

数据价值★★★☆☆

案例:国药集团国药集团通过大数据平台,搭建医药流通全过程的电子化追溯平台,探索实现医药产品从生产完成到销售终端机构(医院、药房、诊所等合法经营机构)之间的全程追踪、追溯与召回,有效地提高医药流通的监管水平。同时,探索基于药品流通领域追溯大数据的应用,为药品紧急调拨配送、药品流动趋势、医药储备可视化等提供数据支撑。

8.智能穿戴数据 各种智能可穿戴设备的出现,使得血压、心率、体重、体脂、血糖、心电图等健康体征数据的监测都变成可能,患者的单一体征健康数据以及运动数据快速上传到云端,而且数据的采集频率和分析速度大大提升。除了生命体征之外,还有其他智能设备收集的健康行为数据,比如每天的卡路里摄入量、喝水量、步行数、? 来源:动脉网蛋壳研究院     发布日期:2019-02-28