中医药行业数据采集系统的应用

日期:2018-05-04 / 人气: / 来源:

1  中医药行业特点



中医药领域具有典型的大数据特征:从患者进入医院开始,挂号环节便将个人姓名、年龄、住址、电话等信息输入完全,随后在就医环节,患者的身体状况、医疗影像等信息也将被录入数据库,就诊结束后,患者缴费结算过程中,又将费用信息、报销信息、医保使用等情况添加到医院大数据库,形成医疗大数据采集的基础。中医药健康大数据具有以下特征。

一是数据量巨大。中国中医科学院2012年4所医院全年门诊量达698万,仅广安门医院1天门诊量就超过1万人次,每年有将近6万多住院患者。如将这些患者的诊疗过程全部数据化,每人次就诊产生的医学数据以10M计,每年产生的数据量将高达70TB,把全国中医院的临床数据汇聚起来,其规模之大可想而知。

二是数据类型复杂。在中医院,每个患者不但要经过辨证论治的个体化诊疗,还会经过各种理化检测进行疾病及预后诊断,因此除病历资料中包含的信息,还会有生化检查、影像或病理切片检查的生物学信息。收集这些庞大、多类别的数据,通过分析处理将其盘活,可产生巨大价值。

三是数据处理速度快。中医的辨证论治、四诊信息等,以及人体的汗液、心率、体温度变化等,都会产生不同的数据记录和数据类型,这些数据具有时效性,如何及时准确、快速地挖掘其价值,蕴藏着巨大商机。

四是具有重要价值。将信号转化为数据,将数据分析为信息,将信息提炼为知识,以知识促成决策和行动。中医药健康引进大数据,就是解决医疗健康事件,处理患者健康问题,在研究领域拥有重要价值。

结合大数据的四大特征数量(Volume)、多样性(Variety)、速度(Velocity)、真实性(Veracity),利用数据采集系统对大数据进行采集和存储,在中医药健康方面广泛应用,解决医院处理数据的繁琐问题。利用数据采集系统,采集和存储中医临床诊疗实践中大量的中医学知识和诊疗信息,分析中医临床诊疗的疗效和经验知识,是中医药学现代化研究和发展的重要课题。

2  中医药行业数据采集系统数据采集工具   

数据采集系统是数据分析挖掘平台重要的一部分,在当今医疗行业飞速发展的情况下,每天会产生各式各样、数以万计的数据。面对庞大的数据,中医药健康发展应用涌现了许多数据采集工具。这些工具充分利用自身特性,结合互联网计算机技术,为下一步数据分析处理起到重要作用。目前已有的数据采集工具成功案例如下。

2.1 便携式可穿戴设备
目前大多数医院已有自己的医疗移动手持终端设备,实现移动医疗终端设备和医疗信息系统的无缝集成和协同操作,成为医院有效信息的数据采集工具。目前数据采集工具设备主要有:心率智能设备数据采集、汗液智能设备数据采集、温度智能设备数据采集等。

2.2 文献采集(数据库)
中国知网、万方等各大数据库,知识发现网络平台面向海内外读者提供中国学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源统一检索、统一导航、在线阅读和下载服务。各大知识库作为医疗数据采集的工具软件,可进行医疗大数据采集,通过文献检索和查阅方式,采集所需的医疗数据。

2.3 网络爬虫
又称为网页蜘蛛,网络机器人。医疗数据中的结构化数据和非结构化数据处理过程比较复杂,特别是信息检索方面。通过在爬虫技术基础上,按照一定策略进行定向的数据抓取处理,屏蔽无关数据,提高查全率、精度和时空性能等都有实质性的优势,为非结构化数据的采集和检索应用提供了新思路。该方法可将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化方式存储。

2.4 医院电子病历系统
电子病历(EMR,Electronic Medical Record)是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化患者医疗记录,取代手写纸张病历,内容包括纸张病历的所有信息。医院电子病历作为大数据采集的主要工具之一,可以收集完整、实时、随时随地的病人信息访问;通过数据采集,可以提供医疗知识库应用;为医疗管理、科研、教学、公共卫生提供重要的数据源。

2.5 手机客户端
移动App等客户端可以建立云档案,通过手机上传就诊记录中的用药情况、检查单、住院单,能与“血压仪、血糖仪、体脂仪”等检测仪器完成数据采集,对接帮助云端医生完善家庭健康档案,有助于慢性病的跟踪干预。

2.6 系统日志采集工具
很多互联网企业都有自己的海量数据采集工具,多用于系统日志采集,如Hadoop的Chukwa,Cloudera的Flume,Facebook的Scribe等,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。

2.7 开放接口方式
对于企业生产经营数据或学科研究数据等保密性要求较高的数据,可通过与企业或研究机构合作,使用特定系统接口等相关方式采集数据。

3  中医药行业数据采集系统常用的采集平台技术

随着中医药健康数据的日益增加,数据采集系统比较成型的平台技术大都提供高可靠和高扩展的数据收集。大多平台都抽象出了输入、输出和中间的缓冲架构。利用分布式网络连接,大多数平台都能实现一定程度的扩展性和高可靠性。

不同的平台技术都有自己固定的功能模式,面对大量的数据类型,不同平台技术可以相应处理不同类型的数据,多平台技术的开发避免了数据类型繁多带来的麻烦,以及数据类型冗杂带来的影响。

4  中医药行业数据采集系统面临的挑战

中医药健康大数据的采集过程,客户端与服务端之间的数据传输,需要通过公网,因此会带来一系安全与隐私问题。

4.1 数据采集的完整性问题
数据采集传输失败时,由于网络等传输原因,在传输数据时难免有些数据丢失。

4.2 数据采集的隐私性问题
第三方可能会在传输过程中截获传输的数据,这些用户数据体现了用户在客户端的一些具体行为,蕴含着用户隐私。

4.3 数据采集的准确性问题
可能会在传输过程中伪造数据,从而让后台的分析结果不准确。这种伪造可能是直接调用传输的API,或是在多个模拟器上运行 App,甚至可能是直接人工在真实设备上操作 App,都会导致传输到服务端的数据不准确。

4.4 数据采集的统一规范问题
在研究发展中医药健康数据采集方面,设计和构建系统时,及时处理所面临的问题,在采集和处理分析数据时,更加严谨、准确、用心。在解决这些问题的基础上,将构建的中医药健康数据采集系统设计更普遍和操作简单化,更加适应人群和医院。

5  总结    

数据采集是所有数据分析挖掘系统必不可少的,通过对 数据采集系统 的开发利用,大量系统平台数据可被加入到统一平台分析和使用,将大数据融入医疗行业,充分结合互联网计算机的强大处理功能,并利用计算机展示开发平台和开发功能,医生或病人通过系统平台处理日常医疗事件及医疗难题,为医生或病人提供快捷、便利的方式。通过数据采集,挖掘和分析,采用可视化技术,将分析数据的界面清晰展现,充分展示数据采集系统的具体作用和使用价值。




作者:


现在致电 4008233516 OR 查看更多联系方式 →

Go To Top 回顶部