众所周知,数据是事实或结果,是用于表示客观事物的未经加工的的原始“素材”。这种“素材”应当具备真实性、完整性、一致性、准确性和自洽性,这是数据的基本属性,亦称数据的绝对质量。保证原始数据的可靠性,是大数据分析利用的前提。
数据是信息的表现形式和载体,信息是数据的结果和内涵。影响数据质量“健康”的因素主要来源于信息因素、技术因素、流程因素、管理因素和环境因素。
信息因素
产生数据质量问题的信息因素主要有:数据采集人或获取人信息意识,对数据来源、数据产生、数据价值、数据用途、数据描述的认知程度和理解程度,以及采集数据的操作技能等。
技术因素
影响数据“健康”的技术因素包括数据创建、数据获取、数据传输、数据装载、数据使用、数据维护等方面。
流程因素
作业流程和人工操作流程设置不当可造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各个环节。
管理因素
管理因素是由于管理机制不畅、约束机制不严、管控措施不当导致的管理缺失或管理缺陷等问题,造成数据质量良莠不齐。
环境因素
环境因素主要包括与此相关的政策法律环境、设备设施环境、分析应用环境、技术保障环境、配套服务环境等。
医疗数据来源分析示意
来自:《中国数字医学》
医院信息系统是产生医疗数据的重要来源。信息化的医疗数据、临床科研教学数据、病人特征数据,以及移动设备、社交网络产生的医疗健康相关数据,为医疗健康大数据提供了多元化和多态性保障数据。
完善规章制度,确保数据质量管控有章可循;建立管控机制,确保原始数据可靠可信,不断强化数据质量管控理念,是确保数据自身“健康”的关键所在。豪厘不伐,将用斧柯。我们应当以狮子搏兔之举,动中窾要,从数据源头抓起,切实关注高楼之基的数据“健康”,以焕发数据的价值与生机。
作者简介
李华才
《中国数字医学》杂志社 执行主编
中国医院协会信息管理专业委员会常务委员
原文发表于《中国数字医学》2016年8月第8期,略有删减
目前,OMAHA作为组织方,已在疾病、症状、药品和检验检查等领域开展术语集构建和维护工作,并在未来继续拓宽涉及领域,期望对行业提供覆盖面更全、适用性更强的医学术语服务。
OMAHA返回搜狐,查看更多
责任编辑: