元数据概念
经常有专家拿图书馆的例子来解释元数据的应用价值:通过目录卡片可以查询图书馆中保存了哪些书、在图书馆的位置,读者可以根据类型、作者或书名来查找书籍,此外,目录卡片还记录了每一本书的作者、类型、出版日期、修订历史等内容,帮助读者确定想要的书籍。
那么在企业真实的数据环境中,元数据的应用场景都有哪些呢?
”
勾勒企业信息资产视图
大数据时代,企业数据量成倍增长,但企业数据环境中究竟有哪些数据,数据与业务之间的关系是什么,数据都在哪里,全都是需要解开的迷。
元数据是对数据的描述,采集企业环境中的各类元数据并统一存储,通过分析元数据,根据业务维度、系统维度等不同维度对数据分类,并梳理出数据和数据之间的关系,将能从多种视角360°展示出企业的数据资产视图,让企业不同的员工都能方便地看到自己关心的数据情况,使大数据不再“暗无天日”。
帮助业务人员快速找到数据信息
企业数据量飞速增长,虽说业务人员可利用的数据原材料变多了,但是一般业务人员对业务都比较了解,却不太了解技术,所以在海量复杂数据中查找数据对于业务人员来说是个不小的难题。
正如图书卡片可以帮助读者快速找到所需要的书籍,元数据为业务人员展示了数据的业务含义、数据在哪里等信息,还可以提供数据之间的业务关系与样例数据,帮助业务人员在理解复杂数据的基础上快速找到需要的数据。
促进技术与业务之间的合作
对于企业来说,懂业务的人不是很了解技术,而懂技术的IT人员,又不是很了解业务,而企业业务创新经常需要业务和技术共同完成,二者之间的分歧严重影响了业务的发展。
将企业技术元数据与业务元数据关联并统一存储和集中管理,让业务人员能够通过带有业务语义的业务元数据直接获取数据,让技术人员在开发数据应用时能随时了解数据的业务含义,开发出与业务定义契合度高的数据应用。将能打通业务与技术之间的壁垒,促进技术与业务之间的合作。
分析数据流向,定位数据问题、预估数据变更影响
在企业环境中,数据的加工链路一般都很长,技术手段也各式各样,很容易出现多种问题,最凸显的问题有两种:一方面,当发现问题数据时,很难快速定位到问题数据的初始表和字段,也无法判断问题数据的流向;另一方面,信息供应链中的数据变更频繁,因中间的关系纷繁复杂,不能事先判断数据变更带来的影响,所以数据变更后可能导致多个系统运行出错或数据异常。
元数据提供了数据从哪里来、如何到达此处以及相关的数据转换规则等信息,能清晰地反应数据的流向,帮助企业分析数据之间的上下游关系,所以,通过分析元数据,可以妥善解决以上两方面的问题。一方面,通过元数据可以快速定位问题字段,帮助企业快速解决数据问题,降低问题数据带来的影响;另一方面,在数据变更之前,通过元数据能找出将会受影响的系统,事先评估变化带来的风险,并及时通知受影响的部门作出相应修改,降低系统出错风险。
消除系统上线隐患
在软件开发过程中,一个新系统的上线会影响到很多现有系统,如果不能事先分析出即将上线系统对其他现有系统的影响,新系统上线期间很多系统都可能出现问题。
企业中众多系统间的数据关系纷繁复杂,只靠经验很难判断清楚,若能准确自动地采集并管理系统中的元数据,并随时保证各个环境中元数据的一致性,在系统将要上线时就将测试环境的元数据与已上线系统元数据作对比,提前分析出系统变更对其他系统带来的影响,就能够避免此类问题发生。