从概念到管理,一文读懂元数据

发表日期:2019-07-13 11:15:17    浏览量:90 次

  【IT168 评论】如今,各行各业正在被“疯狂”的大数据所包围,企业需收集,归档,研究的数据量也日益增长。面对浩如烟海的数据,企业管理者应以什?#27425;?#25235;手来管理数据,充分挖掘数据的价?#30340;兀?#31572;案就是“元数据”。

  Gartner 曾在研究报告里指出,“元数据管理将是未来企业信息化的核心基础设施?#20445;?#23588;其在大数据环境中,如果企业不通过元数据管理?#35759;嘀指?#26434;的信息管理起来,很难做到信息的?#34892;?#21033;用。

  “那么,究竟何为元数据,何为元数据管理?本文将为大家梳理元数据的概念,帮助企业理解元数据管理的作用。”

  一、什?#35789;?#20803;数据?

  元数据被定义为:对数据及信息资源的描述性信息。简单来说就是“关于数据的数据”。

  比如:在上网选购衣服时,网店上展示的一件件衣服就是数据。而其中,衣服的品牌、款式、尺寸、颜色、面料材质、适用年龄等就是元数据,这些元数据详细描述了这件衣服的具体信息,为你的购物选择提供参考。

  在生活中,元数据的应用场景非常多,甚?#37327;梢运擔?#20174;我们呱呱落地开始认识这个世界的时候,我们就与元数据密不可分,比如图书馆的藏书信息卡、个人的信息登记等都属于元数据的应用。

  二、元数据有什么特点?

  ?元数据是关于数据的结构化的数据。

  ?元数据是与对象相关的数据,此数据使其潜在的用户不必先具备对这些对象的存在和特征的完整认识。

  ?元数据是对信息包裹 (information package) 的编码的描述。

  ?元数据包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境?#34892;?#24687;对象的发现?#22270;?#32034;。

  ?元数据不一定是数?#20013;?#24335;。

  ?元数据不仅对信息对象进行描述,还能够描述资源的使用环境、管理、加工、保存和使用等方面的情况。

  ?元数据可来自不同的资源。

  ?在信息对象或系统的生命周期中自然增加元数据。

  ?元数据常规定义中的“数据?#20445;?#26159;表示事务性质的符号,是进行各种统计、计算、科学研究、技术设计所依据的数值,或是说数字化、公式化、代码化、图表化的信息。

  三、元数据的作用

  01、元数据是进行数据集成所必须的

  我们知道,数据仓库最大的特点就是它的集成性。这一特点不仅体现在它所包含的数据上,还体现在实施数据仓库项目的过程当中:

  一方面,从各个数据源中抽取的数据要按照一定的模式存入数据仓库,这些数据?#20174;?#25968;据仓库中数据的对应关系及转?#36824;?#21017;?#23478;?#23384;储在元数据知识库里。而另一方面,在数据仓库项目实施过程中,直接建立数据仓库往往费时、费力。

  因此在实践当中,人们可能会按照统一的数据模型,首先建设数据集市,然后在各个数据集市的基础上再建设数据仓库。不过,当数据集市数量增多时很容易形成“蜘蛛网”现象,而元数据管理是解决“蜘蛛网”的关键。

  02、元数据可以帮助用户理解数据仓库的数据

  系统用户不可能像数据仓库系统管理?#34987;?#24320;发人员那样熟悉数据库技术,因此迫?#34892;?#35201;有一个“翻译?#20445;?#33021;够使他们清晰地理解数据仓库中数据的含意。

  元数据可以实现业务模型与数据模型之间的?#25104;洌?#22240;而可以把数据以用户需要的方式“翻译”出来,从而帮助最终用户理解和使用数据。

  03、元数据是保证数据质量的关键

  企业数据集成完成之后,在使用的过程中,用户常常会对数据产生怀疑。这是由于底层的数据对于用户来说是不“透明”的,使用者很自然地对结果产生怀疑。

  借助元数据管理系?#24120;?#26368;终的使用者对各个数据的来龙去脉以及数据抽取和转换的规则都会很方便地得到,这样他们自然会对数据具?#34892;?#24515;;?#27604;?#20063;可便捷地发现数据所存在的质量问题。

  04、元数据可以支持需求变化

  随着信息技术的发?#36141;?#20225;业职能的变化,企业的需求也在不断地改变。传统的信息系统往往是通过文档?#35789;?#24212;需求变化,但是仅仅依靠文档?#23545;?#19981;够。

  元数据独立于平台,可以把整个业务的工作流、数据流和信息流?#34892;?#22320;管理起来,使得系统不?#35272;?#29305;定的开发人员,从而提高系统的可扩展性。

  四、元数据管理功能

  元数据管理为大数据平台绘制数据地图、统一数据口径、标明数据方位、分析数据关系、管理模型变更及精确到字段级别的影响分析,打通上下游数据继承关系断层,为数据质量维护和业务逻辑可视化打下坚实基础。

  在这里我们主要对元数据管理中数据地图、血缘分析、影响分析功能进行深入了解。

  01、数据地图

火影忍者ol火主
1比特币多少人民币 大头英超联赛 中湖北30选5大奖 魔兽世界2019点卡回归 新剑侠情缘官网 北京pk10九码为什么输 18132期7星彩开奖号码是多少 北京pk10走势怎么看 2019天天酷跑回归群 都灵vs切沃 独行侠队中国赛 怪物赛车注册 广东11选5开奖li 东方国度官网 正规狗狗币交易平台 11选5计划彩票软件