数据元与元数据

元数据:描述其它数据的数据(data about other data)

元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映了某个数据的某方面特征,则该信息组/数据组可称为一个元数据。

元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

在日常生活中,元数据无所不在。只要有一类事物,就可以定义一套元数据。

举个例子:在电影数据库IMDB上可以查到每一部电影的信息。IMDB本身也定义了一套元数据,用来描述每一部电影。下面是它的一级元数据,每一级下面又列出了二级元数据,总共加起来,可以从100多个方面刻画一部电影:

Cast and Crew(演职人员)、Company Credits(相关公司)、Basic Data(基本情况)、Plot & Quotes(情节和引语)、Fun Stuff(趣味信息)、Links to Other Sites(外部链接)、Box Office and Business(票房和商业开发)、Technical Info(技术信息)、Literature(书面内容)、Other Data(其他信息)。

元数据最大的好处是,它使信息的描述和分类可以实现结构化,从而为机器处理创造了可能。

数据元:可理解为数据的基本单元

卫生信息基本数据元规范和定义了医药卫生领域所有相关信息的唯一中文名称与代码,并且代码以字母、汉字、数字式的字符串形式表示。

数据元列举并定义了特定语义环境中的一种信息资源。

完整的数据元名称=对象类术语+特征类术语+表示类术语+(限定类术语)

其中:

一个数据元有且仅有一个对象类术语(object class):是现实世界或抽象概念中事物的集合,有清楚的边界和含义,因其特性和行为遵循同样的规则而能加以标识。

一个数据元有且仅有一个特征类术语(property):是对象类的所有个体所共有的某种性质,也是对象有别于其他成员的依据,是用来区分和识别事物的一种手段。特征类术语是任何一个数据元名称所必须的成分,在数据元概念可完整、准确、无歧义表达的情况下,其他术语可以酌情简略。

一个数据元有且仅有一个表示类术语(representation):是值域、数据类型和表示方式的组合,也包括计量单位和字符集等信息。当表示类术语与特征类术语有重复或部分重复时,可从名称中将冗余词删除。

限定类术语由专业领域给定,限定类术语是可选的。

数据元基本模型

数据元与元数据的区别和联系

  1. 元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。

  2. 数据元的相关信息是任何一个(组织的)元数据的一个完整的组成部分。

  3. 元数据的每一个元素都是一个数据元,用符合数据元标准的元数据属性和描述方法来说明元数据。

  4. 将元数据存储于一个库中,并使之条理化就需要建模,建模就需要从数据元的注册系统中或库中获取元数据。

  5. 元数据,它是以一种一致、标准的方式来表达的数据元。

  6. 元数据与数据元字典格式均由行号、中文名称、英文名称、标识符(短语)、定义、约束/条件、最大出现次数、数据类型、数据的值域等属性组成。不同之处是数据元字典格式中另有语境和同义词名称等属性。

总而言之,元数据和数据元的定义是从不同角度论述的。由于描述的侧重面不同,元数据和数据元的描述属性也有些区别,但是元数据和数据元的字典格式是基本一致的。

------------------------------------------------------------------------------------------------

1元数据Metadata

1.1元数据概念

1、主要是描述数据属性(property)的信息;

2、描述数据的数据;

3、关于数据的结构化数据;

4、描述数据的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等信息,是数据和数据用户之间的桥梁。

举例:

学生信息表包括:姓名、性别、学号等。

姓名、性别、学号都是数据元,但是这些数据元有自己的元数据,即描述数据,分别是长度、类型、值域等。

对于学生信息表而言,姓名、性别、学号是描述学生信息的数据,是它的元数据。

数据是手提箱,而元数据是它上面的标牌。

数据是文件夹,而元数据是文件夹上面的标签。

1.2元数据的作用

1、数据描述:对信息对象的内容属性等的描述能力是元数据最基本的功能。

2、数据检索:支持用户发现资源的能力,即利用元数据来更好地组织信息对象建立他们之间的关系为用户提供多层次多途径的检索体系,从而有利于用户便捷快速的发现其真正需要的信息资源。

3、数据选择:支持用户在不必浏览信息对象本身的情况下能够对信息对象有基础的了解和认识从而决定对检出信息的取舍。

4、数据定位:提供信息资源本身的位置方面的信息,如DOI、URL、URN等信息,由此可准确获知信息对象之所在,便于信息的获取。

5、数据管理:保存信息资源的加工存档结构使用管理等方面的相关信息权限管理版权、所有权、使用权、防伪措施、电子水印、电子签名等。

6、数据评估:保存资源被使用和被评价的相关信息,通过对这些信息的使用分析,方便资源的建立与管理者更好的组织资源并在一定程度上帮助用户确定该信息资源在同类资源中的重要性。

2数据元(Data element)

2.1数据元概念

1、用一组属性描述定义、标识、表示和允许值的数据单元。

2、又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元。在特定的语义环境中被认为是不可再分的最小数据单元。

3、数据元一般由三部分组成:对象、特性、表示

举例:

“执业类别代码”为数据元,“01”为数据元的值。

“执业类别代码”中,“执业”为对象词,“类别”是该数据元的特性词,“代码”是该数据元的表示词。

2.2数据元的作用

1、数据元本身也是数据单元,即也是数据。

2、它是一个用来对各行业的数据进行自身规范化的一个方法或一套指导的理论。

3、用这一套方法对行业数据进行统一的名、型、值规范及分类。

4、规划好行业数据元之后,可以为行业构建出统一、集成的、稳定的数据模型奠定基础,同时它也为数据交换奠定基础。

3元数据管理

3.1元数据管理的建设目标

3.2元数据管理的范围

4资源目录

4.1资源目录要解决的问题

4.2业务流程示意图

4.3资源目录功能特点

5参考资料

https://baike.baidu.com/item/%E5%85%83%E6%95%B0%E6%8D%AE/1946090?fr=aladdin

https://wenku.baidu.com/view/9789bb30f68a6529647d27284b73f242336c31ff.html

https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%85%83/7681154?fr=aladdin

(0)

相关推荐