元数据是描述数据及其环境的数据。它不仅可以帮助数据生产单位有效地管理和维护空间数据,建立数据文档,还可以提供有关数据生产单位数据存储、数据分类、数据内容、数据质量等信息,并能够帮助用户了解数据及其是否能满足需求。因此,元数据是使数据充分发挥作用的重要条件之一。对此,对元数据标准的研究也是整个数据共享的核心内容之一。
中国科学院在 21 世纪初已经把 “科学数据库及其应用系统”作为科学院信息化建设的重要基础设施,纳入信息化建设的重大项目,其中标准与规范的建设、数据资源和系统平台建设成为科学数据库的三大建设任务,在标准与规范中首要的一点就是研究科学数据库元数据标准体系的建立。同样,中国科技部正在进行的国家科学数据共享工程项目,对标准和规范的研究也是列在各项研究的前面。依托于上述的项目,海洋信息元数据标准化工作也在标准的统一、共享标准的制定、国际标准采用等方面有所侧重。
从国际看,目前主要有三个组织进行元数据标准的研究工作,分别是欧洲标准化组织(CEN/TC 287)、美国联邦地理数据委员会(FGDC)以及国际标准化组织(ISO/TC211)。表 3.2 给出了这三个组织的元数据内容对比。
表 3.2 元数据内容组成
在 CEN/TC 287 中,元数据分为数据集标识信息、数据集综述信息、数据集质量元素、空间参照系信息、范围信息、数据定义、分类信息、管理信息、元数据参考以及元数据语言,并用这 10 个部分来描述数据集,每一部分又有各自的组成元素。FGDC 的元数据内容由标识信息、数据质量信息、空间数据组织信息、空间参照系信息、实体和属性信息、发行信息以及元数据参考信息 7 部分组成。包含 7 个主要子集和 3 个次要子集,共有460 个元数据实体和元素。它是目前国际上许多元数据标准体系的蓝本。在 ISO/TC 211中,元数据的内容标准由两大部分组成,一部分是标准化部分,它是用户必须遵循的标准; 另一部分是信息化部分,它用于通过提供示例等方法来帮助指导用户,以便更好地理解标准。标准化部分是元数据内容的核心,它定义了描述地理信息所必需的规则以及元数据的元素组成,共由 8 个部分组成,依次为标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、应用要素分类信息、发行信息以及元数据参考信息。这三个组织虽然在元数据标准的制定上各有一套体系,但都遵循着一些相似的原则,即保留一些必需元数据信息,对一些辅助的信息用可选项进行描述。表 3.3 列出了元数据的必选项,表 3.4 列出了元数据的可选项。
表 3.3 各种元数据标准中元数据必选项的说明
表 3.4 各种元数据标准中元数据可选项的说明
通过对 CEN/TC 287 、FGDC 和 ISO/TC 211 等元数据标准体系的分析以及对整个数字地理信息标准化理论前提的研究,我国已经制定了一套国家基础地理信息系统(NFGIS)元数据标准草案。该体系由 12 个部分组成,其中标准化内容包括标识信息、数据质量信息、数据集继承信息、空间数据、表示信息、空间参照信息、实体和属性信息、发行信息以及元数据参考信息 8 个部分。另外还有 4 个部分是标准化部分中必须引用的信息,它们为引用信息、时间范围信息、联系信息及地址信息。
在上述元数据标准的基础上,根据海洋信息的特点,研究制定海洋元数据标准。海洋信息元数据标准规定海洋科学数据共享元数据的内容、提供有关数据采集源、采集单位、数据标示、覆盖范围、数据质量、空间和时间模式、空间参照系统、信息分发和用户限制等信息。
在本数据集成平台的设计中,在参考我国元数据标准草案的基础上,针对不同的数据种类,设计具体的元数据内容(表 3.5)。
表 3.5 各种类型数据集的元数据内容设计
续表