简介
数据库,简单来说可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作1,是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。元数据库是按照数据结构来组织、存储和管理数据的数据的仓库。在元数据库中,一般是通过数据表来描述其他表信息。元数据库还与数据用途有关,例如在数据仓库领域中,元数据按用途分成技术元数据和业务元数据。
元数据元数据(Metadata)是描述其它数据的数据(data about other data),或者说是用于提供某种资源的有关信息的结构数据(structured data)。元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。元数据的特点主要有:
①元数据是关于数据的结构化的数据,它不一定是数字形式的,可来自不同的资源。
②元数据是与对象相关的数据,此数据使其潜在的用户不必先具备对这些对象的存在和特征的完整认识。
③元数据是对信息包裹(Information Package)的编码的描述。
④元数据包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境中信息对象的发现和检索。
⑤元数据不仅对信息对象进行描述,还能够描述资源的使用环境、管理、加工、保存和使用等方面的情况。
⑥在信息对象或系统的生命周期中自然增加元数据。
⑦元数据常规定义中的“数据”是表示事务性质的符号,是进行各种统计、计算、科学研究、技术设计所依据的数值,或是说数字化、公式化、代码化、图表化的信息。2
基本结构元数据库基本结构与数据库差不多。数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。
以内模式为框架所组成的数据库叫做物理数据库;以概念模式为框架所组成的数据叫概念数据库;以外模式为框架所组成的数据库叫用户数据库。
⑴ 物理数据层。
它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。
⑵ 概念数据层。
它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。
⑶ 用户数据层。
它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。
数据库不同层次之间的联系是通过映射进行转换的。
元数据服务器系统按照基础信息库目录服务标准,以服务的形式提供元数据查询检索功能。该系统是参考《信息检索:应用服务定义与协议规范(ANSI/NISO Z39.50—2003)》实现的分布式服务器软件系统,基本功能包括:
服务参数配置管理提供服务参数配置功能,包括最大结果数量、查询超时参数设置等。
元数据库管理元数据库是存储和管理元数据的一种特定数据库。元数据库管理模块需要具有较高效率的数据索引,并支持XML格式的元数据存储,提供元数据库的建立和删除,元数据库索引的建立和删除,以及元数据的导入、导出等维护管理功能。元数据库管理模块是一个C/S模式的应用,由具有XML存储管理功能的关系型数据库管理系统作为服务器端,通过具有元数据库管理操作功能的客户端应用实现元数据库管理的各项功能,其主要功能包括:
(1) 元数据库创建
元数据库管理模块是将元数据记录存储在关系数据库中,为用户提供建立元数据库的功能。同时,该模块需要支持多个元数据标准及其元数据记录的存储。
(2) 元数据库管理
元数据库管理模块主要是管理元数据,支持元数据信息的网络发布,这要求该模块具有较高效率的数据索引。针对这一要求,模块应采用具有较高效率的静态索引算法对元数据记录进行索引。通过定义数据库的可索引域,将数据库索引至不同的元素字段,较好地适应查全率和查准率的要求。
元数据库管理具有元数据库建立、导入、导出、删除、备份功能,并且具备支持元数据记录的标准一致性和内容正确性验证功能。
(3) 元数据库配置管理
可同时管理多个待发布的元数据库,包括元数据库地址信息配置等多项功能。
目录服务提供符合基础信息库目录服务标准的元数据目录服务,具体功能包括元数据查询、查询结果提取、数据编目信息查询等。3