版权归原作者所有,如有侵权,请联系我们

[科普中国]-主数据库

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

概述

主数据库(master database,MDB),简称主库,就是集中存储管理历史归档数据的场所,它永久保管具有长期保留价值、有共享需求的、经过数据质量检查验证的、规范化的数据。加载进入主数据库后的数据,原则上不允许进行更改;主数据库一般不直接支持处理解释等专业应用软件的数据存取;主数据库面向数据管理和共享查询,通过管理平台支持用户的数据存取,通过数据接口为项目库提供数据支持。数据库的数据主要来源于数据源头的各类专业数据库以及项目研究成果的归档。

建立主数据库的目的主要是统一管理数据资产,包括大宗的原始数据和处理解释结果数据。采用主数据库技术,可以有效地解决由于数据管理分散凌乱,数据标准不统一造成数据管理在时间和资源方面的浪费。

主数据库首先是一种信息管理模式,它确立了类似于银行运作形式的专业化统一管理;主数据库又是一种解决方案它提出了一套开发数据的逻辑组织方式和物理存储形式,定义了软件平台数剧管理和查询功能的框架,确立了系统的基本构成。主数据库的核心是数据库,同时又具有其鲜明的特点。1

特点有别于一般的信息系统或应用软件系统,主数据库的主要特点有:

第一,主数据库存储的数据是经过严格质量控制、作为永久归档的信息资产;

第二,主数据库的信息平台综合了Web技术和数据库技术;

第三,以石油勘探为例,主数据库支持标准的石油数据模型(如POSC Epicenter、PPDM等),其中,POSC中心数据模型Epicenter是目前国际石油行业最高度概括和抽象的油气勘探开发数据模型,支持地球物理、井筒、地质、地理信息等各类信息的关联存储;

第四,主数据库支持三级存储方式:online(磁盘)、nearline(自动带库)、offline(脱机磁带架)和大容量高密存储介质;

第五,主数据库提供对部分应用软件的直接数据支持和外部数据的连接。1

基本功能数据整理数据整理是主数据库系统运行维护过程的一个重要环节,也是主数据库系统必备的功能手段。数据在进入主数据库存储之前必须经过规范化处理,由数据管理人员对数据质量进行检查和验证,将不可用或不符合要求的数据剔除,为加载数据作准备。主数据库系统提供的数据整理的主要功能包括图像扫描电子化、地震磁带转储、磁带编目等。

数据管理与维护主数据库的管理功能主要包括数据加载、数据索引、数据授权、数据编辑修改、数据名份与恢复等。以下将分别加以介绍。

(1)数据加载:主数据库系统提供了方便的加载工具,以支持不同类型数据的加载,并且能够通过逻辑相关的数据进行横向关联索引。同时该加载工具还能进行数据的逻辑一致性检查校验,以确保标记在主数据库的所有记录(出现)的唯一性,并将相关数据组织在一起。例如,Petrobank系统在对地震数据的加犁过程中,首先按照标准格式加载地震导航(测网)数据,之后在加载地震数据体时,要读取带头信息,并与前面加载的导航数据进行匹配性检查,如果二者不一致,则系统报错,退出加载,从而确保加载到主数据库的数据的完整性。

(2)用户授权:主数据库的系统管理员可通过系统提供的工具,为不同的数据库用户建立(或注销)账号,定义不同的权限或身份(Role)。

(3)数据授权:系统管理员通过主数据库系统的平台工具,对不同用户或角色授予(或撤回)不同数据的访问权限,保证只有相应权限的用户才能对与其相关的数据进行访问。

(4)数据修改与删除:系统管理员通过操作界面,能对主数据库中存储的数据进行维护性修改或删除操作。

(5)数据备份与恢复:系统具有数据分级备份和故障恢复功能,当系统环境升级或系统出现严重问题后,能够快速进行数据恢复。

(6)日志管理:系统能够根据管理人员的需要,对主数据库中有关数据的操作情况进行审计跟踪,形成日志文件并能够对其进行管理。

数据应用支持主数据库的应用支持功能完全通过软件平台提供,包括直接面向网络终端用户的势据查询浏览、数据请求下载、数据发送等。

(1)数据查询:主数据库管理平台以C/S或B/S方式提供基于表格和GIS导航的数据查询功能,支持对综合数据及资料信息的单入口访问,并支持对同一对象多种相关信息的联合查询与检索。主数据库管理平台还提供了SQI。命令查询、数据表浏览、统计查询和报表等多种功能。

(2)数据请求:主数据库管理平台支持用户通过网络直接下载所选择的数据。此时,主数据库系统先接受并处理用户的数据请求,然后通过网络将请求的数据传送到用户端。通过选择列表(select list)技术,用户可一次挑选多种数据放进选择列表,并允许用户通过选择目的地(不仅限于用户所在结点)和下载格式,一次性地请求下载。用户还可以通过发送消息来请求数据介质的传送。

(3)应用软件接口:典型的主数据库系统一般都提供对项目库系统(尤其是解释系统)的数据支持,通过主数据库平台的项目构建器等接口工具,用户或数据管理人员可以直接从主数据库提取有关数据,并将其直接传送或加载到所能支持的项目数据库系统中。

其他主数据库还对某些应用软件尚在使用的文件格式提供支持,并提供网络传递功能和相互转换的手段。数据管理系统应通过对外部应用项目的注册管理.能最大限度地支持对项目数据库数据的透明加载。1

系统基本配置主数据库系统的基本配置包括一套主数据库管理软件、服务器主机、外部存储设备等。

软件配置主数据库系统的基本逻辑梅成如右图所示,系统的管理功能主要通过软件实现,一般分为客户机端软件和服务器软件。客户机端软件采用Microsoft公司的IE浏览器、主数据库产品厂家的数据请求软件、数据整理软件等。服务器软件运行在各种服务器上,包括主数据库技术产品厂家提供的数据管理软件平台、Web服务器软件、GIS软件(如ArcView等)、数据库管理软件(如Oracle 9i等),以实现主数据厍的查询和管理维护功能。

不同的主数据库系统,其软件配置也不尽相同,下面以Petrobank为例加以简要说明。这些软件分为服务器软件和客户软件,运行在服务器主机上的软件有:

①分布式存储管理器ADSM,是IBM的基于网络的备份与归档软件产品,在Petrobank中用于支持叠后地震数据、工作站文件、归档数据等大块数据的存储;

②IBM公司的层次存储管理模块HSM,可在磁盘阵列与带库之间实现数据文件的自动传递;

③NetTape/PBTS用于支持对MDS主库中野外和叠前地震带的存储管理;

④Uniface是一个独立的4GL应用开发环境,在此用于支持表格、报告制作等功能;

⑤Surf&Connect(for server)用于支持空间数据库存取和开放式数据库连接;

⑥ArcView用于支持基于地理信息系统的查询;

⑦Recall主要用于管理测井曲线数据;

⑧Oracle用于底层数据管理。

而提供给客户端的软件有:

①HTMI。Viewer用于支持浏览器查询;

②Surf&Connect(for Client)用于支持空间数据库的存取和开放式数据库的连接;

③Java支持工作站上的Web浏览;

④INT用于支持地震数据的预览查看。

硬件配置为使主数据库系统上的所有数据查询和管理软件正常运行和实现数据的在线、近线和离线三级存储,在硬件方面需要配置高性能的主服务器、数据分发服务器、网络服务器、归档服务器、自动带库等。此外,为数据的整理加载,还需要配置管理工作站和磁带机、扫描器等设备。1