简介
在信息化社会,充分有效地管理和利用各类信息资源,数据库差不多在每个行业都有应用。不同行业存储在数据库中数据是不一样的,有些数据是可以公开的,有些数据则是机密的,因此有些数据库支持用户进行查询操作,有些数据库则不能。例如,图书查询数据库系统支持用户查询操作;而政府数据库管理系统则不支持用户进行查询操作。可查询数据库还可以指数据库中有用户想查询的内容,这一般和用户的需求有关,因此不同用户所指可查询数据库是不同的。
数据库基本结构数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。
以内模式为框架所组成的数据库叫做物理数据库;以概念模式为框架所组成的数据叫概念数据库;以外模式为框架所组成的数据库叫用户数据库。
⑴ 物理数据层。
它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。
⑵ 概念数据层。
它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。
⑶ 用户数据层。
它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。
数据库不同层次之间的联系是通过映射进行转换的。
数据库的优点与数据文件管理方式相比较,数据库管理有许多优越性。这些优越性来自数据库特有的数据结构和数据存储方式。归纳起来,数据库有如下优点。
(1)查询迅速、准确,且有多种表达与传输方式。以一个大型仓库管理为例:用手工操作,如要查找“某地区生产的商品的名称、规格、数量”,就可能要先翻阅账本,弄清分类目录和分类形式,然后按地区或商品分类、商品名称找到其他附带的属性,再抄写下来。如果要查找的内容较多,则查找与抄写既费时又费力。数据库系统能根据给定的条件自动地按一定途径以毫秒级速度进行扫描查找,可以在瞬间将符合要求的数据一一用表格或其他方式显示出来,还可以自动地打印出来或通过网络传输到指定地址,而且不会出现错误。
(2)数据结构化且统一管理。在数据库中,数据按逻辑结构组织起来,而按物理结构存放在磁介质中,并且由数据库管理系统统一管理,既考虑了数据本身的特点,也考虑了数据之间以及文件之间的联系,数据的查询、检索和处理很方便。在传统的文件系统中,尽管记录内部存在某种结构,但记录之间没有联系,数据的查询、检索和处理十分烦琐、困难。实现数据的整体结构化管理,是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
(3)数据冗余度小。在文件系统中,为了满足一个应用程序对数据的需要,常常在不同地方重复存放同一个或同一组数据。这样一来,如果一个多处存放的数据出现错误,就必须同时修改几个地方,否则将造成数据之间的不一致性。在数据库系统中,数据不仅可以面向某个局部应用而且可以面向整体应用,从而大大减少数据冗余,节约了存储空间,有效地避免了数据之间的不一致性1。
(4)具有较高的数据独立性。数据独立性是指用户应用程序与存储在数据库中数据的相互独立性。当人们利用应用程序调用数据库进行数据处理时,只涉及数据的逻辑结构,而不涉及其存储方式和物理结构。而当数据的物理存储方式和结构改变时,数据库管理系统将自动处理这种改变,而应用程序不必改变。近期甚至发展到数据库的逻辑结构改变了,用户程序也可以不变。用户程序不随数据逻辑结构改变而改变的特性,可称为数据的“逻辑独立性”。数据独立性(物理的和逻辑的)是数据库的重要特征和优点,它有利于在数据库结构修改时保持应用程序的稳定性,可以大大减少应用程序员的软件开发工作量。
(5)数据的共享性好。存放于数据库中的数据的共享性包括系统内部共享性和外部共享性两种,这是数据库管理方式区别于手工管理和文件管理方式的最本质的特征和优点。
系统内部的共享性是指同一个(组)数据在一次处理中可以多次被调用的性能,而系统外部的共享性是指同一个(组)数据可以同时供多个用户调用。这两种共享性的原理是一致的,它使得多种作业、多种语言、多种用户可以相互覆盖地使用数据集合。
内部共享性有效地降低了数据的冗余度,系统很容易进行维护和扩充,而且能够使应用程序的编写更加方便。系统外部共享性能够促进并实现信息社会化服务,可以充分发挥信息的价值。举一个简单的事例,在没有使用数据库技术时,火车票和飞机票发售的数据很难共享,常常出现有的售票处某线路车票或机票已售完,而另一售票处还有很多同一线路的车票或机票无人购买的情况。为了避免上述现象的出现,火车客运站和航空公司往往采取让不同售票处出售不同路线车票和机票的做法,结果给乘客带来许多不便。如今采用数据库来管理车票和机票发售工作,各个售票处可以互通有无,乘客不但可以在一个城市的任何售票处方便地查询并购买当地出发的某路线车票和机票,而且随着网络技术的发展,人们甚至可以在全国任一城市查询并购买异地出发的任一路线车票和机票。
可查询数据库示例中国生物医学文献数据库(CBMdisc): 该数据库由中国医学科学院医学信息情报所和解放军医学图书馆联合编辑发行,收录了中国医学科学院医学信息研究所编制的 《中文科技资料目录(医药卫 生)》 1980年至今收录的1500多种中国生物医学期 刊、汇编、会议论文的全部文献题录,总计227余 万条。他是国内目前较权威的医学数据库,全部题 录均根据美国国立医学图书馆的 《医学主题词表》 (即MeSH词表)及中国中医研究院图书情报研究所出版的《中医药学主题词表》进行标引,并根据《中 国图书资料分类法》第三版进行了分类标引,是检索中国医学信息的主要信息源之一。
(2)中文生物医学期刊数据库(CMCC): 该数据库是中国人民解放军医学图书馆数据库研究部研制开发的文献目录型数据库。主要面向医院、医学院 校、医学研究所、医药工业、医学信息和医学出版等单位。该库收录了1994年以来国内正式出版发行 的生物医学期刊和自办发行的1000余种生物医学刊 物中的相关文献,约100万篇;涉及基础医学、临 床医学、预防医学、药学、医学生物学、医院管理、 医学情报及部分自然科学等方面的内容; 文献记录有题名、全部作者、摘要等11项内容;载体为光碟, 数据半月更新,是中文医学文献检索、查新报奖必备工具之一。
(3)中国医学学术会议论文数据库(CMAC): 该数据库是中国人民解放军医学图书馆数据库研究部研制开发的以医学学术会议论文为来源文献的目录 型数据库。该库收集了1994年以来中华医学会所属 专业学会、各地区分会以及编辑部等单位组织召开 的全国性医学学术会议700多种15万余篇文献;文 献内容有会议名称、主办单位、会议日期、论文题 名、全部作者、地址、关键词、摘要、参考文献数及文献类型等16项内容;载体为光碟,半年更新, 是目前我国中文医学会议文献数据库收藏量较多的 目录型数据库。
(4)万方数据医药信息数据库:该数据库由北京万方数据股份有限公司提供。其内容涵盖了国内外医药、生物等学科的资源,面向全国医院、医药院 校、医药和保健品生产企业、经销企业,提供丰富、 准确、及时的生物医药信息。期刊全文库收录了1998 年至今的中国医药科技核心期刊及部分其他期刊。