版权归原作者所有,如有侵权,请联系我们

[科普中国]-定长记录系统

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

定长记录系统是指系统中所有记录的长度都是相同的。目前较常见的定长记录系统有文件系统和数据库系统。由于定长记录系统中记录都是定长的,因此系统中的数据都是结构化。定长记录系统属于结构化系统,结构化系统是指系统中记录的个数是不变的,但记录的长度可以是定长的或不定长的。

有关术语数据项在文件系统中,数据项是最低级的数据组织形式,可把它分成以下两种类型:

(1) 基本数据项。这是用于描述一个对象的某种属性的字符集,是数据组织中可以命名的最小逻辑数据单位,即原子数据,又称为数据元素或字段。它的命名往往与其属性一致。例如,用于描述一个学生的基本数据项有学号、姓名、年龄、所在班级等。

(2) 组合数据项。它是由若干个基本数据项组成的,简称组项。例如,经理便是个组项,它由正经理和副经理两个基本项组成。又如,工资也是个组项,它可由基本工资、工龄工资和奖励工资等基本项所组成。

记录记录是一组相关数据项的集合,用于描述一个对象在某方面的属性。一个记录应包含哪些数据项,取决于需要描述对象的哪个方面。而一个对象,由于他所处的环境不同可把他作为不同的对象。例如,一个学生,当把他作为班上的一名学生时,对他的描述应使用学号、姓名、年龄及所在系班,也可能还包括他所学过的课程的名称、成绩等数据项。但若把学生作为一个医疗对象时,对他描述的数据项则应使用诸如病历号、姓名、性别、出生年月、身高、体重、血压及病史等项。

在诸多记录中,为了能惟一地标识一个记录,必须在一个记录的各个数据项中,确定出一个或几个数据项,把它们的集合称为关键字(key)。或者说,关键字是惟一能标识一个记录的数据项。通常,只需用一个数据项作为关键字。例如,前面的病历号或学号便可用来从诸多记录中标识出惟一的一个记录。然而有时找不到这样的数据项,只好把几个数据项定为能在诸多记录中惟一地标识出某个记录的关键字1。

变长记录是指文件中各记录的长度不相同。产生变长记录的原因,可能是由于一个记录中所包含的数据项数目并不相同,如书的著作者、论文中的关键词等;也可能是数据项本身的长度不定,例如,病历记录中的病因、病史;科技情报记录中的摘要等。不论是哪一种,在处理前,每个记录的长度是可知的。

结构化数据结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。结构化数据一般先有结构、再有数据。例如,数据库里的内容,一般是以字段的形式,按照一定的二维表格逻辑结构保存,内容遵循固定的格式,比较容易查询,归结为结构化数据。

非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。

数据库系统计算机的数据管理系统.由数据、硬件、软件和管理人员的总体而构成的数据管理系统。一个数据库系统除计算机系统的一般的硬件、软件外,还包括以下四个基本组成部分:

直接存取存储设备,用以存储大量的数据;

数据库,按一定数据模型组织的相关数据的集合;

数据库管理系统,负责数据库的建立、使用和维护的软件系统;

数据库管理员,管理数据库的人员。

数据库系统由文件系统发展而来,它具有数据、体系和控制三个方面的主要特征:

1.数据特征。数据库既描述数据本身,又描述数据之间的联系,是面向数据总体结构的信息集合。它的数据结构反映了某一部门的整体信息结构,数据冗余度小,易于扩充新的应用,可为多个用户共享。

2.体系特征。数据库模式由存储模式和逻辑模式组成。存储模式描述数据的物理结构;逻辑模式描述数据的逻辑结构,它又分为模式和子模式两种。在数据库系统中,程序和数据之间具有物理和逻辑两级独立性,数据的存储模式改变,而数据库模式可以不改变,因而不必改写应用程序,这称为物理独立性;数据库模式改变时,子模式可能不改变,也就不必改写应用程序,这称为逻辑独立性。这种较高的程序与数据的独立性,有利于应用程序的编制与维护。

3.控制特征。数据库在定义、建立、运行和维护时是由数据库管理系统来管理和控制的,有利于保证数据库数据的安全性、完整性和并发操作的一致性2。