版权归原作者所有,如有侵权,请联系我们

[科普中国]-源输入记录

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

定义

有关文献中,还没有给出源输入记录的明确解释,主要原因有以下:源这个术语是相对的,对于处理系统和处理对象,可以定义不同的源输入记录;外界对象这个对象既可以是广义的,也可以是狭义的,这取决于当时的条件。因此,源输入记录一般可以指从外界对象产生并输入系统的记录,这些记录都是还没有经过处理的。这些记录类型也是不确定的,可以是字符、文本、图像、音频等。源输入记录可以是数据源、流数据或者一些其他源输入数据。例如用搜索引擎进行搜索时,在搜索框输入的数据对于服务器端来说就是源输入记录。

记录记录是一组相关数据项的集合,用于描述一个对象在某方面的属性。1记录中的每个字段或称为元素,但可能与集合的元素概念混淆不清。在面向对象编程中,记录的字段也另外被称为成员;依照惯例和具体的编程语言,多元组有可能会被认为是一个记录,反之亦然。

譬如将日期储存为一个记录,则其中包含了数字的年份,以字串表示的月份和数字的日期等字段。而人事记录可包含姓名,薪水和职级等字段。一个圆形的记录可包含圆中心点和它的半径-在这种情况下,圆中心点本身可能表示为x和y座标的点记录。

记录与阵列的区别在于,它们的字段数通常是固定的,每个字段都有一个名称,而且每个字段可能有不同的类型。

一个记录型别是描述其中字段所具有值和变量的资料类型。大多数现代计算机语言允许开发人员自由定义新的记录型别。记录型别的定义将会指定每个字段的资料类型和存取它的标识符(名称或标签)。

记录可以存在于任何存储介质中,包括主内存和大容量存储装置,如磁带或硬盘。记录是大多数数据结构的基本组成部分,特别是链接的数据结构。

许多计算机档案是以逻辑记录的阵列组成的,通常被分组成更大的实体记录或区块以提高存取效率。

面向对象语言中的物件本质上是一个记录,有如何处理该记录的专用程序;而物件型别是对记录类型的详细描述。实际上在大多数面向对象语言中,记录只是物件的特殊情况,并且被称为普通旧数据结构(plain old data structures, PODS),与使用OO特征的物件形成对比。

计算机的记录可类比为数学的元组。相同地,记录型别可看作是两个或多个数学集合的笛卡尔积,或是以特定语言实作的抽象乘积型别。

数据源概述数据源是指数据库应用程序所使用的数据库或者数据库服务器。

数据源(Data Source)顾名思义,数据的来源,是提供某种所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。就像通过指定文件名称可以在文件系统中找到文件一样,通过提供正确的数据源名称,你可以找到相应的数据库连接。

信息系统的数据源必需可靠且具备更新能力,常用的数据源有:①观测数据,即现场获取的实测数据,它们包括野外实地勘测、量算数据,台站的观测记录数据,遥测数据等。②分析测定数据,即利用物理和化学方法分析测定的数据。③图形数据,各种地形图和专题地图等。④统计调查数据,各种类型的统计报表、社会调查数据等。⑤遥感数据,由地面、航空或航天遥感获得的数据。中国的数据源数量庞大。如:全国范围的土地资源清查及详查数据,航空摄影测量图像和国土普查卫星资料已覆盖全国,定位、半定位观测站网遍布全国,有地面调查、地图测绘等大量数据。

名称数据源名称(data source name,DSN)是包含了有关某个特定数据库信息的数据结构,这个信息是开放式数据库连接驱动能够连接到数据库上必需的信息。DSN存储在注册表或作为一个单独的文本文件,DSN里面包含的信息有名称、目录和数据库驱动器,以及用户ID和密码(根据DSN的类型)。开发人员为每个数据库创建一个独立的DSN。为了连接到某个数据库,开发人员需要在程序中指定DSN。相反,没有DSN的连接则需要在程序中指定所有必要的信息。2

流数据流数据是指由数千个数据源持续生成的数据,通常也同时以数据记录的形式发送,规模较小(约几千字节)。流数据包括多种数据,例如客户使用您的移动或 Web 应用程序生成的日志文件、网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务,以及来自数据中心内所连接设备或仪器的遥测数据。

此类数据需要按记录或根据滑动时间窗口按顺序进行递增式处理,可用于多种分析,包括关联、聚合、筛选和取样。借助此类分析得出的信息,公司得以深入了解其业务和客户活动的方方面面,例如服务使用情况(用于计量/计费)、服务器活动、网站点击量以及设备、人员和实物的地理位置,从而迅速对新情况做出响应。例如,公司可以持续分析社交媒体流,从而跟踪公众对其品牌和产品的看法的变化,并在必要时及时做出反应。

流数据具有四个特点:

1)数据实时到达;

2)数据到达次序独立,不受应用系统所控制;

3)数据规模宏大且不能预知其最大值;

4)数据一经处理,除非特意保存,否则不能被再次取出处理,或者再次提取数据代价昂贵。3