版权归原作者所有,如有侵权,请联系我们

[科普中国]-区域数据

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

区域数据一般多种解释,从广义角度来看,区域数据是指一个地区有关数据的会在,例如经济数据,交通数据等;从狭义角度来看,区域数据可以是指数据库或数据文件中一部分数据,或者是指图像中区域内容。对于由地区数据组成的区域数据,一般都存储在区域数据中心。对于狭义区域数据的研究,主要是通过数据挖掘或其他方法从数据中找到感兴趣的内容,例如基于内容的图像检索。

数据数据是指数据库系统中集中存储的一批数据的集合。它是数据库系统的工作对象。为了把输入、输出或中间数据加以区别,我们常把数据库数据称为“存储数据”、 “工作数据”或“操作数据”。它们是某特定应用环境中进行管理和决策所必需的信息。特定的应用环境,可以指一个公司、一个银行、一所医院,或一所学校等各种各样的应用环境。在这些各种各样的应用环境中,各种不同的应用可通过访问其数据库获得必要的信息,以辅助进行决策,决策完成后,再将决策结果存储在数据库中。特别需要指出的是,数据库中的存储数据是“集成的”和“共享的”。所谓“集成”,是指把某特定应用环境中的各种应用相关的数据及其数据之间的联系(联系也是一种数据)全部地集中地并按照一定的结构形式进行存储,或者说,把数据库看成为若干单个性质不同的数据文件的联合和统一的数据整体,并且在文件之间局部或全部消除了冗余。这使数据库系统具有整体数据结构化和数据冗余小的特点。所谓“共享”,是指数据库中的一块块数据可为多个不同的用户所共享,即多个不同的用户,使用多种不同的语言,为了不同的应用目的,而同时存取数据库,甚至同时存取同一块数据。共享实际上是基于数据库是“集成的”这一事实的结果。

区域数据中心技术挑战数据中心(英语:data center),或称为服务器场,指用于安置计算机系统及相关部件的设施,例如电信和储存系统。一般它包含冗余和备用电源,冗余数据通信连接,环境控制(例如空调、灭火器)和各种安全设备。区域数据中心面临的主要技术风险除了承受自然灾害、人为破坏、操作失误、系统软硬件故障等风险外,由于区域数据中心是将全省或者几个省的业务和数据集于一体,具有联网网点数量巨大、联网网点地域分布广阔、联网交易数量庞大等特点,因而又面临由集中带来的以下几类技术风险。

业务系统整合带来的风险根据区域数据中心“数据集中、资源整合”的要求,原来分散开发和部署的应用系统在数据集中的环境下需要作进一步的梳理和整合,在此转变过程中, 硬件的更新、软件的升级以及整合之后系统之间的相互制约,都会对各系统产生一定的影响。 如果迁移整合过程没有规范的标准作为准则,或者出现细节上的失误,都会对各系统的平稳连续运行造成不良影响。

数据自身的安全风险随着大部分业务数据都基本上集中在数据中心,其分析利用的效率固然会大大提高,但数据集中的过程也是风险相对集中的过程,一旦数据中心的存储数据发生丢失、混乱或是被破坏等现象,造成的后果将蔓延至整个区域范围,造成大范围的不良影响。

系统设计不科学带来的风险区域数据中心业务系统应具有基本的海量联机事务处理能力,在对此类系统进行开发之前,对单位时间内事务或交易发生量的估算非常重要,一方面要对基本的处理能力作准确估算,同时不失前瞻性,另一方面又要防止过度夸大业务量,造成信息资源浪费。因此,在开发业务系统时(尤其是在自主开发时 ),一定程度上存在着业务系统处理能力不足或者资源闲置的风险1。

网络通信“瓶颈”风险数据集中同时也意味着网络压力的集中, 网络带宽如果无法满足大量网络终端实时联机交易的数据传输要求,就会存在由于通信阻塞造成联机交易失败或失效的风险。

维护与管理风险由于区域数据中心的体系结构和运行管理相对复杂,由此对技术人员的运维和管理水平提出了更高的要求,如果科技队伍的技术水平没有配套地提升,如果没有针对数据集中的工作环境制订详细的运维管理和应急处置制度,那么面对突如其来的风险事故时,将难以及时处理以确保系统连续稳定的运行。

遭受攻击与入侵风险区域数据中心的作用和风险都较以往分散式的体系结构更为突出, 因此在一定程度上就更加可能成为入侵攻击的目标与对象, 且与以往相比, 由于地位突出, 区域数据中心遭受攻击强度会更大、持续时间会更长、方式种类会更多,故一旦没有配套的安全防护技术体系,后果将不堪设想。

应急事件的风险区域数据中心为发挥其业务处理和分析的高效性,需要跨部门开展多层次、 多种类的协作,在此业务架构和技术架构下,应急演练涉及面广、操作难度大,可能会造成无法开展应急演练或演练次数锐减的情况,演练实质效果很难保证,从而导致区域数据中心发生重大故障时,业务恢复效率低,技术风险不断扩大。其它配套体系不完善带来的风险。区域数据中心的建设过程同样也是配套设施不断完善的过程,在此期间, 灾难备份中心建设相对滞后, IT 资源监控的技术手段有待丰富, 区域数据中心在风险方面的宣传仍是空白,当核心系统或设备发生故障时,由于自身风险定位不明确,将难以迅速地采取有效的应对措施。

基于内容的图像检索基于内容的图像检索(英语:Content-based image retrieval,CBIR;或content-based visual information retrieval),属于图像分析的一个研究领域。基于内容的图像检索目的是在给定查询图像的前提下,依据内容信息或指定查询标准,在图像数据库中搜索并查找出符合查询条件的相应图片。互联网络上传统的搜索引擎,包括Google、Yahoo以及MSN都推出相应的图片搜索功能,但是这种搜索主要是基于图片的文件名建立索引来实现查询功能(也许利用了网页上的文字信息)。这种从查询文字,文件名,最后到图片查询的机制并不是基于内容的图像检索。基于内容的图像检索指的是查询条件本身就是一个图像,或者是对于图像内容的描述,它建立索引的方式是通过提取底层特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两个图片的相似程度。