版权归原作者所有,如有侵权,请联系我们

[科普中国]-军事数据处理

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

物质、能量和信息这三大要素在任何时代的战争中都是起作用的。从工业时代的机械化战争到现在的信息化战争, 信息逐步取代了以火力和机动力为表现形式的物质和能量, 在战争中是起着决定性作用的。

从冷战时期开始, 美国及北约就投入大量财力物力, 利用计算机、软件和数据处理等大量新技术, 根据各军兵种的不同需求建设了针对不同应用的信息中心;冷战结束后, 美军的战略发生了重大变化, 由苏美对抗转移为区域突发冲突, 在这种情况下战略信息的获取对军事领域来说显得更为重要, 建立一个庞大而完备的军事数据处理系统已迫在眉睫。1

需求分析为适应现代战争的需要, 增强信息的获取处理存储交换能力, 夺取制信息权成为赢得战争的关键因素, 而建立长期战略信息获取处理存储系统即信息中心对于夺取制信息权起着至关重要的作用, 它的主要功能应包括以下方面:

*数据采集

*原始数据记录

*数据处理

*数据存储

*数据备份

*数据挖掘

*数据分发与交换

*数据融合

*数据传输(不考虑网络安全保密性)

军事数据处理信息中心系统架构下图给出了一个信息中心的示意图:

前端数据预处理子系统根据信息中心的组织结构一般而言是分布的, 其第一个环节应是前端数据预处理子系统。它担负着如下作用:

*数据采集

*原始数据记录

*数据快视

*数据预处理

*数据缓存

*多信息源的不同数据格式转换

*上交原始数据和预处理后数据磁带或经网络传输

它的构成如下:

所谓数据采集即根据不同应用的需要以各种手段采集获取来自各种信息源的信息, 信息获取之后首要的工作是原始信息的保存和记录。原始数据的保存和记录往往是现在被人们忽视的一个重要环节, 但实际上却变得日益重要。现代战争已发展到今日不知何地何人何时突然爆发的超限战, 但是任何突发事件总有踪迹可循, 而这些信息往往隐藏在大量的原始信息之中。

在保存好原始信息之后, 我们可以放心地进行快视和预处理, 从大量的原始数据中提取当前所需的信息, 若有必要同时进行为达到上述目的而必须的一些预处理。我们所获取的信息可能有各种不同的数据形式, 如:视频、音频、通讯信号、遥感信号和雷达信号等等, 需要把这些数据统一转换为信息中心计算机操作系统、处理子系统和网络所支持的数据格式。

前端数据预处理子系统最后将数据传输给信息中心。在这方面大多数外军除实时战术信息外均采用磁带为传输介质, 因为以目前的网络技术水平尽管有层出不穷的网络安全技术防火墙技术出现, 但是对于珍贵的战略信息而言任何信息失密或被敌方利用网络造成电子欺骗, 对战争胜负会产生决定性影响, 而且真正到了战时要进行电子静默和通信管制时, 磁带成为战争时期唯一可靠的数据传输工具。

数据中心这里的信息处理存储中心, 根据各军事组织的不同可能指某一区域信息处理存储中心, 或是总部的信息处理存储中心。无论如何, 一个信息处理存储中心应具备如下功能:

*重放前端预处理系统送来的磁带或接收经网络传来的前端站数据

*存储数据(包括原始数据和预处理后数据)

*数据处理

*生成数据库

*数据挖掘

*数据备份

*数据分发

1)数据重放子系统承担将前端数据采集预处理子系统送来的磁带, 若系统采用网络传输则此部分可以忽略。一般而言, 应当尽量将磁带的品种记录格式归一化、标准化, 这样该子系统的设计可以简化, 供应品的采购维护成本都可降低。由于技术发展的历史局限性和磁带记录的不统一性, 重放子系统是非常必要的。实际上该系统可能是多元、多通道的, 同时重放不同的数据。过去对模拟信号而言, 采用矩阵电子开关将数据送入相应的分析处理系统; 而今天对于数字信号而言, 可以借助局域网, 所以信息中心实际上是一个网络结构的信息中心。

2)数据存储子系统可同时送入处理子系统和存储子系统进行处理。接下来存储或先行存储再处理。该系统的主要功能为:

*数据存储

*数据备份

*灾难恢复

3)数据库与数据挖掘作为信息处理存储中心的核心技术, 要求对存储数据生成数据库来进行管理和查询。这方面主要依赖于数据挖掘技术的应用和发展。数据挖掘可从大量数据中提取隐藏在数据之后的有用信息, 它被越来越多的领域所采用并取得了较好的效果。

4)由于信息中心存储着大量的珍贵数据, 为可靠地保存这些数据, 安全的数据备份与恢复是非常必要的。一些高可用性策略例如RAID存储服务器/存储簇, 甚至于远程镜像等方法的发展并不能减小对备份和恢复的需求。高可用性和数据恢复并不是一回事,信息中心仍然需要专门用于应付灾难的对策。高可用性策略可以保证在某个服务器或磁盘驱动器失效时仍能访问数据;而备份和恢复所涉及的是服务器或驱动器被毁坏时需要对数据进行恢复的问题。磁带备份与灾难恢复实际上涉及到两个问题: 一是在出现硬件故障时, 要对数据进行恢复; 二是能够选择性地恢复所丢失的数据。硬件故障可以是局部事件, 只影响一个磁盘阵列或服务器, 也可以是影响范围较大的灾难性事件, 如地震洪水或战争所导致的数据存储子系统及其他系统的全面瘫痪。备份和恢复的基本原理并未改变, 仍然是把关键数据复制到可移动的磁带介质上并存放在远离主场所设施的安全场所, 当要恢复数据时, 就把磁带送回主场所并重新从磁带中将数据载入。

5)信息处理存储中心的最后一个功能模块应是数据分发; 数据处理后得到的有用信息, 有时要返回基层应用或与其他信息中心交换, 这时就需要进行数据分发与交换数据分发。目前光盘应是数据分发的一种很好的介质。虽然光盘具有容量小速度慢保存困难等缺点, 但它能降低重放设备的成本, 基层或其他信息中心有一台PC加光盘驱动器即可。1

相关数据处理技术数据挖掘技术确切地说数据挖掘(Data Mining), 又称数据库中的知识发现(KDD) ,是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式, 它是数据库研究中的一个很有应用价值的新领域, 融合了数据库人工智能、机器学习、统计学等多个领域的理论和技术。数据挖掘工具能够对将来的趋势和行为进行预测。数据挖掘方法有很多种, 其中比较典型的有关联分析、序列模式分析、分类分析和聚类分析等。

数据迁移技术数据迁移技术又称分级存储技术(Hierarchical System Management, HSM), 即把数据按其经常需要访问的频度而定义为:

*在线数据(online)

*近线数据(near line)

*离线数据(officeline)

将计算机系统的存储器硬盘或盘阵作为一级存储设备用于存储在线数据;而将高速高容量的非在线存储设备, 如大容量磁带库作为下一级存储设备; 而将不经常使用的数据转存在磁带上, 作为近线数据;对于长期不使用的数据可从带库上取下磁带另外保存, 需调用时, 人工装带调用。

而这一分级存储均由软件来管理, 对用户完全是透明的。现在已有大量的商用软件支持数据分级存储。这类软件可不断对关键网络服务器的磁盘存储空间进行监控, 当磁盘空间达到预定的饱和度时, 开始将不长使用的文件转移到二级存储设备中, 转移过程持续进行, 直至磁盘的占用率达到预定的下限为止。这时磁盘空间已足够使用, 如果软件管理员预计在特定时间内将有大量新的数据进入, 也可手工启动转移过程, 转移后的文件被用很小的“占位”文件取代, 由该占位文件指向原文件被转移后的新位置。

数据融合技术数据融合是基于多信息源数据的综合、分析、判断和决策的新技术, 是研究多种信息的获取、传输与处理的基本方法、技术、手段以及信息的表示和内在联系的一门技术。

存储局域网针对传统存储模式的缺点, 近年来一种新的存储方式—— 存储局域网技术Storage Area Network得到了很大的发展和应用。同传统存储模式相比, 采用SAN网络可以简化数据的存储进程, 有助于确保用户的所有数据及时快速的进行存储。

SAN是网络化的环境, 它提供可扩展、可靠的信息技术基建, 以满足当今众多需求复杂的应用软件的高可用性及高性能需求。它能让用户以快速、集中化的方式管理其信息资源。

SAN目前的标准协议是光纤通道技术。该技术支持高水准的扩展性性能及管理能力, 并能突破以往的连接协议, 在距离上的局限。光纤通道技术支持灵活的网络环境, 可改善服务器至存储设备的数据通信及服务器至服务器提供高速互连。1