概述
互联网是一个不断成长的开放系统,其覆盖地域不断扩大,大量分布异构的资源动态地更新与扩展,资源的规模及其关联关系不断地成长变化,资源管理的范围难以确定。1
互联网的快速发展,使得互联网上有用的文献信息、数据库迅速丰富起来。互联网成为世界上最大的信息载体,以它丰富的信息资源和便捷的交流方式促进了科技的进步和经济的发展,也给科技查新咨询工作带来新的机遇。
互联网资源具有信息的时效性、内容的广泛性、访问的快捷性、搜索的网络性和资源的动态性等特点。正是基于这些特点,互联网资源为查新咨询工作提供了强有力的补充。主要表现为:
①有效弥补了专门数据库的“时差”问题。国内的查新都是通过国际或国内联机检索以及光盘数据库检索,辅之以手工检索,但这些都是基于二次文献的检索,不可避免地存在着由于二次文献本身带来的时差问题。互联网资源有效弥补了这个缺陷,在互联网上可以获得最新的信息、最新的动态。
②提高了查新咨询的文献保障率。文献资源的保障是科技查新必备的物质保障。互联网的快速发展从检索工具和一次文献资源两个方面提高了查新咨询中文献资源的保障率。在互联网上我们可以利用Telnet、Ftp、Gopher、WVVW、搜索引擎等检索工具进行词语检索、截词检索、字段检索、概念检索、布尔检索等,这就极大地弥补了查新咨询机构检索工具不全等弊端。在互联网上还能够方便获取专利、期刊以及产品等的一次文献信息互联网上丰富的一次文献资源极大地满足了查新咨询对一次文献的需求,提高了文献的保障率。
但是,互联网信息资源还存在着查准率差、检索结果分辨率低和文献权威性模糊等问题。我们的查新工作还不能完全依赖于互联网资源,而应当把它当作科技查新工作的一个强有力的补充手段。只有把互联网、光盘数据库、传统文献载体有机结合,相互补充,才能有效地为查新工作服务。2
自然特性互联网资源具有成长性、自治性和多样性等三个自然特性。成长性是指互联网资源规模不断膨胀、关联关系不断变化;自治性是指互联网资源局部自治、自主决策;多样性是指互联网资源的属性存在广泛差异。上述特性使得无法对互联网资源进行全局的集中式控制和管理。1
互联网资源站点互联网资源站点是对互联网上健康的有价值的资源进行系统的采集、整理,并提供给用户使用的一个超链接集合站点。资源链接组成包括文本图书、电子信息、商务信息、网站资源、Ⅷ3、Flash、各种新闻媒体、音频、视频等精彩资源。3
互联网资源搜索方式如果要想在互联网上查找某种资料,可以采用搜索的方式进行查找。使用网络进行搜索的方式有两种,分类目录型搜索和关键词搜索。
分类目录型搜索:把网络中的资源收集起来,由其提供的资源的类型不同而分成不同的目录,一层一层地进行分类,人们要找自己想要的信息可按分类级别进入,就能最后到达目的,找到自己想要的信息。
关键词搜索:用逻辑组合方式输入各种关键词( keyword),搜索引擎根据这些关键词寻找用户所需资源的地址,然后根据一定的规则反馈给用户包含此关键字信息的所有网址和指向这些网址的链接。
在使用关键词搜索时,可以通过使用逻辑操作等进行多个关键词查询。搜索引擎中常用的逻辑关系语法有:AND、OR和NOT。在填写搜索关键词时,AND(与)还可使用空格、逗号、加号和“&”来表示,OR(或)还可用“/”来表示,NOT(非)还可用惊叹号或减号来表示。
(1) AND:必须同时包含用户的所有关键词才满足要求。
(2)OR:表示前后两个词是“或”的逻辑关系,包含任意一个关键词就满足要求。
(3)NOT:表示不包含的意思。
各种搜索引擎一般都支持以上搜索语法,但各个搜索引擎本身又有各自的特点,在具体功能上有所取舍。例如某些搜索引擎支持同义词模糊匹配,如“计算机”可以匹配“电脑”。因此,在使用搜索引擎时,应该阅读网站提供的帮助信息。4
虚拟计算环境互联网资源的成长、自治和多样性,使得我们难以直接借鉴传统的全局集中控制式的管理。因此,提出了面向互联网的虚拟计算环境的概念。所谓虚拟计算环境,是指建立在开放的网络基础设施之上,通过对分布自治资源的集成和综合利用,为终端用户或应用系统提供和谐、安全、透明的一体化服务的环境,其目标是实现资源的有效共享和便捷协作。围绕建立高效、和谐的虚拟计算环境,提出了聚合与协同的核心机制。
聚合是指有效获取、汇聚、组织互联网的资源信息,并综合利用局部的信息,实现资源汇聚、组织和综合利用,形成满足任务需求、相对稳定的资源视图的过程。在传统系统中,由于资源数量较为有限,一般也很少出现动态的加人和退出的状况,因此可以全局地、集中地管理全部资源信息,而互联网资源的多样性使得难以给出资源的统一描述,而成长性使得难以获得传统意义下全面、时空一致的资源信息。因此,资源聚合通常是任务导向的,根据任务需求确定一个局部的资源视图,并在资源发生变化的过程中,确保视图的相对稳定。
资源聚合的难点在于如何适应互联网资源的特点,支持灵活多样的资源共享模式,包括紧耦合、强服务承诺的资源共享模式和多种耦合方式结合、不同承诺强度并存的复杂资源共享模式,资源聚合的范围可能从组织内部、跨组织到互联网范围。
协同是指多个资源为完成共同任务而进行的交互、同步和计算的过程。在传统系统中,资源范围较为有限,也可以接受统一的调度和控制,如集群系统中研究较多的并行计算任务调度问题,多是基于集群节点数量事先预知、各节点完全同构,节点接受集中的调度算法管理这一重要前提进行的。而在互联网这样的开放环境下,资源的自治性导致了资源无法接受全局管理,也不以达到全局最优为目标,而需要各个节点在协商的过程中达到平衡状态;互联网资源的多样性也导致了不同资源的协同模式不同,协同的环境、对象和协议等也往往具有不确定性。这些都对资源自主协同的能力和虚拟计算环境的运行机制提出了更复杂的要求。
资源协同的难点在于如何在开放、动态的环境下,实现从静态的、预设的协同到自主、动态、灵活的多种协同模式,并在此基础上形成虚拟计算环境的核心运行机制。通常一方面需要资源具有一定的自主决策和自适应能力,一方面也需要从运行环境的角度,提供一系列基础服务的支持。5