版权归原作者所有,如有侵权,请联系我们

[科普中国]-联机公共目录检索系统电子邮件

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

图书馆自动化最初主要包括数据建设自动化和信息检索自动化两个方面。虽然有关建立自动化目录以提供馆藏检索可能性的文章早在60年代中期便已出现,但直到70年代中期,联机公共目录检索系统(online public access catalogue,简称OPAC)才出现在美国的一些图书馆中。出现伊始,它便受到人们的欢迎,“因为用户再也用不着花很多时间从沉重的目录抽屉里翻检排列紧密的陈旧卡片了”。至80年代中期,随着AACR2、ISBD等编目规范的普及和OPAC系统技术的逐渐成熟,欧美许多图书馆都着手建立机读目录数据库。一些较早的OPAC系统扩展了服务范围,由只向本地读者(local users)扩大到也对远程用户(remote users)服务,这使得OPAC本身及图书馆在社会中的作用得以强化。

当前,OPAC系统已发展到第三代。各具特色的OPAC运行在从PC到大型机的各种机型上,甚至还有专为儿童和盲人设计的特殊系统。“在所有信息检索系统中,OPAC可能拥有最多的使用者”。从发表文章的数量和角度可以看出,目前对OPAC的理论研究方兴未艾--从用户检索心理、检索行为到OPAC对图书馆工作流程的影响;从一馆的OPAC到OPAC网络,再到因特网上的OPAC,有单个的,也有群体的,有宏观的,也有微观的1。

OPAC的发展第一代OPAC早期,OPAC的潜在设计思想是“把一个已经存在的手工目录体系电子化”。因此,它所提供的内容和检索点都和卡片目录基本一致。其主要检索功能有两种:“首字母组合检索和短语检索”以及对“用户的检索入口和记录的访问入口进行逐字符的匹配”。当用户需要检索多个系统时,面对命令式的界面往往束手无策。另外,系统硬件也存在诸多缺陷,如存储容量小、网络数据传输率低、终端数量少等。第一代OPAC的“设计思想简单且缺乏特色”,它比较适合图书馆工作人员和那些有丰富OPAC操作经验的用户,而不太适合初级用户,也不利于主题检索(subjectsearch),因此它对图书馆信息检索效率的提高并未带来根本性的改变。

第二代OPAC目前,第二代OPAC在国内外图书馆中占据主导位置。较之第一代,它在数据库的内容和质量、系统检索功能、用户界面(userinterface)以及用户研究四个方面都有较大的发展。

数据库

对数据库的强化,是通过对其内容的丰富和数据质量的提高来实现的。对信息实体主题内容的深度揭示,是图书馆目录体系的一个欠缺。一些OPAC系统通过在记录中加入目次、索引、内容注释(content notes)、文摘、图书评价甚至机读百科全书等途径来丰富其内容。卡耐基·梅隆大学已将Grolier Academic American Encyclopedia和American Encyclopedia Dictionary装入其OPAC。检索时,机读百科全书为用户提供特定主题的条目式背景知识。现在,多媒体数据库、全文库、CD-ROM数据库也纷纷出现,这一切都使用户的检索更加容易,所获得的信息也更加丰富。

随着地区性图书馆的联合,出现了一些大型的联合书目数据库。利用联合书目库能实现“一地多检”,大大方便了用户。数据生产、存在、检索网络化和大型联合书目数据库的出现都使数据维护的重要59性愈来愈明显。如何减少、避免库中的重复记录,如何提高各成员馆编目的质量,特别是如何进行联机规范控制(authority control),已成为越来越多的文章所讨论的焦点。有学者认为,既已联接成网,局部意义上的目录不再存在,一个馆的规范控制已无意义;而另一些学者则认为,“有效的检索应包括规范控制和信息检索”,“正是由于缺少规范控制才导致过高的误检率”,“联机规范控制,虽与手工规范控制有很大不同,但它却不可或缺”,并且是提高检全、检准率的重要因素。

高质量的数据有利于网络特性的发挥。鉴于此,西方图书馆界在“联合——共享编目”的基础上,提出了“联合--共享维护”的思想,其意义在于:分散维护任务,共享维护成果。80年代,OCLC及其成员馆的数据库查重工作,伊利诺伊州、WLN成功的联机数据规范控制工作都显示:不同系统、不同规模的图书馆可以合作,在局部工作上形成统一认识和工作流程,而且也只有基于“联合——共享”的思想,各图书馆才能解决网络环境中的问题。

检索功能

OPAC的检索成效,一直是OPAC研究者最关心的一个问题,因为它直接影响着系统的信誉度。第二代OPAC的检索能力获得了一些发展,比如检索点增多,每个字段(field)都可成为检索点;一些系统的容错能力增强;匹配方式增多,出现了截词检索、相邻度检索、关键词检索和布尔逻辑检索等手段。“但总的说来,不管是检索点还是匹配途径都未有突破性进展,不能让人十分满意”。用户使用时仍有较大的认知压力(cognitive burden),如不同系统检索命令不统一;检索结果不能按相关性大小排序;关键词检索虽然在检索策略的拟定上自由度较大,但检索结果往往有大量不相关或相关性较小的文献,读者需花时间筛选甄别;布尔逻辑检索,其优点在于能利用逻辑组配检索复杂主题,然而对于较多用户,他们不熟悉“OR”、“AND”、“NOR”的作用与用法,所以使用者不多。

大量文献表明,加强主题检索是当前OPAC检索的一个热点。用户调查显示,主题检索是用户使用最多但同时也是出错最多的一种方式。它较之已知款目检索(known-itemsearch)开放度大,并且更符合用户掌握信息的实际情况。但是,它要求用户将需求明确概念化,“表达用户需求的语词必须与系统的访问入口一致”,这使用户检索时认知压力大,并由于不熟悉词表和标引的不规范,使检索成功率小,“OPAC主题检索的立意大为降低”。为此,研究开发者们想了很多办法来加强主题检索,如加强规范文档的建立;加强标引规范化,提高记录主题标目与规范词表的一致性;实行分类主题检索一体化等。还有一些系统试图通过将自然语言检索(如关键词检索)与受控词检索结合起来提高效率。有的系统同时提供两种检索途径供用户选择;有的则当主题检索失败后,在经用户同意后或直接就进行关键词如标题词、文摘、附注的检索,这样无疑增加了匹配的机会。

用户界面

“屏幕是用户的工作空间”,界面设计不仅要让用户从中看到系统提供的各种检索途径,而且还应包括其它一些东西,如形象的图标、简洁的操作提示、艺术性整体布局等。长期以来,由于主观上的认识和客观上的技术原因,用户界面一直是OPAC的一个薄弱环节。第一代OPAC的界面多是命令式和菜单式的。前者,用户必须了解、记忆大量命令,而后者虽然减轻了用户的记忆负担,但其检索逻辑是先组的、线性的,并且用户会经常“迷航”。第二代OPAC的界面设计者在技术选择上有了更大余地。命令式界面不再成为主流,一些系统能够编辑用户的输入使系统容错能力增强,单纯由于用户输入错误导致检索失败的情况有所缓解;

浏览(browsing)功能是第二代OPAC的一个重要特点,当用户检索目标不明确或一时难以表达时,系统可以根据用户的“暂定词”向其提供一段相关的主题词表或分类表,用户可选择适当入口词(searchitem)扩大选择余地,因为选择毕竟易于创造。另外,有一些机构认为应该设计一系列界面标准,比如统一的检索命令结构、统一的帮助信息格式及索引选项。

图形用户界面(grafic user interface,GUI)是这一代界面的佼佼者,其设计更注重艺术性和易用性。它采用了面向对象的设计思想,“引进了心理学和美学的知识与概念”,力图通过对文字、色调、线条、图形甚至声音等多种因素的合理搭配布局,使屏幕更赏心悦目,也使最终用户(end-user)学会检索;GUI集下拉、弹出菜单界面于一体,在一定时间和空间尽可能多地容纳和提供信息,但又不失其简洁性;另外,它允许用户通过点击窗口、图框、按钮等图形标识来选择、表明意向;用户还可同时打开多个窗口并行处理多项任务。GUI使得用户与系统的交流变得更为密切。联机帮助、提示功能的增强也是这一代界面的特点。系统往往会通过简明的提示告知目前系统的行为,用户可以通过这些提示控制检索进程。

关于界面与用户的关系问题,有研究者发现“界面的作用终究有限,它不能取代检索专家的作用,有一半多的检索需要人工帮助”。人们还认识到界面和用户的影响往往是相互的,好的界面简洁、明快、充实、活泼,能帮助用户学习使用系统;用户的素质同样也影响着界面功能的发挥。经验丰富者,可能检索时间短且收获颇大,而初级用户可能还不熟悉键盘分布、对于屏幕信息只注意中间而忽略四周……

用户研究

“OPAC研究的一个主要目的是收集信息以设计出更有效的OPAC系统”。而用户信息无疑是其收集的重要内容。国外信息检索系统的一个突出特点就是考虑周到,于细微处显风格。而这得益于西方学者对用户深入细致的调查研究。经过长期的实践,他们总结出了问卷调查、观察、访谈、实验、交互日志分析等方法。对于远程用户,日志分析是一种十分有效的手段。运用这些方法,他们取得了很多喜人的成果。其实,OPAC的发展历史也就是其设计、开发者们对用户研究的历史。只是各个阶段侧重点不同而已。早期对OPAC用户的研究,集中于用户使用OPAC时所用的检索方式,比如用户喜欢用哪种检索方式、检索的检准率、误检率、平均时间等。Yee通过调查概括出用户检索时的种种失误;Connavay报道大多数用户更倾向于使用最直接、简单的检索方式,那些复杂手段对于他们形同虚设。后来,研究者更注重用户对OPAC的反映,如用户如何学习使用OPAC、用户使用OPAC的各种障碍、用户对系统的满意度等。很多系统在推出之前都让学生试用,收集各种意见,以使系统更加适应用户,而不是让用户去适应系统。总之,OPAC正越来越朝着“以用户为中心”的方向发展。

远程用户的增多显示着图书馆资源在越来越大的范围内得以共享。但空间上的差异使远程用户的检索过程和问题都比本地用户要复杂得多,也因此备受研究者关注。“远程用户的困难主要有两类,一是技术障碍,如登录、通讯故障等;二是界面的不友好”。远程用户最需要的是稳定的通讯状态、丰富的信息资源、强大的“导航”能力和快捷的数据传送。DirkW.Fokker认为,“用户在将来OPAC系统的设计、开发中应扮演更重要的角色。过去,我们的OPAC系统是面向计算机、图书馆而非面向用户的。“OPAC应该满足特定图书馆用户的各种需要,而这可能正是我们的问题所在,因为它并不知道自己的用户需要什么”。当前,我们似乎从那简洁、明快的图形界面、增强的检索能力、丰富的联机帮助和集图、文、声于一体的多媒体数据库看到:了解用户,重视用户,为用户而设计,正在变为现实。

第三代OPAC虽然目前我们还无法向第二代OPAC告别,但新技术的风起云涌“已经向第三代OPAC开启了新的大门”。大部分第三代OPAC系统现在仍处于试验、论证阶段,但从国外研究者的一些介绍可以看出,新OPAC的最大特点是使整个检索过程呈现一种智能化,整个系统更具亲和性和易用性。从这里,用户的检索结果不再是“信息的信息(informationofinformation)”,而是信息本身。

PACE(public access catalogue extention)是一种极具第三代OPAC特色的用户界面。其优点在于:当用户输入检索意向后,呈现在他面前的将不再是呆板、枯燥的字符反馈,而是形象地排列于“架”上的一本本“图书”(每本“书的大小,是根据MARC记录载体形态项的数据按比例缩制而成)。用户可以浏览每本书书脊上的信息,并可用鼠标点击感兴趣的书,于是“封面”被“翻开”,“题名页”向用户显示题名、责任者、出版者、分类号、文摘、甚至书评等。

除此之外,用户还可通过分类号选择浏览“图书馆”中一排排的“书架”,……PACE采用虚拟仿真技术,让图书馆于人们头脑中的普遍印象出现在屏幕上,力图在屏幕上创造一个现实世界,从而使用户产生一种临场感、沉浸感,有一种WYSIWYG(所见即所得)的效果。除了PACE外,第三代OPAC还将拥有很多令人兴奋的特点,如自然语言检索、语音识别界面、超文本检索、多媒体数据库和检索结果相关性排序等功能。第二代OPAC的检索只能进行形式上的查找而不能进行概念上的匹配。第三代OPAC将具有概念检索的能力,它对用户提问和“文献中繁多的原文信息进行语义层次上的自然语言处理、匹配提供用户直接能用的信息”。Z39.50协议能使“具有不同数据库模型、数据存储方法和检索方法的系统相互理解、通信”,从而取消了不同系统、不同界面对用户的检索限制;“LC OCLC等机构正在扩充MARC内容以反映近来发展的信息传送。MARC856字段包含了实物的统一资源定位标识(uniform resource locator,URL),URL所连接的就是实物的内容(全文文献、静态图像、动画或一段程序)。用户通过点击MARC记录或字段就可在终端上获得存储在WWW服务器上的记录的真实内容”。WWW技术是因特网上发展最快的服务方式,很多系统都通过WWW界面向全球范围的用户提供检索服务,最大程度地实现了资源共享。

因特网上目前有很多优秀的信息搜索引擎,如Yahoo!、GOYOYO等,它们就是因特网上的OPAC。GOYOYO是一个高度智能化的搜索引擎,已和全球2.4万个中文互联网页相连,网址是http://www.goyo yo.com。这些搜索引擎以惊人的速度寻找信息,并将其分类,提供检索。我们可以设想一位第三代OPAC用户的检索过程:他坐在计算机前,先“拉开”一个“抽屉”,找到了需要的检索词,又“拿”过一支“笔”,点击输入……,当他选定了一本书后,系统马上显示出图书馆平面图并“告诉”他这本书的大概位置。而这时,旁边的终端前正有一位盲人在与系统进行对话:“I want the information about……”。