简介
信息检索系统作为网络信息平台的一个重要组成部,在网上信息获取方面发挥了不可替代的作用,尤其是在机器学习、自然语言处理、知识表示和推理等人工智能技术被应用到信息采集、信息索引、查询处理、信息检索和排序、结果反馈等基本环节后,使得检索性能得到不断改善,信息检索系统已成为人们获取信息必不可少的工具。多路存取检索系统是指检索系统支持多路存取的方式。多路存取检索系统能提高检索系统效率和资源利用率,多路存取检索系统一般都有多个用户进行访问,因此进行并发控制是十分有必要的。
并发控制在计算机科学,特别是程序设计、操作系统、多重处理和数据库等领域,并发控制是确保及时纠正由并发操作导致的错误的一种机制。并发控制的基本单位是事务。发控制指的是当多个用户同时更新运行时,用于保护数据库完整性的各种技术。并发机制不正确可能导致脏读、幻读和不可重复读等此类问题。并发控制的目的是保证一个用户的工作不会对另一个用户的工作产生不合理的影响。在某些情况下,这些措施保证了当用户和其他用户一起操作时,所得的结果和她单独操作时的结果是一样的。在另一些情况下,这表示用户的工作按预定的方式受其他用户的影响。
智能检索系统知识的获取与表示、自然语言处理、机器学习、知识推理等人工智能技术是随着时代对社会智能化需求的增加而发展起来的,而人工智能与信息检索的结合则是人们对信息获取智能化的有益尝试。在信息检索系统中融入人工智能技术,使传统的信息检索系统能够更准确地理解用户的查询需求、获得更好的检索性能、智能化程度更高。总之,人工智能技术的引入,将使传统的信息检索系统向着更加智能化的方向发展。目前,把引入了现代人工智能技术、 具有一定程度的智能特征的信息检索系统称为智能信息检索系统.智能信息检索的目标是:在对用户查询内容的处理、信息获取、索引、检索和排序等方面实现检索的智能化,代替人类完成繁杂的信息收集、过滤、分析和处理任务.目前,智能信息检索系统按研究的侧重点不同可以分为以下 3 类。
语义检索系统将信息检索从目前基于关键词层面提高到基于知识(或概念)的层面,信息检索建立在概念及概念间关系的基础之上,主要研究如何对用户输入进行语义分析、如何把用户提交的查询通过语义理解和计算转换成语义概念,从语义上真正理解并准确描述出用户的查询需求;为了充分体现信息间的关联,应如何对检索系统所需的知识进行表示;以及通过对知识库的查询和推理,得出用户能够直接加以利用的信息。基于本体的智能信息检索系统就属于语义检索系统。
跨媒体信息检索系统允许用多种媒体信息表达用户查询的需求,同时能够输出多种媒体类型的查询结果,检索功能非常强大,应用范围更广,而且更加符合人类的思维方式,不但能够丰富计算机的服务,更是计算机功能的一种延伸。但是目前,国内外尚未形成较为成熟的跨媒体信息检索算法和技术,跨媒体信息检索效果欠佳,在跨媒体信息统一表示、跨媒体数据语义标注和内容识别以及跨媒体信息检索结果的排序和相关反馈等方面都有待进行深入研究1。
个性化信息检索系统能够为具有不同信息需求的用户提供个性化检索结果,即,对不同用户提交的同一种查询词能够按照不同的用户需求生成不同的检索结果.个性化信息检索系统主要研究如何通过智能代理不断学习、适应信息和跟踪用户兴趣动态变化,如何基于 Web 挖掘技术在网络中提取用户感兴趣的信息或者更高层次的知识和规律,如何通过推送技术使服务器自动通知用户系统中哪些信息是最新更新的,并自动搜集用户可能发生兴趣的信息通过智能代理提交给用户,从而提供个性化信息检索服务。
检索方式维基百科的检索方式与数字化百科全书(即利用计算机检索网络化的数字资源, 或光盘存储的数字资源的百科全书,主要指的是光盘版、软件版(用于手持电子设备)和网络版的百科全书)的基本趋同,主要分为主题词检索、分类检索和字顺检索 3种。
主题词检索主题词检索是指用户根据自己的检索需要,在首页指定区域键入相应知识的主题词后,获取信息和资料的检索方式。维基百科在首页的右上角提供专栏用于检索, 用户输入欲查检知识的全部或部分主题词就可得到查询结果。查询结果一般分为3类:①单一结果,维基百科根据用户键入的主题词精准锁定目标条目,用户可直接进入该页面进行浏览等操作;②多个结果,如果用户提供的主题词较为模糊, 维基百科会提供多个相关条目供用户进一步选择;③无结果,如果维基百科中不存在用户检索的条目,页面会提示用户可创建该条目。主题词检索是维基百科的主要检索方式,它不仅可以帮助用户快速准确地查询目标条目, 把其 “从纸质页面和字顺排列的桎梏中解放了出来”,而且为用户开辟了一条挖掘待创建条目的渠道。
分类检索分类检索是指百科全书按知识分类体系将条目依次排列,用户可选择相关学科,从头至尾浏览该学科的条目标题,最终查找到目标条目的检索方式。维基百科在首页左侧的内容栏(contents)内设类别专栏(categories),并下设子类别栏(subcategories), 用户可根据自己的兴趣,层层浏览条目标题,寻检相关知识和资料。分类检索虽然便于从知识体系方面寻检知识, 具有系统性较强的特点,但现代学科门类交叉横断、渗透融合,用户查检一个概念,可能很难判断其门类体系, 会导致检索效率不高。因此, 分类检索在维基百科中的优势并不明显, 使用率偏低。然而,分类检索却反映了维基百科的教育功能:用户可以从学科体系出发,借此了解学科全貌,并进行系统学习。与此同时,这种检索方式便于用户发现相关学科的可拓荒之处,促使用户及时创建、更新、修改相应的内容2。
字顺检索字顺检索是指用户按条头的字母顺序查检目标条目的检索方式。西方的百科全书从18 世纪开始,从分类编排转向字顺编排,字顺检索便成为现代纸质百科全书的主要检索方式。然而在数字化百科全书中,由于内容载体的转变,字顺检索的易用性变差,这种检索方式的优势明显削弱,被主题词检索所替代。因此,在维基百科中,字顺检索页面处在较不明显的位置:首页左侧的内容栏内设字顺检索区域,供用户按字母顺序查检条目。