定义
基于人工整理和数据挖掘方法结合的相关短语技术。根据语义信息、短语结构、短语词典等计算短语之间的相关关系,获取相关短语。可用于信息检索、搜索引擎等系统,向用户提供短语查询建议,帮助用户更好地进行检索。
应用基于微博网络内容的监控预警系统1
本系统对微博内容进行主动监控,并对微博内容进行筛选,计算网站的总警度并得到总警度的发展趋势,便于监控者实施对互联网微博内容监控与预警。本系统包括以下功能:文本信息抽取功能,相关短语检索功能,相似文本检索功能,主题词标引功能。本系统总体设计遵循B/S三层体系结构,优化了数据库,在安全性方面使用了MD5加密算法保护数据安全,并对系统的各子功能模块进行了详细的设计与实现,最后经过测试,本系统运行正常,达到预先设定的目标。
基于短语检索和答案距离排序模型2
该短语检索模型在传统的TF/IDF检索模型上进行改进,提出了利用不同长度短语作为查询词的检索方法,能够返回更多包含正确答案的相关文档;答案的距离排序模型则利用答案与上下文词之间的距离作为排序的依据对答案列表进行排序,可以提高正确答案的排名。