试探领域本体基础上智能信息检索实现方法
试探领域本体基础上智能信息检索实现方法 随着计算机技术和互联网的迅速发展和广泛普及,全球信息化时代己经到 来,网络上信息呈现爆炸性的增长。上世纪90年代以来,随着计算机在人类社会 和生活中各方面的广泛应用,数字信息的共享和利用已不再是研究人员的专利, 人们对数字信息的需求也越来越大,许多的信息系统被开发出来,为用户带来对 其有帮助的信息内容。数字信息一方面为人们的日常工作和生活提供了帮助,另 一方面,庞大的数据库、大量的信息又会使人们不知所措。人们总希望通过网络 信息检索迅速快捷而又准确地找到自己所需要的信息,而这时传统的搜索引擎的 弊端(用词不是太准确,我们现在个个都还在用着BAIDU和GOOGLE呢)就逐渐显 露出来。例如:在百度中输入一个关键词,常常会找到成百上千以至于上万个网 页,用户必须逐一阅读这些网页才能找到真正的答案,并且网上还有哪些相关的 网页没有被检索出来,也无从知道。由于传统关系数据库的局限性[这句话不应 该在这儿出现,前后不一致],造成了信息检索效率过低和检索结果的查全率、 查准率不高的问题,因此如何组织和提供信息就成为信息系统要解决的关键问题。本体(Ontology) 如今在计算机的许多领域得到了广泛的应用,它具有良好 的概念层次结构和对逻辑推理的支持,所以在信息检索,特别是基于知识的检索 中得到了广泛的应用。
目前,中国——东盟博览会在信息服务方面给用户提供了一个官方网站以 及博览会贸易门户网站。网站提供的只是网页链接,没有知识理解和智能信息处 理能力,用户不能直接获得网页上的具体知识。综上所述,研究基于本体的中国 -东盟博览会信息检索平台是具有重要的理论和现实的,为实现“广西服务博览 会”提供有力支持。
本人针对当前信息检索方法存在的缺点和不足,以中国东盟博览会信息交 流与检索为例,把本体技术应用于智能信息检索研究中,它代替人来完成繁杂的 信息收集、过滤、聚类等任务,实现了信息检索的智能化,同时提高了信息检索 的查全率和查准率。
本文主要研究基于本体的中国东盟博览会信息交流与检索平台的构建与 实现。通过对传统信息检索的基本原理、信息检索的分类、信息检索发展现状和 传统信息检索方式存在的问题等方面的分析研究,结合本体和知识库的技术特点, 提出了基于本体的智能信息检索体系框架,并详细描述了智能信息检索系统的设 计思想和系统框架模型。本文同时对智能信息检索系统中所采用的关键技术进行了深入的分析研 究,为智能检索的实验奠定了良好的基础,这些关键技术主要包括:领域本体的 构造、数据文档的存储、语义推理、查询扩展和检索结果的排序等。
在理论分析的基础上,进行了智能信息检索系统的实验,开发了基于本体 的中国东盟博览会信息交流与检索平台,系统以旅游领域的信息为检索对象,构 造了相应的领域本体——旅游本体,从而解决了检索中缺乏语义信息的问题,使 检索智能化,相对于传统的基于关键词的检索方式提高了查全率、查准率和语义 相关率。
修改说明:摘要写得有点乱,主题不明确,研究内容不是太清楚。请按这 个顺利修改:首先写信息检索有多重要,本体在信息检索中的作用,然后写为什 么要研究这个智能信息检索,并且主要是需要解决我们课题-即中国东盟博览会 信息检索,最后写本文研究哪几个问题,实现了什么功能。
总结与展望 总结