收藏到会员中心

文档题目:

基于Lucene框架的搜索引擎算法研究

基于Lucene框架的搜索引擎算法研究
上传会员: AH0de16
提交日期: 2023-02-11 21:30:22
文档分类: 计算机设计
浏览次数: 7
下载次数: 0
下载地址: 点击标题下载 基于Lucene框架的搜索引擎算法研究 (需要:50 积分)  如何获取积分?
下载提示: 不支持迅雷等下载工具,请右键另存为下载,或用浏览器下载。不退出登录1小时内重复下载不扣积分。
文档介绍: 以下为文档部分内容,全文可通过注册成本站会员下载获取。也可加管理员微信/QQ:17304545代下载。
文档字数: 11814
摘要
随着Internet技术的迅速发展,网络提供给人们的信息量越来越大。搜索引擎作为人们在网上查找、获取信息的重要手段之一,在各个领域都已得到了广泛的应用。目前定制和维护搜索引擎的需求越来越大,对于处理庞大的网络数据,如何有效的去存储它并访问到我们需要的信息,变得尤为重要。Web搜索引擎能有很好的帮助我们解决这一问题。本文阐述了一个简易搜索引擎的原理及其设计和实现过程。本文首先介绍了课题研究背景,然后对系统涉及到的理论知识,框架的相关理论做了详细说明,最后按照软件工程的开发方法逐步实现系统功能。

关键词:搜索引擎;设计;实现

目    录
摘要1
第1章 研究背景与意义1
第2章 网页相似度度量问题描述2
2.1概述2
2.2系统结构2
2.2.1爬虫2
2.2.2信息处理2
2.2.3排序和索引3
2.2.4搜索3
2.3搜索引擎主要指标及分析3
第3章 网页相似度度量算法介绍4
3.1  信息检索系统简介4
3.2 信息检索的过程4
检索的整个过程包括:构建文本库,建立索引,进行检索。4
3.3  Lucene4
3.3.1Lucene结构分析5
3.3.2  Lucene索引的建立5
3.3.3  Lucene的搜索6
3.3.4  中文分词6
第4章 仿真实验与分析8
4.1系统功能图8
4.2系统实体设计8
4.2.1实体8
4.2.2实体的属性9
4.2.3实体间的联系10
4.3系统实现10
4.3.1系统需要的环境10
4.3.2系统中Nutch的配置10
4.3.3对整个网络进行抓取11
4.3.4Solr安装配置和使用15
4.3.5给Solr 4.2添加mmseg4j15
4.3.6客户端应用程序的实现17
第5章 总结与展望24
5.1总结24
5.2展望24
参考文献27

(本文由word文档网(www.wordocx.com)会员上传,如需要全文请注册成本站会员下载)

热门文档下载

相关文档下载

上一篇基于JSP的个人相册管理系统设计与.. 下一篇基于Lucene的面向主题的搜索引擎..

相关栏目

最新文档下载

推荐文档下载