收藏到会员中心

文档题目:

基于Lucene的面向主题的搜索引擎的设计与实现

基于Lucene的面向主题的搜索引擎的设计与实现
上传会员: AH0de16
提交日期: 2023-02-11 21:30:01
文档分类: 计算机设计
浏览次数: 15
下载次数: 0
下载地址: 点击标题下载 基于Lucene的面向主题的搜索引擎的设计与实现 (需要:50 积分)  如何获取积分?
下载提示: 不支持迅雷等下载工具,请右键另存为下载,或用浏览器下载。不退出登录1小时内重复下载不扣积分。
文档介绍: 以下为文档部分内容,全文可通过注册成本站会员下载获取。也可加管理员微信/QQ:17304545代下载。
文档字数: 16092

基于Lucene的面向主题的搜索引擎的设计与实现

摘 要 

随着网络的迅猛发展,获取准确的网络信息变得困难。目前虽然已经有谷歌、百度这些优秀的通用搜索引擎,但是它们并不能很好的解决这个问题。通用搜索引擎的信息量大,页面更新比较慢,信息的实时性、准确性都无法保证。因此,本文设计并实现了面向主题的小型搜索系统。
本文论述了搜索引擎的发展历史、分类和中文搜索引擎发展现状,明确了系统开发过程中要解决的问题,提出了具体的设计方案。
论文的主要工作以及创新如下:基于Lucene软件包,设计完成了对页面的索引和搜索;研究了最大正向中文分词算法;设计了页面解析功能。

关键词: Lucene,面向主题,中文分词




目录

摘 要I
ABSTRACTII
目录III
第1章绪论1
1.1引言1
1.2本文主要实现内容1
第2章搜索引擎概述2
2.1搜索引擎的概念2
2.2搜索引擎的分类2
2.2.1 机器人搜索引擎2
2.2.2 元搜索引擎2
2.2.3 目录搜索引擎3
2.3中文搜索引擎的发展现状3
第3章面向主题的搜索引擎技术分析4
3.1搜索引擎的结构4
3.2网络蜘蛛的结构与工作流程5
3.3LUCENE简介6
3.3.1 Lucene的实现机制6
3.3.2 Lucene索引结构7
第4章系统结构分析设计9
4.1需求分析9
4.2系统设计图9
4.3系统详细设计11
4.3.1 信息采集模块设计11
4.3.2 索引模块设计13
4.3.3 搜索模块的设计16
第5章小型搜索系统的实现18
5.1信息采集模块实现18
5.2索引模块的实现20
5.2.1 文档解析20
5.2.2 中文分词的实现22
5.2.3 索引的实现25
5.3搜索模块的实现27
5.4用户界面的实现28
第6章测试与系统性能分析30
6.1测试30
6.1.1 中文分词测试30
6.2系统性能分析30
第7章总结32
7.1总结32
7.2未来工作32
参考文献33
致谢34
系统使用说明书35
1.使用说明35
2.运行环境35
3.操作步骤35
4.运行结果35

(本文由word文档网(www.wordocx.com)会员上传,如需要全文请注册成本站会员下载)

热门文档下载

相关文档下载

上一篇基于Lucene框架的搜索引擎算法研究 下一篇基于MYSQL+JAVAEE的旅游网站设计..

相关栏目

最新文档下载

推荐文档下载