收藏到会员中心

文档题目:

网页信息抽取模块研制-微机应用专业论文

网页信息抽取模块研制-微机应用专业论文
上传会员: pengcheng
提交日期: 2014-04-06 12:33:57
文档分类: 计算机
浏览次数: 60
下载次数: 0
下载地址: 点击标题下载 网页信息抽取模块研制-微机应用专业论文 (需要:25 积分)  如何获取积分?
下载提示: 不支持迅雷等下载工具,请右键另存为下载,或用浏览器下载。不退出登录1小时内重复下载不扣积分。
文档介绍: 以下为文档部分内容,全文可通过注册成本站会员下载获取。也可加管理员微信/QQ:17304545代下载。
文档字数:
文档字数:8911
摘  要

垂直搜索引擎和普通的网页搜索引擎的最大区别是垂直搜索引擎对网页信息进行了结构化信息抽取,因此信息抽取技术成为了构建垂直搜索引擎的核心技术。本文首先简介4种Web的信息抽取技术,然后结合Jtree和Xpath技术来实现动态网页信息抽取系统.
关键字:信息抽取;垂直搜索引擎;结构化信息提取;JTree;XPath

目  录

引 言 5
第一章 开发概述 6
1.1 研究背景和意义 6
第二章 Web信息抽取相关技术 7
2.1垂直搜索引擎中的信息抽取技术的选用 7
2.2 几种Web的信息抽取技术简介 7
2.3 JTidy简介 10
2.4 XHTML简介 11
第三章 系统分析与设计 12
3.1需求分析 12
3.2系统设计 12
3.2.1网页抓取功能 12
3.2.2 样本页转换成XHTML功能 12
3.2.3 XHTML转换成XML功能 13
3.2.4  XpathViewer解析器 13
3.2.5 XSLT解析器文件 13
3.2.6 提取信息 13
第四章 信息抽取系统的实现 14
4.1 解析页面并生成Jtree 14
4.2 抽取规则的生成算法生成 15
4.3 根据Xpath生成XSLT文件 17
第五章 试验 18
5.1 获取抽取页面并测试 18
总结 21
致谢 23
参考资料


(本文由word文档网(www.wordocx.com)会员上传,如需要全文请注册成本站会员下载)

热门文档下载

相关文档下载

上一篇县乡防汛远程会商系统方案设计 下一篇基于JSP+JavaBean的汽车租赁信息..

相关栏目

最新文档下载

推荐文档下载