摘 要
有相关研究进行统计过,人类获得信息的全部量,在这其中占有一半以上来自于视觉,还有超过35%的是来自于听觉。因为这样,视觉以及听觉对于人类来说在获取信息方面占据着极其重要的地位。在电视和网络日益成为人们日常生活中所不可缺少的一部分的今天,人们观看电视节目时,有时由于频繁换台而不知当前所播节目的名称。音视频识别就是一项可以通过技术手段识别出音频或视频信息内容的技术,可以帮助人们实时的识别出所观看电视节目的信息。
本文分析了某电视台的音视频识别系统所具有的功能以及在设计阶段所做的设计。由于是实时性系统,所以效率就显得尤为重要。除了音频识别与视频识别的算法尤为重要外,数据库的调研选择、设计以及网络通信框架的选择以及实现也格外重要。本文描述了系统的整体架构以及操作、处理流程,其中更是详细描述了数据库的选择、设计、实现以及网络通信框架的选择以及网络报文结构的设计与实现。由于软件产品化才是目标,只有简单的音视频识别只能是一项实验品。所以,需要利用一种能够提供高性能的服务端的网络通信技术和一项支持高速访问和写入的存储机制来配合它,使之能成为一项合格的产品。本文论述了所需的网络通信技术和存储机制的选型过程,以及为什么要选用它们的原因。然后通过代码与音视频识技术相结合,使之成为一项产品。本文详细描述了本人在设计和编码阶段所做的工作重点:包括网络通信方面的技术选型、设计、编码,以及音视频特征以什么方式存储、数据库的选择、设计、编码等等。
在完成本项目后,人们只要通过手机即可方便的识别出当前所观看的电视节目的信息,而在之后,其所具备的后续商业价值也是非常巨大的。
关键词:音频识别 视频识别 ACE网络通信框架 Redis数据库
目 录
第一章 引言 1
1.1 课题背景 1
1.2 课题任务 6
1.2.1 课题内容 6
1.2.2 本人承担任务 6
1.3 论文结构 7
第二章 相关技术介绍 8
2.1 技术调研 8
2.1.1 ACE网络通信框架 8
2.1.2 Redis数据库 10
2.2 开发工具 13
2.3 本章小结 25
第三章 某电视台的音视频识别系统的需求分析 26
3.1 系统用户角色分析 26
3.1.1 普通用户角色 26
3.2 系统功能需求分析 27
3.3 系统功能的UML用例图 27
3.5 本章小结 28
第四章 某电视台的音视频识别系统的总体设计 29
4. 1 系统网络结构设计 29
4. 2 系统软件层次架构设计 30
4. 3 系统功能模块设计 31
4. 4 系统的数据模型设计 31
4.4.1 数据概念模型的设计 31
4. 5 系统的界面设计 34
4.5.1 手机用户界面设计 34
4.5.2 网络管理界面设计 35
4. 6 系统接口设计 36
4.6.1 特征提取服务器与电视台实时直播流信号的接口衔接 36
4.6.2 特征提取服务器与redis数据库的接口衔接 37
4.6.3 用户客户端程序与特征匹配服务器程序的接口衔接 39
4.6.4 特征匹配服务器程序与redis数据库的接口衔接 40
4.6.5 前端服务器程序与网络管理服务器的接口衔接 41
4.6.6 网络管理服务器与系统管理员客户端的接口衔接 42
4.6.7 网络管理服务器与数据库的接口衔接 43
4. 7 本章小结 44
第五章 系统(主要)功能模块的详细设计与实现 45
5.1 音频识别模块的详细设计与实现 45
5.2 视频识别模块的详细设计与实现 50
第六章 系统测试 54
6.2 系统的功能测试 54
6.3 系统的非功能测试 54
6.4 测试结果分析 54
第七章 结束语 56
7.1 论文工作总结 56
7.2 问题和展望 56
致 谢 58