科技报告正文模板 - 图文
更新时间:2024-04-25 08:46:01 阅读量: 综合文库 文档下载
- 科技报告模板去哪下推荐度:
- 相关推荐
目 录
一 引言部分: .............................................................. 3
1.描述研究背景和意义 ..................................................... 3 2.前期研究基础 ........................................................... 3 3.课题申请单位及主要参与单位研究基础 .................................... 5 4.研究范围和目标 ......................................................... 6
目标1:音视频编码技术与数据封装技术的技术难点的突破 ................. 6 目标2:智能视频内容分析主要的技术难点的突破 ......................... 7 5.研究思路和总体方案 ..................................................... 7 二 主体部分 ................................................................ 8
1.课题研究内容、技术路线和创新点 ........................................ 9
1)研究内容 .......................................................... 9 2)课题实施的基本原则 ................................................ 9 2. 课题的技术路线 ....................................................... 10
(1)TMEncoder高清视频采集编码器 ................................... 10 (2)iGuide虚拟播出系统 ............................................ 12 (3)iVision多点控制展示系统 ....................................... 14 (4)iSearch视频资讯搜索系统 ....................................... 16 (5)iSee视频资讯展示系统 .......................................... 17 (6)iPai、iPlay、iStudio等其他产品 ................................ 22 3.电视数据智能采集处理及分析平台 ........................................ 22
(一)生产平台方案 .................................................. 22 (二)资源存储管理和服务方案 ........................................ 24
三 结论部分 ............................................................... 30
插 图 清 单
此处插入插图清单
附 表 清 单
此处插入附表图清单
正 文
一 引言部分:
1.描述研究背景和意义
1)多终端、跨平台具有良好兼容性与可扩展性的音视频编码技术及数据封装技术: 多媒体终端种类越来越多,各终端采用的操作系统各不相同,各网络电视运营商所采用的网络电视播控模式、媒体数据传输方式也各有不同。这导致不同终端能正确接收和播放的音视频数据格式以及传输协议也各有不同,这就需要电视制作时提供各种不同格式及不同封装的视频内容以适配不同终端。另外,为了保证视频节目内容在未来的良好扩展性,确保在新终端和新系统亦能正确播放,需要在节目制作时考虑视频格式和封装的良好的平台通用性。
2)智能视频内容分析及理解:
通过剖析当前视频内容分析中的人工编目和线性浏览及回溯方式已经远远不能满足海量增长电视节目的处理、现有的视频内容分析系统效率低、性能不高、鲁棒性低等不足,在现有较好积累的基础上,提出更高效的识别算法和检索技术解决并完善现有平台的处理和分析性能。
2.前期研究基础
1.国内外现有技术、知识产权和技术标准现状及预期分析
在视频转码方面,传统的视频转码技术根据需求可以分为四大类:比特率转换、分辨率转换、帧率转换和格式转换。为了适应不同播控平台、网络带宽和终端,在实际转码中往往需要综合应用多种视频转码技术。而国内外相关专家的研究工作,往往仅立足于某一种视频转码技术,他们并没有考虑到与其他技术的兼容性问题。因此在实际工程应用中,主流的转码做法采用全解全编的方式,即对原音视频数据完全解码,重建原始音视频数据,然后根据输出码流的参数对音视频数据进行完全的编码。这种方式可以适应各种转码需求,但由于采用了完全编码的方式,其中计算复杂度较高的模块如运动估计、宏块模式判决等将浪费大量的计算资源,造成转码速度不快。通常一个单核的CPU只能实时完成一路标清视频的转码工作。
另一方面,流媒体播控平台在不同的操作系统中所支持的流格式并不完全相同,譬如:iOS系统不支持FLV格式的视频,而FLV对H.264的支持也不好。为了保证流媒体播控平台的良好兼容性,近年推出了基于HTML5的流媒体播控协议,它采用HTTP方式进行视频数据传输,用户在Web页面中通过调用本地播放器对音视频数据进行播放,它不再需要用户安装独立的客户端进行视频浏览,降低了网络电视运营商对平台的维护难度,可以实现播控平台的跨平台业务。同时,MPEG组织与2011年发布了基于HTTP的自适应流规范草案(Dynamic Adaptive Streaming of HTTP,DASH)。它将同一内容的多中规格的音视频数据流进行有效的复合封装(如下图所示),可以有效而灵活的在多种数据流间进行传输和控制,良好的解决了用户在观看音视频节目时在屏间无缝切换的需求,可以较好的支持跨平台、多终端适应的网络电视业务。
DASH数据格式结构图
在视频内容分析与理解方面,如何实现智能化的基于内容的视频分析一直是信息检索领域中的研究热点,其最终目标是实现基于语义的视频检索。经过近二十年的努力,视频检索在感知特征的提取和表达、视频结构分析、视频摘要、视频索引建立等多个方面都取
得了长足的进步,并出现了MediaMill、Informedia、Advent、QBIC等商用的图像/视频检索系统,支持根据多种音视频底层特征、草图、示例图片或视频片段、以及关键词来进行视频查询。
值得指出的是,正是由于视频检索在信息检索领域的重要性,从2003年开始,美国国家标准技术协会组织了专门针对视频检索的TRECVID国际权威测评。测评的任务包括镜头边界检测、摄像机运动检测、语义视频搜索、高层概念检测、新闻视频摘要、重复视频检测和监控视频的事件检测等任务。
目前参与TRECVID的大学和研究机构已经达到119家之多,分别来自北美、亚洲、欧洲、澳洲。北美的如IBM Watson研究中心、AT&T研究中心、卡耐基.梅隆大学、哥伦比亚大学的Advent小组、加州大学的Berkeley 、Santa Barbara、 San Diego分校等;欧洲的诸如荷兰的MediaMill小组、英国Oxford大学、爱尔兰都柏林大学,以及德国、法国等国的机构。亚洲的日本、新加坡、印度等国、香港和台湾地区。国内如中科院、清华、北京邮电大学、华中科技大学、复旦、北京交通大学都是多次参与,并取得了很好的成绩。2008年来北大、北航、上海交大、西安交大、浙大、天大、山大等也都陆续参加。另外,TRECVID还吸引了微软亚洲研究院、东芝和Yahoo等著名的商业机构,加快了视频检索技术向商业应用的转化。
TRECVID 已成为国际视频检索领域的一个评价基准,基本反映了当今视频检索技术的最高水平,对推动视频检索的研究具有里程碑式的意义。
目前,国内外出现了一些视频检索相关的专利,但都不涉及本项目的海量电视节目的智能分析与处理,目前没有国际和国内相关标准。
3.课题申请单位及主要参与单位研究基础
本课题的负责单位天脉聚源(北京)传媒科技有限公司自2008年以来一直致力于电视资讯云计算平台的开发和相关核心技术的研究,在电视资讯采集、转码、视频模式识别、语音识别和视频内容智能分析、云计算平台建设方面形成丰富的技术经验积累。同时公司注重与高校、科研机构的产学研结合,深度挖掘学术研究的价值,在语音识别、视频模式识别研究方面形成一批具有重要应用价值的科研成果。
公司有专业研发工程师超过200人,投入到本项目团队31人,其中博士2名,硕士3名,公司员工平均年龄28岁,拥有本项目各领域技术的高端人才。公司有超过2400平米的办公室,在北京拥有嘉盛中心和雍和大厦两处办公场所,能够为本项目项目组提供良好的开发环境。
公司自创立以来已经积累收录了国内外主要电视台四年的数据,拥有超过600T的电视数据,目前每天能源源不断地处理近200个频道的电视数据,这些日益积累的数据在未来不具备再次获取的可能,是天脉重要的资源积累,也是公司的核心资产,这一点很难超越。
经过长期的技术积累和对大量数据模式识别(语言、画面)长期的训练,天脉当前的智能分析能力已经达到一个较高水平,可以达到最高75%的识别准确率,而遍布全国的大规模分布
式采集、处理与服务能力需要较长时间的技术磨合和积累,其余竞争对手短期内难以达到。 在市场方面天脉已经占据了先机,当前已经服务于网易、搜狐、腾讯、土豆网等几乎所有的主要网络门户,在广电方面中国教育电视台、北京电视台、上海文广等主要机构也均已采用了本项目的云计算服务。天脉为这些客户提供了高性价比的、稳定优质的服务,并进行了大量的系统对接工作,这一现状将极大挤压其余竞争对手的市场空间。 在电视资讯智能挖掘分析和自动化处理方面,我们拥有了超过20项的专利和30多项著作权,并有多项专利正在提交中。
课题参与单位北京邮电大学多媒体通信与模式识别实验室在图像识别、音视频内容分析及检索,以及多媒体通信等方面,取得了一系列的研究成果。承担了国家自然科学基金、国家重大计划、863、国家计委、公安部和国防科工委等支持的重大科研项目,以及一系列与国内、外企业合作的项目。
在流媒体系统方面,实验室先后完成IPTV播控系统、高效视频转码、3D流媒体系统、通用监控视频接入和管理平台以及视频图像质量评测等课题。实验室拥有完善通用视频解码库,可实现现有各种标准音视频压缩流及主流数码设备采集的音视频数据流的正确解码。实验室具备完善的流媒体播控平台,可支持多种流媒体播控和传输协议,并具有良好的QoS保障体系,实现音视频的流畅播放。实验室拥有高效实时的视频转码器,可实现码率转换、分辨率转换、帧率转换和格式转换等各种视频转码需求,转码速度比全解全编框架提高近45%,可有效的生成适合不同终端设备的视频数据流。 在视音频内容分析与检索方面,实验室有着多年的研究积累,参加了国际权威TREC视频检索测评 (TRECVID)的镜头边界检测、同源视频检测和语义搜索等多项任务,获得了优异的成绩,特别是在与本项目相关的语义视频搜索任务中,2009年获得第一,2010年获得第二,2011年获得第一,充分展现了上述成果在视频检索领域中的先进性。
4.研究范围和目标
目标1:音视频编码技术与数据封装技术的技术难点的突破
为了制作适应各种不同终端的音视频数据,往往需要对同一内容的音视频节目进行多次压缩编码与数据封装,以形成多种压缩格式和封装格式的音视频数据流。由于音视频数据量极其庞大,目前的编码算法相对比较复杂,这将占用庞大的服务器资源。尤其是现在,随着网络带宽的飞速发展,网络电视中逐步开始提供更大分辨率的电视节目,如高清电视节目。目前实时编码一路高清电视节目,需要将近2-3核的CPU同时工作。因此随着终端设备和网络带宽的发展,节目录制所需要的服务器资源将急速增加。降低音视频节目录制的计算复杂度,成为提高音视频节目录制效率的一个技术难点。
按现行的节目录制方式,音视频节目在各地进行采集之后汇聚到云计算中心进行转码录制。期间音视频节目至少需要经过2次以上的编码过程,视频质量将由于二次编码形成更大的质量损失。因此,如何保持转码后的视频图像质量,减少二次编码产生的质量下降也是音视频转码中的一个核心技术。
受操作系统的限制,不同终端可支持的流媒体播控平台和文件格式各有不同,如果将同一内容的不同规格的音视频数据进行合理封装,不同播控服务器均可以进行有效的调度和传输,可以减少编码的工作量,并具备良好的扩展性。因此,音视频数据的流化和封装技术也成为流媒体系统的一项关键技术。
本课题考虑到了现有系统的各方面需求,重点解决流媒体技术中视频转码的计算复杂度高、二次编码质量损失大、跨平台音视频流封装兼容性低的技术难题,提高海量音视频节目制作的效率和质量,提高音视频节目流对各终端的适应性。
目标2:智能视频内容分析主要的技术难点的突破
其主要难点在于有效视频语义信息的提取和表达。具体来说,涉及到海量视频的结构化描述、视频节目的自动编目、高层语义概念的检测、还包括视频广告与节目的定位与拆条、在视频索引建立的前提下的快速鲁棒的视频搜索等。
5.研究思路和总体方案
本课题将产生一批产品化程度高的专业产品和一个高性能、高效率的生产和运营平台。本课题的主要技术难点也是我们的创新点是多种高端技术在视频云计算平台上的集成应用。 课题最终形成的产品成果包括: 1. TMEncoder高清视频采集编码器 2. iGuide虚拟播出系统
3. iVision多点控制展示系统 4. iSearch视频资讯搜索系统 5. iSee视频资讯展示系统
6. iPai、iPlay、iStudio等其他产品 7. 课题形成的生产和服务平台产品是: 8. 电视数据智能采集处理及分析平台
2)课题实施的基本原则
1标准化 ○
遵循国际、国家以及行业标准,能够与采用相同标准的相关系统平台实现平滑对接。方案遵循的协议簇包括:
DVB国际标准
H.264/MPEG-4 AVC、AAC、MPEG2、MP3音视频编码标准
TCP/IP协议 HTTP协议 RTMP协议
SDI-SD/HD数据接口协议 Restful Web Service规范 2完整性 ○
要求课题研究和开发内容能够完整解决整个项目所需的技术问题,保障项目正常实施,最终实现的成果能够完整的实现预期目标。
3开放性 ○
遵循开放性设计原则,对内部和外部系统提供规范、简单的接口协议,能够实现系统间的高效连接。
4先进性 ○
语音识别、图像识别、信息自动标引、文本自动分析、编码、传输和播放实现过程中充分考虑技术的先进性和成熟性,能够代表当前技术的主流和未来技术发展的方向。
整个生产和运营平台的架构充分考虑当前主流的技术标准,能够与第三方系统进行平滑对接。
5 经济性 ○
课题研究充分考虑运行成本,保障技术研究和项目实施具有较高的经济型。
二 主体部分
逐一论述各项研究内容的研究方案、研究方法、研究过程、研究结果等信息,提供必要的图、表、实验及观察数据等信息,并对使用到的关键装置、仪表仪器、材料原料等进行描述和说明。
1.课题研究内容、技术路线和创新点 1)研究内容
本课题将产生一批产品化程度高的专业产品和一个高性能、高效率的生产和运营平台。本课题的主要技术难点也是我们的创新点是多种高端技术在视频云计算平台上的集成应用。 课题最终形成的产品成果包括: ? TMEncoder高清视频采集编码器 ? iGuide虚拟播出系统
? iVision多点控制展示系统 ? iSearch视频资讯搜索系统 ? iSee视频资讯展示系统
? iPai、iPlay、iStudio等其他产品 ? 课题形成的生产和服务平台产品是: ? 电视数据智能采集处理及分析平台
2)课题实施的基本原则
1标准化 ○
遵循国际、国家以及行业标准,能够与采用相同标准的相关系统平台实现平滑对接。方案遵循的协议簇包括:
DVB国际标准
H.264/MPEG-4 AVC、AAC、MPEG2、MP3音视频编码标准 TCP/IP协议 HTTP协议 RTMP协议
SDI-SD/HD数据接口协议 Restful Web Service规范 2完整性 ○
要求课题研究和开发内容能够完整解决整个项目所需的技术问题,保障项目正常实施,最终实现的成果能够完整的实现预期目标。
3开放性 ○
遵循开放性设计原则,对内部和外部系统提供规范、简单的接口协议,能够实现系统间的高效连接。
4先进性 ○
语音识别、图像识别、信息自动标引、文本自动分析、编码、传输和播放实现过程中充分考虑技术的先进性和成熟性,能够代表当前技术的主流和未来技术发展的方向。
整个生产和运营平台的架构充分考虑当前主流的技术标准,能够与第三方系统进行平滑对接。
5 经济性 ○
课题研究充分考虑运行成本,保障技术研究和项目实施具有较高的经济型。
2. 课题的技术路线
本章节将详细描述课题说涉及目标产品和平台的技术方法。
(1)TMEncoder高清视频采集编码器
TMEncoder的设计目标是实现高清高性能的电视视频的采集编码。该设备是整个云计算平台的信号输入接口设备,要求在稳定性、适配性和产品化程度上都能达到较高的水平。完成后的产品既可以作为整个系统的一个重要组成组件,也可以作为独立的产品对外销售,遵循国际国内通用编码器的输入输出规范。
TMEncoder采用H.264编码标准,使用国际领先的商用编码器内核。该编码器在视频编码的质量和效率上优于众多免费的开源编码技术和价格昂贵的硬件编码技术,能够以512Kbps的码率实现标清视频编码,在1Mbps~1.5Mbps的带宽范围内实现高清视频编码。编码器提供超过100项的优化编码参数,Two-pass、双向预测、动态GOP、帧变化智能检测和最高High Profile/5.1 Level的H.264编码能力,能够保障向您的网络中交付最佳质量的视频内容。
编码器支持多种格式的视频源,包括:1)卫星和有线数字电视信号(DVB);2)模拟电视信号;3)IP网络信号;4)SDI/HDMI高清接口等。支持的输入视频格式包括:mpeg1/2/4、VC-1、H.264、RAW等,音频格式包括mp2/3、AAC、AC-3等。支持高清编码,画面大小最高支持1080p,帧率25fps~50fps。
编码器同时支持4路信号采集输入,实时编码。每路信号可同时输出256Kbps、512Kbps、1Mbps三种码流,码流可采用Baseline,Main,High Profile规格编码。音频采用AAC-LC和AAC-Main方式编码输出48Kbps,采用Mpeg-TS复用后输出。
编码输出支持TS over HTTP (M3u8格式)、TS over UDP和RTMP over TCP多种方式。编码器同时设置较大的存储,内置视频播出服务,可以在采集编码的同时提供直播和点播服
务,支持7天内时间段的视频点播回看,支持10秒的视频关键帧截图。
编码器具有便捷简单的WEB管理方式,能够灵活配置各项编码参数和发布参数,可以动态配置每个采集通道的业务项目。
表 编码器规格参数表
输入 ? 1路IP输入,1000M网卡,接收DVB-C、DVB-S、MPEG over UDP信号输入 ? 3路SDI-SD/HD ? 可选HDMI、DVI、AV、S-Video、YUV、VGA 编码格式 ? 视频: H.264,支持Baseline、Main、High Profile Level 5.1,支持高清、标清和超低码率编码 ? 音频: MP3、MP2、AAC、AC3 输出 ? 9路TS over HTTP ? 9路TS over UDP ? 9路RTMP over TCP ? TS File 运行环境 ? 操作系统:64位 Linux ? 处理器:英特尔? 至强? 5600 ? 网络:1GbE NC382i 多功能双端口 ? 内存:4GB PC3-10600R RDIMM DDR3 ? 外形:机架式2U
系统结构:
图 编码器系统结构图
功能特征:
? 顶级商用H.264和AAC编码器,支持高清、标清、超低码率编码,支持H.264
Baseline/Main/High Profile 最高5.1 Level编码配置。 ? 携带支持SDI-HD/SD、HDMI、DVI多种输入接口的高清数字采集卡。 ? 内置碎片化和流播出服务,对外提供RTMP、UDP、HTTP输出接口。 ? 同时3路信号输入、3路高清实时编码和9路直播流输出。
(2)iGuide虚拟播出系统
虚拟播出技术为运营商在互联网上构造全新的播出频道提供了最经济和最灵活的实现方案。该技术实现将视频文件和直播流,编排成一路全新的频道对外播出。运营商可以根据需要,将多个传统电视频道上的播出内容和本地文件内容按照新的EPG播出安排构造网路电视频道,通过这种应用安排,运营商能够突破传统电视频道播出内容的限制,为终端用户提供更丰富和更好体验的播出内容。 按照用户不同的需求,能够在无人值守和人工干预两种状态下网络频道,能够实现基于电视信号源的实时采集直播、基于文件源的虚拟直播、文件源和直播信号源的混排直播、即时导播和插播、互动点播等在互联网视频播出的各种业务,并能够跨平台和支持各种浏览器和播放终端。
图 虚拟播控EPG编排界面
图 虚拟播控即时导播界面 规格参数: iCast规格参数表 7天EPG编辑 输入输出画面实时监控 即时导播 最多64路直播流输入切换 最多1024个文件输入源切换 文件源自动转码和切片 精确到I帧的播出内容切换 播出内容缓存和回看 系统构成:
虚拟播控平台主要由六个部分组成:
播出素材库管理: 对播出的素材(包括文件源和电视直播信号源)进行上传、修改、删除等操作。
编转码中心:这部分主要将播出的素材(电视直播信号源和文件源)统一的进行转码,碎片化,以适应统一播出格式的需要。
iCast管理客户端:主要利用播出素材库中的内容对每日直播的EPG进行编排,即时插播和导播等操作控制部分,控制后端播控服务进行工作。
播控服务平台:主要接收管理客户端的指令,将用户编排好的EPG对外播出。 分发CDN平台:主要将播出的直播流对全国各CDN站点进行分发,或与CDN分发服务商进行对接。 功能特征
使用文件源和直播源快速创建全新的播出频道,文件、直播源自由混排播出。
即时导播功能,可以将直播流中的内容替换成其他感兴趣的内容,如广告插播、广告替换。 功能强大的EPG编排功能,可方便的创建1到7天内的EPG节目单。
(3)iVision多点控制展示系统
iVision 多点控制展示系统由前端控制(最多30台,兼容丌同系统设备),中转控制主机(一台 Mac)和多台展示设备组成 (Mac 或 PC 台式机或大屏)。工作时,前端控制设备(iPad,iPhone,PC 或 Mac)向中转控制主机发送展示数据命令,收到数据后中转控制主机分析数据的来源并对照命令列表将数据转发给指定的展示设备;展示设备收到数据后进行相应的数据展示或读取中转控制主机的存储内容进行内容展示。
本系统的特点是:多点控制,多点展示 ,工作方式可列队或并发,自由随意切换。
核心的中转控制主机采用 Mac OSX 的苹果台式机。其他终端设备以中转控制主机为核心来进行终端的配置。
所有设备以有线或无线形式通过无线路由器组成的局域网互联。
系统工作流程解析:
1) 中转控制主机建立公用网络服务和网络搜索服务。
2) 启劢搜索展示设备建立的网络服务,并为搜索到的服务建立独立的数据读写通道,用来向展示设备发送命令数据。
3) 前端控制设备向中转控制主机发送登陆请求 ,展示设备向中转控制主机发送登陆请求。 4) 中转控制主机收到登陆请求后 ,查对配置清单确定用户身份,并为其建立独立数据读写通道。
5) 前端控制设备和展示设备成功登陆之后,即可向中转控制主机发送命令数据,进行展示
操作。
6) 中转控制主机收到已登陆用户的命令数据后,查对用户的命令权限等配置文件后,并对比命令集文件后,将命令数据转发给指定的展示设备。
7) 展示设备收到命令数据后,根据数据要求访问中转控制主机的展示内容存储并直接将内容显示出来。 系统优势:
增加了中控系统后的 iVision 产品可以在现场部署多个展示终端,大屏、一体机、mac 电脑等。使得讲解员或者现场主持人可以更加灵活的设计演示内容。 因为通过中控系统的枢纽联系,所有终端之间做到了互联互通,有劣于工作更加有效的进行。 现场操作中屏幕切换、演示等效果更加酷炫、操控感比原来增强。
支持有线及无线的方式可以在复杂的现场布置演示环境的时候更加容易,克服场地带来的不便。
多终端的配合使用可以部署立体感更强的现场演示环境。
(4)iSearch视频资讯搜索系统
天脉iSearch能实现全球电视节目的精准索引,利用天脉云平台24小时不间断收录全球的电视节目信息。它能够实现海量数据的全面、及时搜索,并可以满足运营者对于视频信息统计的专业需求。iSearch主要面对三大用户群体,政府机构、电视媒体和企业。政府机构可以利用它来了解舆情资讯,了解民生;电视媒体用来制作电视节目,搜索各大媒体对于热点问题的关注程度;企业用户可以用来了解广告市场资讯,洞察市场和政策方针等等。
iSearch以媒体、企业、机关为主要服务客户,天脉利用先进的视频处理技术和互联网技术,提供可定制的、实时的、高品质的电视新闻采集与加工服务、电视新闻实时监测服务、媒体版权交易服务。iSearch使电视资讯实现全国有效覆盖和精准获取,为政府机构、企业和电视媒体掌握新闻资讯、了解大政方针、洞察市场商机、监测舆情资讯提供最为有效的专业工具。
天脉拥有云计算视频加工中心为iSearch客户端提供着强有力的支撑。在全国建设的多个数据接收网点,现已覆盖了200个电视频道、4000档电视栏目、3年18大类(新闻、娱乐、体育、教育、生活、科技等)共计千万条电视节目素材积累。不仅国内的各卫视频道和市级电视频道被纳入其中,还有如NHK World、BBC World、CNN等境外知名电视频道。这样的视频资源平台,其覆盖面之广,资源之丰富,属全国乃至世界之首。目前,没有一家媒体可以提供诸如此类的电视节目搜索服务。
iSearch更加令人惊艳的是其对信息的全面精准搜索。iSearch借助云平台可以对电视资讯进行智能化、精细化处理,通过关键字搜索直接定位到具体的镜头和一句话中,是传统媒资信息搜索密度的80倍。
天脉的非结构化信息标引技术,利用语音识别建立的文本信息作为索引依据,这种搜索模式会尽可能多的帮助用户搜集包含关键词的所有视频。这样的功能可以很好地体现搜索信息的准确性和完整性,可方便的构造出搜索事件的立体信息维度,让使用者在海量电视素材中迅速锁定最有价值的素材信息。
这样如此精准的搜索却并不繁冗复杂。iSearch采用类似于Google的通用搜索功能,部署方便、操作简单,无需特殊培训(独特的iPad版具有更完美的使用体验)。
图 产品原型 频道信息
图 产品原型 热词
(5)iSee视频资讯展示系统
iSee倚靠天脉云计算视频处理平台,开发运行在iPad系统和Android系统中,用于在线观看电视视频的应用软件。iSee提供了多样化的检索和浏览方式,并几乎囊括了全国所有电视台播出的电视节目,同时它拥有功能强大的搜索引擎,用户可以针对个人喜好收藏下载感兴趣的视频。天脉iSee能让用户在最便捷的条件下、最短的时间内收看到最全面的电视节目。
海量的资源覆盖。天脉拥有云计算视频加工中心为iSee客户端提供着强有力的支撑。在全国建立的多个数据接收网点,现已覆盖了上百个电视频道、上千档电视栏目。目前,没有一家网络视频客户端能够提供如此丰富全面的电视视频资源。
数据整合,准确及时。天脉云计算视频加工中心能够对电视资讯进行实时、高效的素材收录整合。它可以确保在电视播出后,最快10分钟的时间即可被浏览和搜索到。天脉云平台改变了传统的人工处理数据方式,利用智能语音识别、字幕识别,画面特征识别等工具进行数据整合,结合人工校验的方法确保信息输送的准确高效。
强大的检索功能。iSee基于天脉智能化语音识别及图像字幕识别技术,构造出独特的音视频信息检索引擎。用户输入任意关键字即可精准检索到视频节目内容。画面上的字幕,视频的语音都可以成为检索的对象。
电视节目的智能化处理。云计算视频加工中心将所有的电视节目进行智能化处理,在收看视频内容的同时,可以收看到该视频相关的文字介绍,并能够收藏该节目到收藏夹中以便查找。
挖掘更为丰富的新闻内涵。iSee其所附带的关联搜索功能,可以对搜索内容进行深度关联检索,为使用者挖掘更多维度的信息,挖掘更为丰富的新闻内涵,展现新闻全貌。
简洁明快的设计。iSee的设计风格极具时代感,简洁明快的同时又不失功能性的全面体现。一目了然的操作界面,多样化的浏览检索方式可供用户使用,帮助用户快速进行节目定位与收看。
图 视频检索与播放
iSee提供多样化的检索和浏览方式。用户可以按照频道、栏目、栏目播出时间和主题的顺序来查找电视节目;也可以通过节目内容的八大分类(综合新闻、地方新闻、新闻评论、财经新闻、法制事件、体育频道、精品访谈、军事前沿)中寻找所需要的电视节目;能够键入视频关键词,搜索与关键词相关的视频内容。
iSee在视频播放的界面中,除了时长显示、进度条、全屏播放等常规功能之外,用户还可以看到播放视频的摘要简介。图文的结合,最大程度的减少了视听盲点。
图 视频检索与播放
图 视频检索与播放
在iSee播放某一视频的同时,用户可以看到在播放窗口下方有关联搜索这一功能选项。用户可以根据该视频的关键词挖掘与之相关的新闻联系,关联成网状,由使用者熟悉的一面发现鲜为人知的关联面。大大提高了收看新闻的趣味性,也使用户能够从多角度查看新闻资讯,全面掌握新闻事件。
图 关联搜索
iSee产品支持视频收藏和下载。用户可以根据喜好,将喜欢的频道或者栏目放到收藏夹中,以便查找和收看。用户还能够下载视频到本地存储,下载后的视频支持图文同播的功能。视频播放的同时可以动态突出显示文本内容,大大方便了用户快捷的获取视频信息,回避了环境干扰所造成的视听盲点。
图 视频下载与播放
(6)iPai、iPlay、iStudio等其他产品
除上述产品外,本课题还将对公司既有产品iPlay、iStudio、iPai等产品进行升级,适配新的技术和接口规范,并开发新产品iDiscovery、eMeeting等产品,保障解决方案和平台功能的完整性。
3.电视数据智能采集处理及分析平台 (一)生产平台方案
天脉聚源在中国无锡国家软件园建成了“视频中国”(无锡)视频云计算产业基地,是拥有600台服务器的全球最大海量电视内容智能处理及信息服务平台,具有处理国内200套电视节目4000档栏目,日均30000条电视内容编目的能力,可面向1000家媒体机构客户提供365天7×24小时不间断服务。
服务内容包括:节目碎片化编目、数据挖掘和整理、智能化模式识别和分析、高中低转码、远程成品素材推送。这些服务均实现了对高、中、低多码率的集中收录和检索,同时满足专业级节目生产、新媒体资源调用、以及对外的媒资推广的需要。
通用云计算加工服务
? 电视新闻(节目)快速数字化编目;
? 电视新闻(节目)碎片化处理(拆条、去广告); ? 电视新闻语言识别及音画同步索引建立; ? 电视节目图像OCR及音画同步索引建立; ? 面向多终端应用的视频转码服务; ? 加工后成品素材包远程分发推送。
专用云计算技术服务
? 本地私有云媒体平台部署搭建;
? 私有云媒资平台与高码收录系统的整合匹配; ? 本地私有云媒体平台搜索统计引擎开发; ? 本地私有云媒资源库及分发系统建设。
服务优点
? 更省:节省原有大量编目人员的开支,降低了编目设备和场地的投入; ? 更多:云计算平台的强大处理能力,可为客户处理海量实时信源;
? 更快:云平台处理效率是人工编目的20倍,最快电视播出后10分钟后成品即刻上线; ? 更细:云平台可对素材的影像画面、语言特征自动提取,而且标引后的信息密度是传统
人工编目媒资的15倍; ? 更准:云平台构造的数据结构更加精准的搜索到自己所需要的有用信息,可以自定义搜
索到一段新闻、一句话、一条字、甚至是一个镜头;
? 更全:云平台的流程实现对高、中、低多码率的集中收录和检索。同时满足 专业级节
目生产、新媒体资源调用、以及对外的媒资推广;
? 更灵:使用更加灵活,既可以满足媒资的搜索、检索服务。又可以方便的和台内其他家
系统做灵活的接口,扩展服务。
(二)资源存储管理和服务方案
资源平台正式为了存储管理这些资源而出现的,要将各种生产能力所产生的各类资源,进行存储、索引和管理,构建一个功能完善的底层支撑平台,用于满足上层各种应用的调用需求。通过丰富的应用接口,公司各类应用基于资源平台进行开发,来进行浏览和检索,获取所需要的各种数据。
资源平台要能够实现海量数据的承载、快速精准的检索,还需要深入挖掘资源之间的关联关系,建立平台资源之间的内部关联关系。围绕着资源本身、关键词TAG、使用资源的人这三者,来进行数据索引,并通过对资源的分析、对人行为的记录,来影响这三者之间的关联关系,从而构建可生长的、动态的、个性化的知识关系网络,来帮助用户最快速的找到自己所需要的资源,并在知识关系网络的帮助之下,不断发现与之相关的其它资源。
资源平台立足当下,着眼未来,为实现公司对资源平台的远景期望,平台在设计时具备如下系统特点:
? 能容纳丰富的资源类型,包括视频、网页、文档等 ? 能支持大规模数据的存储、处理和请求 ? 满足SAAS的软件架构,将平台能力输出 ? 能支持公有云私有云结合的分布式体系架构
? 能实现针对资源的权限限定,来做高效的收敛检索 ? 能实现资源的TAG云关联挖掘搜索
? 平台能提供开放的应用接入,实现丰富的Restful接口
资源平台的核心点包括资源、TAG、人三个要素,资源平台寄期望于打破旧有的条目搜索方式,能够实现智能化的TAG云搜索网络,不断完善TAG云关联搜索,建立合理的反馈生长机制,实现高效而精准的检索能力,是资源平台将要长期努力不断完善的方向。
开放架构
资源平台并不是一个封闭的企业平台,而会是一个大规模部署的互联网平台,为了将来平台的推广考虑,同时也考虑大规模部署的软件成本,资源平台基本采用开源架构来进行设计开发。
平台开发语言采用了多种语言结合的方式,C、PHP、Python等在资源平台均有涉足,完全基于Linux操作系统,并采用各种诸如Nigix、Varnish等各种开源软件。并根据实际功能的需要来对进行开源软件进行自行开发。
平台采用MongoDB和MySQL搭配来实现数据库需求。MySQL是一款非常成熟的开源数据库,当前众多的互联网巨头都大量采用该数据库。MongoDB是一款优秀的文档型数据库,采用MongoDB 文档型数据库来作为数据存储,主要考虑资源平台数据结构过于复杂,资源类型存在不确定性,未来数据读写压力可能极大,数据被分组存储在数据集中,被称为一个集合(Collenction)。每个集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。MongoDB是一种模式自由(schema-free)的数据库,这意味着对于存储在mongodb数据库中的文件,我们不需要知道它的任何结构定义。如果需要的话,完全可以把不同结构的文件存储在同一个数据库里。资源平台的数据库体系能够支持未来不断扩展新的资源类型,
理论上简单调整便可以完成扩展。
资源平台是一个完全的SAAS平台架构,实现了标准的SAAS模式三大特色: ? 互联网特性,并通过大量的WebService形式为用户提供服务。
? 多租户(Multi-tenancy)特性:一套标准体系为不同天脉客户提供资源平台服务,构
架无锡统一的用户云平台。
? 采用 Tid区分所有数据,包括用户、角色、资源等各类信息,能够实现不同用户的资
源平台数据托管。
服务特性:核心功能都服务化,未来可向不同客户提供不同服务组件。 为了便于未来平台的推广,使第三方用户能够进行应用接入,来享受资源平台的服务能力,平台在采用了大量的标准架构予以实施。
采用流行的Restful风格接口来实现WebService接口,以标准的HTTP状态PUT、GET、POST、DELETE方法来进行资源的增删改查。
采用ATOM资源描述协议来描述资源,遵从或者参考了各类流行资源描述方法,例如Yahoo的Media描述方法、OpenSearch、Google API等均进行了详尽的参考。
采用OAuth2.0来完成平台的用户认证,这是当今最为流行的互联网认证 体系,包括人人网、新浪微博等大量开放平台均遵从了这一标准。
这些开源、开放、标准的架构体系将使得平台的发展和推广更加顺利,也将获得更为低廉的维护成本和开发成本。
平台组成
资源平台是由一系列系统组成,来共同完成平台的完整功能,按照功能的组成,我们在当前阶段完成了一系列的软件功能,为了便于维护和将来完善或重构,我们将平台分为多个系统,系统按照高内聚、低耦合的方式来进行实现,并遵从如下准则: ? 系统与系统(或叫服务与服务)之间基本属于低耦合,便于维护。 ? 每个系统在总的原则之下,按照自己逻辑和技术来实现。 ? 各个系统按照Restful提供自己的对外接口,全面开放。
? 理论上每个系统甚至可以部署在不同的机房,可分布式部署扩展。 ? 应用可以根据自己的需求来选择对平台的接入。
? 就目前阶段而言,资源平台一共具备如下的主要系统组成:
核心数据服务
核心数据服务存储所有资源的数据信息,以MongoDB来构建数据库体系,并以资源主体、资源属性、资源分类来完成对一个资源的描述。
认证授权系统
认证授权系统用于掌控整个平台各个系统之间的接入权限,用于控制接入的应用所具备的权限,其所对应的用户信息等,其分为三个方面的鉴权:
系统级授权——内部使用,应用在各个系统之间的正常通讯。往往不做限制。
应用级授权——针对平台之外,接入的外部应用产品进行授权,接入的应用必须是合法的,通过唯一标识符client_id配对client_secret来认定是谁接入。应用授权也会涉及到权限的设定,其将会是服务层面,例如限制使用的服务类型,限制同时请求的并发数量,是根据未来业务可拓展的。
用户级授权——通过用户名和密码来认定唯一的用户身份,通过角色来指定特定的访问权限,将一个用户赋予一个或者多个角色来控制用户的访问范围。
而针对具体的授权流程,平台设定了如下方式来进行控制——在每一个认证环节中,涉及到三个主要组成:被请求的服务、发起请求的应用、进行授权管理的认证体系。
搜索及数据挖掘
搜索引擎是整个平台的核心体系,其分为全文索引体系和Term索引体系,用于构建Tag云的关联搜索,由如下主要功能组成 ? 文档服务器 (Doc Servers) ? 数据索引 ? 全文搜索 ? 缓存体系 ? 对外服务接口
其整体的搜索引擎架构流程如下所示:
搜索引擎系统可以建立针对海量数据的快速索引,能实现短时间内的重建索引、增量合并和增量索引,并建立了全面的监控机制用于掌控系统的运行健康状态。 搜索引擎的全文搜索体系能够满足如下功能: ? 能够对平台内所需的资源进行索引构建,能够针对不同类型的资源进行不同维度的字段
索引;
? 搜索引擎能够实现短时间内的增量索引机制以及特定时间内的重建索引机制,以确保平
台内所有资源在索引平台内的及时性与完整性; ? 能够提供高效的和规模化的搜索能力,在目前阶段支持亿级以上数据的索引能力,并能
够在这一规模内提供秒级以内的搜索响应速度;
? 支持索引的分片机制,能够建立分布式的搜索能力,便于未来平台扩展;
? 能提供不同类型资源的关键词查询、与或非查询、复杂式条件组合查询,支持指定字段
查询、精确匹配、模糊匹配等多种模式查询; ? 内置分词引擎,来提供针对关键词的分词分析,提供一定长度范围内的语句输入搜索分
词技术;
? 提供数据索引推送接口,支持未来与平台内任何第三方系统对接,对其数据进行索引; ? 提供数据检索接口,支持按照OpenSearch以及Atom等资源描述协议输出通用化搜索返
回数据;
? 要求对于海量的内容资源做针对性的信息标识描述,并构建对应的资源TAG云架构体
系;
? 用户可以按照常规体系的方式对内容进行搜索,也可以按照针对性的信息进行关联搜
索,能发掘平台体系数据内的关联关系;
? 能够发掘TAG与TAG、TAG与用户、用户与用户、资源与TAG等之间的复杂关联关系,
并提供可视化的展现手段和数据调取接口;
? 能够对用户的行为进行分析反馈,挖掘用户与内容之间的关联关系,来辅助平台运营,
提高内容投入针对性;
? 挖掘体系能够支持对至少亿级以上数据的挖掘能力,并具备随规模扩展的平滑过渡扩展
能力;
队列及计算单元
为了实现系统之间的异步通信机制,来将一些不能实时完成,需要进行队列调度和消息回馈的功能抽象出来,形成独立的系统,我们建立了队列及计算单元系统。 ? 队列我们采用了成熟的Gearman来进行实现,在其流程中,分为作为一个任务分发架构,
它能够轻松的将前端的任务通过Job Server分发给后端的Worker处理。Gearman请求的处理过程涉及三个角色:Client -> Job Server -> Worker。 ? Client:请求的发起者,可以是C,PHP,Perl,MySQL UDF等等。 ? Job Server:请求的调度者,用来负责协调把Client发出的请求转发给合适的Worker。 ? Worker:请求的处理者,可以是C,PHP,Perl等等。
这一分布式队列机制是一个可以理论上无限扩展的体系,如下图所示:
就整个系统而言,其能够实现如下的功能特色: ? 能够对接入到资源平台的数据进行统一的处理,支持各种通用格式的资源,包括音视频、
图片、文本等;
? 提供队列服务控制,来实时接收处理任务,并进行异步任务分发至具体执行单元; ? 能够对所有处理任务进行状态查看,管理并维护所拥有的处理单元,能够控制处理任务
优先级分配等;
? 能提供针对音视频格式转换、终端适配、图片适配、文本关键词提取、文件分发等具体
处理单元;
? 处理子系统可以通过扩展不断挂载更多的处理单元,要提供标准化的处理模式——例如
可引入文档转换;
? 具备分布式的处理机制,且能够不断扩展具体的处理单元,能够通过核心队列控制部分
来识别所拥有的所有单元,并派发具体的处理任务;
? 处理系统要提供良好的容错性,能够建立重试机制和错误反馈机制;
三 结论部分
阐述主要研究发现,可包括研究成果的作用、影响、应用前景,和研究中的问题、经验和建议等。
自从电视机在上世纪初被发明以来,在几十年的时间里,电视机除了在色彩、清晰度和尺寸方面变化迅速,而在人们观看电视的根本体验上,从未发生过变化。电视以其按照EPG(电子节目播出单)线性播出的形式,在媒体形式单一的年代中,曾经为我们营造过每当入夜便一家老少围着电视的温馨画面。然而,随着IT科技的进步,尤其是近年来视频网站的迅猛发展,传统的电视平台由于其播出平台相对单一,观看体验线性化等缺点,而逐渐显得不太符合当代人们的快节奏生活方式。
天脉作为国内新媒体行业的知名公司,正在致力于改变人们观看电视的传统体验,将线性播出的电视内容,通过一系列的技术手段,来实现对音视频的信号采集、编码、汇集、分发、展现,最终呈现为可实时直播、暂停时延(电视直播暂停后可以继续从暂停时间播放)、回看点播(例如可以回退到5分钟前观看电视内容)为一体的新形态,并通过三网融合,面向各类终端,实现用户可以随时、随地观看任意时间段的多频道电视内容。在这一体系下,“精彩可以错过”,平台突破传统方式的时间和空间上局限性,来充分发掘电视内容所蕴藏的最大价值,促进这个行业的革命性发展。
作为云计算服务提供商的天脉聚源本身并不利用这些视频直播流来向最终用户提供直接访问,而是充分利用云计算平台的服务特性,将直播能力提供给有需求、有牌照的互联网电视运营商,天脉提供按需索取的直播平台云服务,相当于云计算中的PAAS(平台即服务)架构。第三方公司利用云计算平台的能力开展运营。充分体现云计算平台的资源集约化优势,提升终端用户体验,降低运营企业接入成本,避免社会资源重复建设。
天脉公司在无锡已经建立了国内最大的视频云计算平台,针对海量的电视内容进行采集处理,进行计算机智能标引与人工编辑加工之后,提供视频检索和内容推送服务,前期已经涵盖了国内约200个频道的电视内容采集,并为国内主要的门户网站提供加工后的视频内容,以供其向用户提供点播服务。该平台已有设备和音视频相关技术积累为此次直播云平台的实现奠定了坚实的基础。在这一基础上,针对直播云的特性需求,我们就音视频直播编码、
低延时或实时直播信号传输、多终端播放、直播延时及回看技术方面已经取得了明显的进展,并已初步开发了在机顶盒、手机、电脑和平板电脑等多种终端上的示范应用。
产业化方面直播云平台我们目前已经在超过30个城市建立了电视信号前端接入设备,涵盖了主要的卫视频道和一线城市的地面频道,共计实现约100个电视频道的实时直播、延时和7天内回看,并能借助于天脉公司的海量电视节目加工平台可以实现部分电视内容在两年内的回看。
利用已有研发成果,在市场开拓方面,直播云已经具备了一定的市场客户——当前中国网络电视台(CNTV)采用天脉提供的直播流,构建了其苹果应用商店的CMTV(中国移动电视)应用,为用户提供近100路电视频道的直播和回看,基于天脉的云计算体系,CNTV本身并不搭建任何系统,而只需要接受天脉的直播流之后利用CDN进行大范围服务即可。与此类似的客户还包括迅雷、北京台、山西台等客户。
为实现这一庞大的直播云,聚集所有国内的主要电视信号,改变过去人们观看电视的体验,来面向庞大的用户群体进行直播、延时和回看服务,需要具体建设如下内容:
(1)分布式的直播信号采集编码及传输体系,能实现在针对各类广播电视信号的采集和初始编码,并研发实时或低延时的直播信号传输技术,能够将编码后的直播流稳定、高效地通过公网传输至汇聚平台。
(2)多路直播流汇聚管理系统,在中心平台对若干直播流进行汇集,并进行组合输出,同时提供IP直播流鉴权技术,实现云平台用户获取直播流的鉴权。
(3)面向CDN的流分发技术,将直播流分发到云平台客户所购买或租赁的CDN节点,使之可提供大范围的用户规模支持。
(4)适应多格式的实时流翻转,为适应部分特殊终端,在最前端提供流转换,输出各类标准。
(5)多终端直播应用产品,针对不同终端,能实现基于三网融合的电视直播、回看和时移功能,提供创新性的电视观看体验。
附 录
若有附录,插在此处
参 考 文 献
参考文献插在此处
正在阅读:
科技报告正文模板 - 图文04-25
九年级数学上册第五章投影与视图检测题(无答案)(新版)北师大02-27
学滑板的启示作文600字06-18
中国古代诗歌发展简史04-24
爆破专项施工方案08-14
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 模板
- 图文
- 报告
- 正文
- 科技