移动目标视频跟踪关键技术的研究

更新时间:2023-07-19 18:46:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

关于视频跟踪的好硕士论文

俗萄

电占料技女管

硕士学位论文

MASTERDISSERTATION

论文题|__l

学利专业

指导教师

作者姓名

班学号堡垫!堑望堡坚堕蒌竺望查!!!堕计算机软件与理论顾小丰高工坐竖一———三螋墼竖!!!蛩

关于视频跟踪的好硕士论文

摘要

摘要

移动目标视频跟踪是当前信息领域的前沿和热点方向,融合了计算机科学、自动控制、机器视觉、图像处理、模式识别、数学等多学科的先进技术。本文以智能视频监控作为主要线索,研究静止背静下运动目标的检测、跟踪等视频跟踪中的关键技术。

计算机智能视频监控是在不需要人为干预情况下,利用计算机视觉和视频分析的方法对摄像机拍录的图像序列进行自动分析,实现对动态场景中目标的定位、识别和跟踪,并在此基础上分析和判断目标的行为,得出对图像内容含义的理解以及对客观场景的解释,从而指导和规划行动。这种智能视频监控己在军事和工业上得到一些成功运用,但智能视频监控在理论和运用上都还存在很多难题。当前国内外很多学者投身该领域进行研究和探索,并取得了大量成果,本文是在这些成果的基础上进行的。

首先,本文系统地研究和总结了国内外运动目标检测的方法,分析了各方法的利弊、实用场合,在此基础上,重点研究了混合高斯模型,并将极大似然原理引入混合高斯模型,该方法较以往的基于经验值的混合高斯相比,有严密的数学理论作支撑,并且在此方法下的检测效果也能满足固定场合的要求。

其次,本文对图像增强、图像去噪和图像分割也作了较系统的总结,并给出了部分实验结果;在此基础上总结出一种图像点、线增强的一般方法。

最后,在跟踪方面使用经典的运动分析理论—卡尔曼滤波,对运动目标的下帧所在区域作估计,进而缩小搜索空间,提高检测和跟踪速度。关键词:运动目标检测,运动目标跟踪,混合高斯模型,卡尔曼滤波

关于视频跟踪的好硕士论文

ABSTRACT

Videotrackingofmovingobjectisahotandlatestdirectionintoday’s

science,informationtechnologyfield.Itreferstolotsof

automationsubjects,includingcomputercontrol,computervision,imageprocessing,pattern

asrecognitionandmath.onnethesisputtheintelligentsurveillancesyStemthethread,focusedmoving

objectdetectionandmovingobject

1heintelligenttrackinginstablebackground.cansurveillancesystemautomaticallyanalyzethesequenceofimagesbythemethodsofcomputervisionandvideoanalysis.The

recognize

andsystemcanposition,canandtrackobjectsinamovingenvironment.Furthermore,itaimsofthissystemarcalsoanalyzethejudgethemovementofobjects.The

toexplaintounderstandmeaningsofvideostreamand

actionsthescenescomprehensibly,hencetoguideandmakedecisions.Someoftheintelligentsurveillancesystems

projecthavesuccessfullybeenappliedtoarmyandindustry,butthestillfaceslotsof

andachievedchallenges.Alargenumberofresearchershavebeenstudyingthe

paperwasbasedonsubjectmanyprogresses.TIlistheseachievements.

Model,and

newFirstly,thedifferentkindsofdetectionmethodswiththeiradvantagesanddisadvantagesthenwereconcluded.WemainlyresearchedtheGaussMixtureputthemaximizinglikelihoodideaintotheGauss

canMixtureModel.The

filtermethodWasmorerigorous,andthedetectionresultsmeettherequirements.andimage

given.We

dotsSecondly,themethodsaboutimagesegmentationwereenhancement,imageexperimenttoconcluded,andthensomeresultswereextended

threads.theimageenhancementmethod,whichCanusedenhancesomeand

Finally,weusedtheKalmanfiltertoforecastthe

canpositionofthemovingobjectinthenextflallle.Themethodreducethesearchspaceinordertoimprovethe

efficiency.

Keywords:movingobjectdetectioll'movingobjecttracking,GaussMixtureModel,

KalmanfilterⅡ

关于视频跟踪的好硕士论文

独创性声明

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。

签名:一生匿氅日期:2口明年f,qzbH

关于论文使用授权的说明

本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。

(保密的学位论文在解密后应遵守此规定)

签名:衅导师签各.趣扛日期:之僻5-月zf日

关于视频跟踪的好硕士论文

第一章绪论

第一章绪论

1.1课题研究的实际意义

移动目标视频跟踪就是实时地观测被监视场景的运动目标,如人或车辆等,并且分析描述他们的行为。该项技术主要致力于跟踪、监控的自动化和智能化,它融合了计算机视觉,模式识别,人工智能,自动控制,数学等领域的先进技术。对该课题的研究不仅一方面可以推进相关学科的理论进步,另一方面当前的军事、工业、医学等产业界也越来越多的运用改技术。

1.军事上

当前军事、国防实力的比拼,很大程度上是科技实力的比拼,武器装备也极大程度的转向于智能化,比如装甲战车的自动跟踪系统,卫星、导弹的自定位等,这些系统和研究方向的一个关键技术就是运动目标的视频跟踪。

2.工业上

工业上对视频跟踪的运用也是非常之多。监督和控制道路车辆的智能监控系统;银行、油库区的无人监控系统;运用于视频会议的网络智能监控系统;具有监控和跟踪能力的玩具等,这些系统的成败很大程度取决于视频跟踪技术的优劣。

两年一度的深圳安博展已结束【l】,2007年安搏展与往年最大的不同除了展商和参观人数创新高外,带有智能分析的视频监控软件举目皆是,智能分析已从两年前安博展上的风毛麟角变成了遍地开花的产品,并且很多产品已用在商业和生活环境中。

3.医疗上

目前的医学存在两方面的问题121,一是医生的训练无法科学化,二是诊断的结果加入了较多的人为因素。现代医疗仪器的使用在一定程度上解决了这两方面的问题,但仪器除了直接提供数据外,几乎不能进行任何自动分析工作,很多仪器如X光机、CT、B超、各种显微诊断设备等提供的都是图像,这样诊断的结论又再一次依赖判读者的经验,利用计算机视觉技术可以减少这种人为因素的影响。现在医疗图像的辅助诊断系统已经在早期疾病诊断方面起到非常重要的作用,同时医学图像处理近年来也成为计算机视觉领域中的重要研究方面。

关于视频跟踪的好硕士论文

电子科技人学硕+学位论文

通过以上材料和分析可知,视频跟踪的研究具有极大的理论和实际意义。1.2国内外现状

目前,对计算机视频监控的研究与应用方兴未艾【3】【4】【51。计算机视频监控是利用计算机视觉和图像处理的方法对图像序列进行运动检测、目标分类、目标跟踪以及对监视场景中目标行为的理解与描述。其中,运动目标检测、目标分类、目标跟踪属于视觉中的低级和中级处理部分,目前困难较大。近几年国内外有很多的大学,研究机构和企业都在做相关的工作。

1.国外1996年至1999年,在美国国防高级研究计划局(D眦)资助下,卡内基梅隆大学、戴维SARNOFF研究中心等几家著名研究机构合作,联合研制了一种视频监控系统VSAMf6J。VSAM的目标是为未来城市和战场监控开发一种自动视频理解技术,主要应用于未来战争中人力监控费用昂贵、环境危险或者人力监控无法实现等的场合。VSAM不但能进行一般性的军事安全监控,如军事基地、军械弹药库和海防线的监控;而且能够进行局部战场的实时监控,如敌方军力部署及调动情况等。

英国雷丁大学(UniversityofReading)巧】已开展了对车辆和行人的跟踪及其交互作用识别的相关研究。IBM与Microsoft等公司也正逐步将基于视觉的手势识别接口应用于商业领域中。Maryland大学的实时视觉监控系统W4不仅能够定位人和分割出入的身体部分,而且通过建立外观模型来实现对多人的跟踪,可以检测和跟踪室外环境中的人,并对他们之间简单的交互进行监控。国外的研究还有多传感器监控,使用多个传感器对某一地区协同监控;以及飞行器监控,如对从热气球上拍摄的视频图像进行分析和处理。MIT对情感计算进行全方位研究,正在开发研究情感机器入,最终有可能人机融合,其媒体实验室与HP公司合作进行情感计算的研究。IBM公司的“蓝眼计划”,可使计算机知道人想干什么,如当人的眼瞄向电视时,它竞知道人想打开电视机,它便发出指令打开电视机,此外该公司还研究了情感鼠标,可根据手部的血压及温度等传感器感知用户的情感。

图1.1为HONDA研制的代表机器人水平的ASIMO—P3【zJ,它可以以1.6千米/小时的速度行走。它的头部装有两部功能独立的摄像机,具有识别障碍物,对机器人进行导航的功能。图1.2是富士通公司研制的引路机器人【2J,该机器人具有靠2

关于视频跟踪的好硕士论文

第章绪论

脚轮行走(速度最大为3kmJh)、语音台成与语音弘恻、无线LAN通信、机械臂抓取05kg以内物体的功能.身体上的载物台可装运10kg以内的行李。视觉以别功能最具特点,不需用于引路的特殊标记.通过将泌别到的视觉信息与地图数据进行对照,就能一边躲避障碍物,一边根据自行决定的行走路线束行走。在视觉识别功能方面.样机采用了6部摄像头,分别设置在3个方向L,每个方向配置2部,实现立体视觉,井保证了足够太的视角。

幽l一1Honda机器^ASIMO.P3

2.凼内刚1.2引踏l『L器人

目前在国内的研究机构中ul,中国科学院北京自动化研究所模式泌别国家重点实验室的视觉监控研究组处于领先地位。他们对交通场景的视觉监控(基于三维线性模型定位、基于扩展卡尔曼滤波器的车辆跟踪算法),人的运动视觉监控馑于步态的远距离身份识别)和行为模式识别(提出了对目标运动轨迹和行为特征学习的模糊自组织神经网络学习算法l进行了深入研究.取得了一定的研究成果。国内其它一些高校也进行了这方面的研究,如上西北工业大学,浙江大学,哈尔滨工业大学等。

国内也有相当多的公司在作相关研究和运用,比如上海高德威智能交通系统有限公司,上海交大选通电了信息有限公司.中国科学院深圳先进技术研究院,北京嘉恒中自图像技术有服公司,北京大恒图像视觉有限公司,北京微视凌志图像技术有限公司等,但国内很多公司的部是仅仅运用国外的核心技术,自己作核心技术开发的公司不多。

国内于2002年5月召开了第~届全国智能视觉监控学术会议,对图像序列分析、目标定位、识别和跟踪、高层语义理解、系统构建与集成、网络环境下的视

关于视频跟踪的好硕士论文

电子科技人学硕十学位论文

频监控等内容进行了多方面探讨。

2007年的深圳安博展也显示出一个趋势,现在的监控系统越来越偏向于具有智能分析能力的视频监控。

1.3相关技术概述

1.运动目标检测

运动目标检测的目的是从序列图像中将变化区域从背景图像中提取出来。运动区域的有效分割对于目标分类、跟踪和行为理解等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测成为一项相当困难的工作。目前几种常用的方法有:背景差分法、帧间差分法、基于统计的模型法、光流法等。

2.运动目标跟踪

运动目标跟踪等价于在连续的图像帧之间创建基于位置、速度、形状、纹理、色彩等有关特征的对应匹配问题,常用的跟踪方法有模型跟踪、特征跟踪、区域跟踪和对象跟踪。

3.运动目标分类

目标分类的目的是识别运动目标所属的类别。不同的运动区域可能对应于不同的运动目标,比如交通道路上监控摄像机所捕捉的序列图像中可能包含行人、车辆及其它诸如飞鸟、流云、摇动的树枝等运动物体,为了便于进一步对行人进行跟踪和行为分析,运动目标的正确分类是完全必要的。目前常用的目标分类方法有:基于形状信息的分类、基于运动特性的分类以及时间共生矩阵进行分层分类的方法等。

1.4课题的技术难点

尽管已有大量国内外学者在研究运动目标的检测、识别和跟踪,并已取得了很多成就,但此课题仍然面临很多的挑战,下面几点是课题的技术难剧6】:1.运动分割

快速准确的运动分割是个相当重要但又比较困难的问题。这是由于动态环境中捕捉的图像受到多方面的影响,比如天气的变化、光照条件的变化、背景的混4

关于视频跟踪的好硕士论文

第一章绪论

乱干扰、运动目标的影子、物体与环境之间或者物体与物体之间的遮挡、以及摄像机的运动等,这些都给准确有效的运动分割带来了困难。就以运动目标的影子为例,它可能与被检测的目标相连,也可能与目标分离。在前者情况下,影子扭曲了目标的形状,从而使得以后基于形状的识别方法不再可靠;在后者情况下,影子有可能被误认为是场景中的目标。尽管目前图像运动分割主要利用背景减除方法,但如何建立对于任何复杂环境的动态变化均具有自适应性的背景模型仍是相当困难的阀题。一个可喜的发展是,一些研究者们正利用时空统计的方法构建自适应的背景模型。对于不受限环境中的运动分割而言,这也许是个更好的选择。2.遮挡处理

目前,大部分运动分析系统都不能很好地解决目标之间相互遮挡和人体自遮挡问题,尤其是在拥挤状态下,多目标检测和跟踪问题更是难于处理。在发生遮挡时,目标只有部分是可见的,而且这个过程一般是不可训练的,此时简单依赖于背景减除进行运动分割的技术将不再可靠。为了减少遮挡或深度所带来的歧义性问题,必须开发更好的模型来处理遮挡时特征与目标部分之间的准确对应问题。另外,遮挡前后的跟踪初始化也缺少自举方法。目前比较有效的方法是利用统计方法从可获得的图像信息中进行目标姿势、位置等的预测,不过,对于解决遮挡问题最有实际意义的潜在方法应该是基于多摄像机的跟踪系统。

3.三维建模与跟踪

二维跟踪方法在早期的运动分析中被证明是很成功的,尤其对于那些不需要精确的姿势恢复或低图像分辨率的应用场合。二维跟踪有着简单快速的优点,主要的缺点是受摄像机角度的限制。而三维方法在不受限的复杂的运动判断(如入的徘徊、握手与跳舞等)、更加准确的物理空间的表达、遮挡的准确预测和处理等方面的优点是二维方法所不能比拟的;它能提供更加有意义的与身体姿势直接相关的可视化特征应用于行为识别;同时,三维恢复对于虚拟现实中的应用也是必需的。目前基于视觉的三维跟踪研究仍相当有限,三维姿势恢复的实例也很少,且大部分系统由于要求鲁棒性而引入了简化的约束条件。三维跟踪也导致了从图像中目标模型的获取、遮挡处理、参数化建模、摄像机的标定等一系列难题。以建模为例,模型通常使用许多形状参数表达。过去的一些工作几乎都假设3.D模型依据先验条件而提前被指定,实际上这些形状参数应当从图像中估计出来。总之,3一D建模与跟踪在未来工作中应值得更多的关注。

4.多摄像机跟踪

使用单一摄像机的三维跟踪研究很少,因为目标姿势及其运动在单一视角下5

关于视频跟踪的好硕士论文

电子科技大学硕士学位论文

由于遮挡或深度影响而容易产生歧义现象,因此使用多摄像机进行三维姿势跟踪和恢复的优点是很明显的。同时,多摄像机的使用不仅可以扩大监视的有效范围,而且可以提供多个不同的方向视角以用于解决遮挡问题。很明显,未来的运动分析系统将极大受益于多摄像机的使用。对于多摄像机跟踪系统而言,我们需要确定在每个时刻使用哪一个摄像机或哪一幅图像,也就是说,多摄像机之间的选择和信息融合是一个比较关键的问题。

5.性能评估

一般而言,鲁棒性、准确度和速度是运动分析系统的三个基本要求。例如,系统的鲁棒性对于监控应用特别重要,这是因为它们通常被要求是自动、连续地工作,因此这些系统对于如噪声、光照、天气等因素的影响不能太敏感:系统的准确度对于控制应用特别重要,例如基于行为或姿势识别的接13控制场合:而系统的处理速度对于那些需要实时高速的监控系统而言更是非常关键。因此,如何选择有效的工作方案来提高系统性能、降低计算代价是特别值得考虑的问题。同时,如何利用来自不同用户、不同环境、不同实验条件的大量数据测试系统的实时性、鲁棒性亦相当重要。

1.5研究内容

1.课题研究内容

针对W4视频监控系统【6】,lsmailHaritaoglu和DavidHarwood总结了视频监控系统需要解决的问题,即W4问题。所谓W4指的是:

1.他们是谁?(Whoarethey7.)

are2.他们在干什么?(What

3.何地?(Wheredothey

theytheydoing?)act?)4.何时?(Whendoact?)

虽然W4是针对一个视频监控系统的特例进行总结的,但它基本上可以反映出视频监控系统的主要任务。在此基础上,可以对W4稍加改动,增加一个W,提出了W5视频监控系统的概念,并明确其主要任务为:

1.我看到了什么?(WhatearlIsee?)

2.何地?(Wherearethe),?)

3.他们正在做什么/将会做什么?(Whatarethey

4.何时?(Whendotheydo?)doingorwhatwilltheydo?)

关于视频跟踪的好硕士论文

篇章绪论

5我应该采取什么措施?(WhatshouldIdoaboutit?1

虽然各种视频监控系统的结构、实现方式等均有所不同,但其}要任务基本上都是幽绕上述五个问题进行的。为了能够进一步从研究的角度直观说明视频监控系统的主要任务,F面给出视频监控系统的结构框图(图I-3)。

季一氇翻强圆圈瞄目§豳

蘸掌i一……一一』一……一

a甏翟登mnlm

o|

I,曜圈群|豳翻卜豳匿霉分析

。‘圈,霾隧爿暖胬落昏,盈圈奠目证理解l

凹1_3视频监控系统通用结构幽

整个系统由四个模块组成.分别是图像获取模块、图像处理模块、图像分析模块和图像理解模块。其中,图像获取模块是指通过硬件系统获取图像数据的过程。

图像处理模块包括数据处理和图像预处理。数据处理用于对采集到的视频信息进行调整、压缩和存盘,以方便该信息在网络中传输。碗件系统获取的原始图像,由于噪声、光照、运动等原因,图像质量不高,所以需要进行预处理,以利于提取我们感兴趣的信息。预处理模块主要包括传感器标定、滤波、图像增强与恢复等。

图像分析模块主要是对图像中感兴趣的目标进行检测和测量,咀获得它们的客观信息。图像分析模块包括目标分割、目标定位、目标跟踪和特征提取。在这部分主要是解决“何时?”和“何地?”的问题。

关于视频跟踪的好硕士论文

电子科技人学硕十学位论文

图像理解是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对客观场景的解释,从而指导和规划行动。内容包括目标识别、行为理解、威胁估计和决策推理四部分。其中,目标识别是解决“我看到了什么?一的问题;行为理解和威胁估计用来解决“他们正在做什么?”和“他们将会做什么?”;最后是通过决策推理解决“我应该采取什么措施?”的问题。

2.本文研究内容

本文主要集中于以下三个方面的工作:图像的去噪处理、图像分割,静止背静下的运动目标的检测,静止背景下运动目标的跟踪。各章节安排如下:

第一章绪论

阐述了本文的研究背景和研究现状,讨论了视频跟踪中所涉及到的关键技术及其相应难点,介绍了课题研究内容,本文主要研究内容以及结构安排。

第二章图像去噪处理和视频压缩

介绍了几种图像去噪处理的方法,给出了部分实验结果;简单讨论了新一代视频压缩和编解码标准。

第三章运动目标的检测

详细介绍了运动目标检测的几种常用方法,讨论了它们的原理和实现流程图:给出了改进的背景差分法;提出了基于极大似然的混合高斯模型。

第四章图像分割

讨论了图像分割的定义;介绍了图像分割的常用方法,重点介绍了canny边缘检测算法;然后给出了一种将运动点团转化为运动区域的方法。

第五章运动目标的跟踪

给出了运动目标跟踪的过程和流程图;重点讨论了经典的运动分析理论一kalm趾滤波理论。

第六章总结总结了本文的研究内容和所做工作,对迸一步的工作进行了展望。

关于视频跟踪的好硕士论文

第二章图像去噪和视频压缩标准

第二章图像去噪和视频压缩标准

2.1几种图像去噪处理方法

本节介绍了几种常用的去噪处理方法,然后介绍了彩色图像转化为灰度图像的实现原理和程序实现。

目前,比较常用的去噪方法有邻域平均法、中值滤波叼、自适应中值滤波、形态学滤波【8】等方法,下面将一一对它们作介绍。

2.1.1邻域平均法

邻域平均法是简单的空域处理方法。这种方法的基本思想是用几个邻近像素灰度的平均值来代替该像素的灰度值。邻域平均法的空域思想使得算法的思想简单、清晰,处理结果表明,邻域平均算法对抑制噪声是有效的。平均时所取的邻近像素点越多,平滑的效果越好,但会使轮廓变得模糊,由于轮廓线往往是图中含有重要信息的部分,所以在滤波中要解决的主要矛盾是如何既能消除噪声,又能保持轮廓尽可能不模糊。

2.1.2中值滤波

中值滤波是一种非线性的信号处理方法,与其对应的中值滤波器也是一种非线性的滤波器。中值滤波器是在1971年由J.w.Jockey首先提出并应用在一维信号处理技术中(时间序列分析),后来被二维图像信号处理技术所用。它在一定的条件下,可以克服线性滤波器如最小均方滤波、平均值滤波等带来的图像细节模糊,而且对滤波脉冲干扰及图像扫描噪声最为有效。特别适合用在有很强的胡椒粉式或脉冲式的干扰时,因为这些干扰值与其邻近像素的灰度值有很大的差异,因此经过排序后取中值的结果是强迫将此干扰变成与其邻近的某些像素的灰度值一样,达到去除干扰的效果。在实际运算中并不需要图像的统计特性,这也带来不少方便,但是对一些细节特别多,特别是点、线、尖顶细节多的图像不宜采用中值滤波方法。

中值滤波的基本思想简介如下:设有一维序列^,厶.…,L,取该窗口长9

关于视频跟踪的好硕士论文

电子科技大学硕士学位论文

度(点数)为m(m为奇数),对一维序列进行中值滤波,就是从序列中相继抽取m个数Z一.,…,Z.I,Z,,+。,…,,+,其中,关为窗口的中心值v=如一1)/2,再将这m个点值按其数值大小排序,取中间的那个数作为滤波输出,用数学公式表示为:

Y。=reed∽一,,…,Z,Z+。,…,,+,}其中f∈z,v=b一0/2(2.1)

中值滤波一般采用一个含有奇数个点的滑动窗口,将窗口中各点灰度值的中值来替代指定点(一般指窗口的中心点)的灰度值。对于奇数个元素,中值是指按大小排序后,中问的数值:对于偶数个元素,中值是指排序后中闻两个元素灰度值的平均值。

二维中值滤波可有下式表示:

Y,=meal,Jj(2.2)

对于二维情况,中值滤波的窗口形状和尺寸对滤波器的效果影响很大,不同图像内容和不同应用要求,往往选用不同的窗口形状和尺寸。常用的二维中值滤波窗口形状有线状、方形、圆形、十字形及圆环形等,窗口尺寸一般先用3,再取5,逐点增大,直到其滤波效果满意为止。就一般经验来讲,对于有缓变的较长轮廓线物体的图像,采用方形或圆形窗口为宜,对于包含有尖顶角物体的图像,适宜用十字型窗口。滤波窗口大小的选择,一般以不超过图像中最小有效物体的尺寸为宜。

中值滤波的性质:

(1)非线性,两序列几),g(,),meeb‘(,)+g(,)}≠med扩(,))+小耐詹(,))

(2)对尖峰性干扰效果好,既保持边缘的陡度又去掉干扰,对高斯分布噪声效果差;

(3)对噪声延续距离小于W/2的噪声抑制效采好,W为窗口长度:

与邻域平均法相比,中值滤波有以下几个优点:

(1)降低噪声的效果比较明显:

(2)在灰度值变化比较小的情况下可以得到很好的平滑效果;

(3)降低了图像边界部分的模糊程度:IO

关于视频跟踪的好硕士论文

第二章图像去噪利视频乐缩标准

2.1.3自适应中值滤波

中值滤波由于其去噪及其可保护图像某些细节的良好性能,在图像降噪处理中得到了广泛的应用。但标准中值滤波去脉冲噪声的性能受滤波窗口影响较大,在抑制图像噪声和保护细节两方面存在着一定的矛盾:滤波窗口小,可较好的保护图像中某些细节,但滤除噪声的能力会受到限制:滤波窗口大,可加强噪声抑制能力,但对细节的保护能力会减弱,有时会滤去图像中的一些细线、尖锐边角等重要细节,从而破坏图像的几何结构。这种矛盾在图像噪声干扰较大时尤为突出。

可以采用自适应的中值滤波法来克服上面的问题,其基本思想是将图像分为几个子块,通过对各子块中的像素进行噪声检测,将其分为污染像素和未污染像素两类:统计受污染像素的个数以确定子图像中噪声干扰大小,根据噪声干扰程度自适应地调整滤波窗口的尺寸;最后采用改进的中值滤波方法对子图像中的噪声点进行处理。自适应中值滤波在很大程度上缓和了噪声抑制与保护细节之间的矛盾,对噪声干扰较大的图像去噪时也能取得良好的效果,较标准中值滤波具有更优良的滤波性能,为消除图像中的脉冲噪声提供了一条有效途径。

总结起来,自适应中值滤波总体上包括三个步骤:

(1)对图像各区域进行噪声检测;

(2)根据各区域受噪声污染的状况确定滤波窗El的大小;

(3)对检测出的噪声点进行滤波。

2.1.4形态学滤波

形态学运算是针对二值图像依据数学形态学集合论方法发展起来的图像处理方法。其主要内容是设计一整套的变换(运算)、概念和算法,用以描述图像的基本特征。

数学形态学以图像的形态特征为研究对象,描述图像的基本特征和基本结构,也就是描述图像中元素与元素、部分与部分间的关系。通常形态学图像处理表现为一种邻域运算形式,采用邻域结构元素的方法,在每个像素位置上邻域结构元素与二值图像对应的区域进行特定的逻辑运算,逻辑运算的结果为输出图像的相应像素。数学形态学主要包括腐蚀、膨胀、开运算和闭运算四种基本运算。

关于视频跟踪的好硕士论文

电子科技人学硕+学位论文

(1)腐蚀:腐蚀是数学形念学的两种最为基本的运算之一,腐蚀在数学形态学中的作用是消除物体的边界点,是边界向内部收缩的过程,可以把小于结构元素的物体去除。这样选取不同大小的结构元素,就可以去除不同大小的物体。如两个物体问有细小的连通,通过腐蚀可将两个物体分开。腐蚀的数学表达式是:

s=x圆曰=扛,y[gxy∈X}(2-3)

在式(2.3)中S表示腐蚀后的二值图像集合,B表示用来进行腐蚀的结构元素,结构元素的每一个元素取值为0或l,它可以组成任何一种形状的图形,在B图形中有一个中心点:X表示原图像经过二值化后的像素集合。此公式的含义是用B来腐蚀X得到的集合S,S是由B完全包括在X中时的B的当前位置的集合。通常是拖动结构元素在X图像域移动,横向移动间隔取1个像素,纵向移动间隔取1个扫描行。在每一个位置上,当结构元素B的中心点平移到X图像上的某一点(x,”,如果结构元素内的每一个像素都与以(x,y)为中心的相同邻域中对应像素完全相同,那么就保留(x,y)像素点,对于原图中不满足条件的像素点则全部删除,从而使物体边界向内收缩的效果。

(2.)膨胀:膨胀是数学形态学中除腐蚀之外的另一种基本运算。膨胀在数学形态学中的作用与腐蚀的作用正好相反,它是对二值化物体边界点进行扩充,将与物体接触的所有背景点合并到该物体中。使边界向外部扩张的过程。如果两个物体之间的距离比较近,则膨胀运算可能会把两个物体连通到一起,膨胀对填补图像分割后物体中的空洞很有用。膨胀的数学表达式为:

S=XoB=kYI曰。nX≠①}(2-4)

在式(2_4)中S表示膨胀后的二值图像集合,B表示用来进行膨胀的结构元素,结构元素内的每一个元素取值为0或1,它可以组成任何一种形状的图形,在图形中有一个中心点:X表示原图像经过二值化后的像素集合。此公式的含义是用B来膨胀X得到的集合S,S是由B映射的位移与X至少有一个像素相同时B的中心点位置的集合。通常是拖动结构元素在X图像域移动,横向移动间隔取一个像素,纵向移动间隔取一个扫描行。在每一个位置上,当结构元素B的中心点平移到X图像上的某一点(x,y).如果结构元素的像素与目标物体至少有一个像素相交,那么就保留并认作像素点,从而达到使物体边界向外扩张的效果。

(3)开运算:先腐蚀后膨胀的过程就称为开运算。原图经过开运算后,能够去12

关于视频跟踪的好硕士论文

第二章图像去噪和视频压缩标准

除孤立的小点、毛刺和小桥(即连通两块区域的小点),消除小物体、平滑较大物体的边界,同时并不明显改变其面积。开运算的数学表达式为:

S=x B=(zo口)oB(2-5)

在公式(2.5)中S表示进行开运算后的二值图像集合,B表示用来进行开运算的结构元素,结构元素的每一个元素取值为0或l,它可以组成任何一种形状的图形,在图形中有一个中心点:X表示原图像经过二值化后的像素集合。此公式的含义是用B来开启X得到集合S,S是所有在集合结构上不小于结构元素B的部分的集合,也就是选出了X中的某些与B相匹配的点,而这些点则可以通过完全包含在X中的结构元素B的平移来得到。

(4)闭运算:先膨胀后腐蚀的过程就称为闭运算。闭运算可以用来填充物体内细小的空洞、连接邻近物体、平滑其边界,同时不明显改变其面积。闭运算的数学表达式为:

S=x B=(xo曰)pB(2.6)

在公式中S表示进行闭运算后的二值图像集合,B表示用来进行闭运算的结构元素,结构元素内的每一个元素取值为0或l,它可以组成任何一种形状的图形,在图形中有一个中心点;X表示原图像经过二值化后的像素集合。此公式的含义是用B来闭合X得到的集合S,就是图像X与经过映射和平移的结构元素B的交集不为空的点的集合。

2.1.5实验结果

对于上面提到的几种滤波,做了如下实验,实验结果如图2.1,实验基于PC机(Inter(R)Pentium(R)4CPU3.00GHz,内存IG),所用编程环境是VC.NET,所用语言为c/C++,滤波实验中的部分核心代码引自文献【9l。

从实验可知,在去掉图像噪声的同时,边缘等灰度突出的信息也一定程度的被平滑了,所以在实际中,应在去噪和保护图像重要信息间作合理的权衡。13

关于视频跟踪的好硕士论文

嘭胀

g)州运傩(h),f运雉

幽2-1图像上噪处理比较崮

216彩色图像转化为灰度图像

运动目标检测,fll£fl踪ur以不直接使用原始彩色图像fi-:f0,而使用灰度图像序列,即将彩色视频图像序列转换成荻度图像序列,然后往驭度图像序列七提取背景,以及之后提取运动点阴、运动跟踪等。在课题算法的模拟阶段正是通过先将彩色图像转化为敷度罔像,然后再进行相应的处理,所以这节将舟绍彩色刚像转化为灰度图像的方法。

1931年国际照明技术委员会CIE规定,选择红色,绿色,蓝色!种单色光作为表色系统的二基也。这就是CIE的RGB颜色表色系统【9】。在彩色罔像巾,图像

关于视频跟踪的好硕士论文

第~章幽像击噪和视频肚缩标准

是由RGB三分量表示的.其中,一个像素需要三个量柬表示。如果每个量是8bits,那么表示一个像素的值需要24bits。这样既不利于存储图像,也不利于引像后续处理计算。为此需要对输入图像去掉彩色信息,进行灰度转换。最简单的将彩色图像转换成灰度图像的方法足将这三个分量取平均值,但是这种方法和人限视觉感知小符,人眼感知红、绿、蓝三种颜色的权重是不一样的。JPEG图像压缩格式采用的是Yuv空『日J,YUV空问是RGB空间的线性变换。转换公式是:

rrlro299o587

331601140.500IfRllu|=lⅦ169_o

【VJl0G{(2。)o500—0.4186一o081d口j

R,GB分别表示红、绿、蓝三种颜色分量的扶度值。Y分量表示图像的亮度这是符合人眼对颜色感知的。转换一行像素的实现代码为:

for(intxnl0.x(plmg[1i->GetWidth0:x¨1 =3)

afterI唧[x]=(bYIE)(oLI*beforelmge[1]+059*beforelmage(1+l】+n3∞be~reI略gen+铂)般上述参数所得实验结果如图2-2:

图2-2图像颜色转换效果图

本实验平台同215中的一样,在编程实现彩色图像转化为灰度图像,需要注意:1.彩色图像的每个像素对应三个分量,每个分量用一个字节表示,所以每个像素计算完成后,需将代表相应像素分量的计数值增加3个字节。

2.彩色图像每个像素对应的分量从低地址到高地址的依次为B,G,R。

22图像压缩标准

为了满足目标检测与追踪实时性的要求,必须选择压缩质量好且压缩比高的方法。本文介绍了MPEG—I的压缩方法110l,MPEG-4的压缩方法可用于远端视频

关于视频跟踪的好硕士论文

电子科技人学硕士学位论文

图像压缩,便于进行网络传输,这是视频跟踪实际系统需要用到的,也是课题的后续工作。

2.2.1MPEG制定的标准

MPEG.1和MPEG-2是MPEG组织制定的第一代视、音频压缩标准,为VCD,DVD及数字电视和高清晰度电视等产业的飞速发展打下了牢固的基础,曾获得了著名的Emmy奖。MPEG-4iml是基于第二代视音频编码技术制定的压缩标准,以视听媒体对象为基本单元,实现数字视音频和图形合成应用、交互式多媒体的集成,目前己经在流式媒体服务等领域开始得到应用。目前,MPEG系列国际标准己经成为影响最大的多媒体技术标准,对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。

2.2.2MPEG-4技术的特点

MPEG-4不仅是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。MPEG-4试图达到两个目标:一是低比特率下的多媒体通信:二是多工业的多媒体通信的综合。据此目标,MPEG-4引入AV对象(Audio/Visualobjects),使得更多的交互操作成为可能。

1)AV对象(AVO)的基本单位是原始“AV对象”,它们可能是一个没有背景的说话的人,也可能是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。在MPEG-4中AV对象有着重要的地位,MPEG.4对AV对象的操作主要有:

乱采用AV对象来表示听觉、视觉或者视听组合内容。

b.允许组合己有的AV对象来生成复合的AV对象,并由此生成AV场景。MPEG-4采用SNHC的方法来组织这些AV对象。

c.允许对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据。

d.允许接收端的用户在AV场景中对AV对象进行交互操作。

e.MPEG-4支持AV对象知识产权与保护。

2)MPEG-4标准的构成

扎DMIF(TheDeliveryMultimediaIntegrationFramework)

DMIF即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘16

关于视频跟踪的好硕士论文

第二章图像去噪和视频压缩标准

应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的握手和传输。通过DMIF,MPEG-4可以建立起具有特殊品质服务(QOS)的信道和面向每个基本流的带宽。

b.数据平面

MPEG-4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了使基本流和AV对象在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊Av对象相关的基本流的信息流图。桌面把每一个流与一个CAT(ChannelAssociationTa曲相连,CAT可实现该流的顺利传输。c.缓冲区管理和实时识别

MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。

d.音频编码

MPEG-4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。e.视频编码

与音频编码类似,MPEG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D,3D动画和人面部表情动画等。

£场景描述

MPEG-4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述,这些场景描述以二进制格式BIFS(BinaryFormatforSceneScript)表示,BIFS与AV对象一同传输、编码。场景描述主要用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。同时还有AV对象与AV场景的知识产权保护等问题。MPEG-4为我们提供了丰富的AV场景。

3)应用前景

MPEG-4的应用前景将是非常广阔的。它的出现将对以下各方面产生较大的推动作用:数字电视、动态图像、万维网(www)、实时多媒体监控、低比特率下的移动多媒体通信、Internet/Intranet上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用等。

2.2-3MPEG4技术的优势

对众多数字录像技术来说,已经比较成熟的有MJPEG格式、H.263格式、17

本文来源:https://www.bwwdw.com/article/gx71.html

Top