计算机视觉研究方向十篇

发布时间:2024-04-26 01:12:40

计算机视觉研究方向篇1

关键词:双目视觉;匹配算法;计算机视觉;立体匹配;相位一致性

1.计算机视觉系统分析研究

1.1计算机视觉技术及双目立体视觉

计算机视觉是通过计算机技术实现对视觉信息处理的整个过程,是一门新的学科。视觉是人们认知事物的重要途径,视觉是人们对视觉信息获取、处理和存储的过程。随着计算机技术的发展,信号处理技术的应用,人们通过照相机来把实际的事物拍摄下来转变为数字信息,并通过计算机信号处理技术队获取的视觉信号进行处理。计算机视觉技术对图像的处理分为获取图像、特征抽象选取、事物识别及分类和对三维信息的理解。获取图像主要是通过摄像机和红外线等技术对周围视觉事物进行获取,并通过计算得到和真实事物相应的二维图像,二维图像主要是数字图像。计算机视觉系统的最基本的功能是数字图像的获取。可以看出计算机视觉研究最基本内容是三维场景距离信息的获取。在计算机被动测量距离方法中,有一种重要的距离感知技术叫作双目立体视觉。双目立体视觉技术是其他计算机视觉技术无法取代的一种技术,对双目立体视觉技术的研究在计算机视觉技术和工程应用方面都是非常重要的。

1.2计算机视觉理论框架

第一个视觉系统理论框架的提出是以信息处理为基础,综合了图像处理和神经生理学等研究内容而建立的。这个视觉系统理论框架是计算机视觉系统的基本框架,与计算机视觉技术有着密切的关系。视觉系统的研究是以信息处理为基础的,从理论层次、算法层次和硬件层次3个层次进行研究。计算机理论层次主要是表达系统各个部分计算的目的和方法,对视觉系统的输入和输出进行规定,输入作为二维图像,输出是以二维图像为基础建立起来的三维物体,视觉系统的目的就是对三维物体进行分析和识别,通过计算对二维物置和形状进行重新建立。算法层次对计算机规定的目标进行计算,算法和计算机表达有关,不同的表达可以通过不同的算法进行实现,在计算机理论的层次上,算法和表达比计算机理论的层次要低。硬件层次是通过硬件来实现算法的一种表达方法。计算机理论层次在计算机信息处理中时最高的层次,取决于计算机的本质是解决计算机的自身问题,不是取决于计算问题的计算机硬件。要更好地对计算机系统和框架进行理解最好的方法就是要区分3个不同的层次,计算机理论的含义和主要解决的问题是计算机的目的,表达算法含义和主要解决的问题是实现计算理论的方法和输入输出的表达,硬件的实现的含义和主要解决的问题是如何在物理上对表达和算法进行实现。计算机视觉处理的可以分为3个阶段,对视觉信息的处理过程从最初的二维图像的原始数据,到三维环境的表达。第一阶段基元图的构成,基元图是用来表示二维图像中的重要信息,主要是图像中亮度变化位置及其几何分布和组织结构,图像中每点的亮度值包括零交叉、斑点、端点和不连续点、边缘等。第二阶段2.5维图描述,在以观测者为中心的坐标中,表示可见表面的方向、深度值和不连续的轮廓,基元是局部表面朝向离观测者的距离深度上的不连续点表面朝向的不连续点。第三阶段三维模型表示,在以物体为中心的坐标系中,有由体积单元和面积单元构成的模块化多层次表示,描述形状及其空间组织形式,分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积单元或面积形状基元都附着在轴线上。视觉理论框架图如图1所示。

2.基于计算机的视觉立体匹配算法研究

视觉立体匹配算法是基于人类视觉系统的一种计算机算法。立体匹配算法作为计算机立体视觉问题研究的重点,快速地实现图像对应点的匹配来获得视差图是当今研究的热点问题。立体视觉匹配算法根据基元匹配的不同可以分为相位匹配、区域匹配和特征匹配3种,其中区域匹配算法可以减少计算负担,区域匹配算法实时性高,应用前景广阔。计算机立体视觉通过对人的双眼进行模仿,在双眼的立体感知中获得信息,从摄像机拍摄的图像中获取物体的三维深度信息,这就是深度图的获取,把深度图经过处理得到三维空间信息数据,二维图像到三维空间实现转换。深度的获取在双目立体成像视觉系统中分为两步,首先在双目立体图像与图像之间建立点对点的对象关系,双目立体视觉算法研究的重点问题是解决对应点之间的匹配问题。其次以对应点之间的视差为依据对深度值进行计算。双目成像是获取同一场景中两幅不同的图像,两个单目成像模型构成一个双目成像模型。双目成像示意图如图2所示。系统的基线B是两个镜头中心的连接线,空间点w(z,y,z)作为世界坐标的值由(x1,y1)与(x2,y2)进行确定,如果摄像机的坐标位置和空间点w世界坐标的位置重合,图像平面和世界坐标轴xY的平面就是平行的。如果两个摄像机在坐标系统中的原点不同但是它们的光轴平行,那么双目成像计算人们可以看图3所示,图3表示的是两个摄像头连线在平台xY的示意。

立体视觉的成像过程是成像的逆过程,具有一定的不确定性。大量的数据信息在从三维影像向二维图像进行投影的过程会出现丢失的现象,所以视觉系统要通过自然的约束条件才能保证获取正确的解。这些约束条件在减少匹配的计算量方面可以提供有利的帮助。针对基于区域匹配快速算法,还可以应用基于视差梯度的匹配算法,这种匹配算法应用较大的搜索范围在边缘的特征点上进行搜索,采用视差梯度在非边缘区减少搜索范围。应用计算机视觉立体匹配算法可以减少成像匹配时间,大大提高了工作效率。计算机立体匹配算法征点的提取是算法的关键问题,今后的研究方向重点是对有效特征点提取方法的研究。

计算机视觉研究方向篇2

(广东农工商职业技术学院,广州510663)

(GuangdongaiBpolytechnicCollege,Guangzhou510663,China)

摘要:本文就计算机视觉的理论框架进行阐述,对计算机视觉理论框架存在的问题进行分析,提出计算机视觉理论框架的新发展,以确保通过计算机视觉获得的景物信息更加完整。

abstract:thispaperexpoundsthetheoryframeworkofcomputervision,analyzestheproblemsoftheoryframeworkofcomputervision,andputsforwardnewdevelopmentofthetheoryframeworkofcomputervisiontoensurethatthesceneinformationobtainedthroughcomputervisionismorecomplete.

关键词:计算机视觉;理论框架;问题;新发展

Keywords:computervision;theoryframework;problems;newdevelopment

中图分类号:tp391.4文献标识码:a

文章编号:1006-4311(2015)02-0209-02

0引言

在计算机系统中,计算机视觉是通过模拟人类视觉,从而对不同事物进行相关描述,以获得更全面的信息。随着计算机视觉在文字识别、漫步机器人和导航中的成功应用,计算机视觉的理论框架研究显得越来越重要,对于促进我国计算机应用技术水平不断提升具有重要意义。

1计算机视觉的理论框架

随着计算机视觉的不断研究和总结,从二维景物图像发展到三维景物图像,计算机视觉的理论框架主要有如下三个:

1.1计算视觉理论框架在七十年代中期,有关研究人员提出了第一个计算机视觉理论框架,即计算视觉理论,将视觉过程看作是信息处理过程,并将信息处理过程分为三个不同的层次,它们分别是计算理论层次、数据结构层次和硬件实现层次,从而对计算机视觉进行全面分析。根据相关数据和资料显示,视觉是对图像的位置、形状和特征等进行描述,因此,计算理论层成为了研究的重点,进而将视觉过程看作是从二维图像信息中对图像进行重塑,从而将三维物体的形状、位置和空间等反映出来,最终形成三维图像。由此可见,早期的视觉处理是从输入的二维图像中获得二维要素图,即图像中强度变化较强时的位置和几何分布情况、结构等;中期的视觉处理是从二维要素图中获得二点五维图,即以观察者为中心,对表面的法向、深度和不连续的轮廓等进行观测。虽然二点五维包含的深度信息比二维要多,但还不是真正意义上的三维表示,而仅仅是有多个相对独立的视觉模块组成的,在相关研究中被称作是“shapefromX”模型,将运动视觉、立体视觉等融入到其中;后期视觉处理是指从二点五维图中获取物体的三维描述,从而将场景中的物体识别处理,确定物体的确切位置和姿态。

1.2基于知识的视觉理论框架在计算机视觉理论中,基于知识的视觉理论框架,是围绕感知特征群集来进行相关研究的,从而通过人类感知的经验来描述目标,最终确定物体在场景中的真正位置、形态等。相关研究人员认为,基于知识的视觉理论可以通过知识的引导来直接完成三维重建,以将相对应观察方向保持不变动二维特征称作是非偶然性聚类,而人体中视觉识别发挥重要作用的一种感知组织,通过对非偶然性聚类的检测,可以有效辨别出目标。因此,首先是利用感知组织来提取图像中相对于观察方向大范围变化,并且保持不变的分组和结构等;然后,利用概率排队的方法来进行模型匹配,从而缩小检测空间;最后,通过对观察点的未知求解和寻找模型参数对应关系,使三维模型的投影和图像得到最合适的匹配,最终完成三维重建。

1.3主动视觉理论框架第三种计算机视觉理论框架是中东视觉理论矿坑,是根据人类视觉的主动性特征提出的。由于人类视觉会根据自己的意识选择视野范围内所看见的事物的主次,从而移动身体、转向或者改变视角,因此,人们的视觉过程是与所在环境交互感知和动作的过程。在计算机视觉理论框架的主动视觉框架中,视觉行为不需要三维物体的相关精确信息,就可以完成物体重建。主动视觉系统根据所需的物体对象特征、分析结果和当前要求等,通过控制摄像机的相关操作,如取向、位置、焦距等,就可以完成相关处理任务和信息交换。与此同时,主动视觉还可以用改变摄像机的参数和处理摄像后的数据等,使图像的时间、空间和分辨率等发生变化,从而增强图像的感知效果。

2计算机视觉理论框架存在的问题

现展中,计算机视觉理论框架的提出,是计算机视觉领域研究的重要突破,而在这个发展过程中,存在着如下一些问题,影响计算机视觉理论框架的更完善构建。由于视觉过程是成像过程的逆过程,存在着混合、投影、噪音和畸变等干扰因素,使图像三维重建存在不稳定性和不确定性,因此,从一幅景象到多幅景象的重建存在很多困难,使三维图像的准确性和通用性大大降低。并且,计算视觉理论认为输入是被动的,整个视觉过程自下而上不存在反馈,处理目的没有发生任何改变,因此,对物体的确切位置和形状有一定要求。另外,有关学者提出计算机视觉理论框架没有充分运用知识,对知识表达没有给以高度重视,从而忽略知识推理和知识库的构建,没有对空间约束和场景假设进行充分考虑,从而使场景假设受到局限。并且,没有进行多次的分析和试验,致使计算机视觉理论框架构建存在很多问题。

基于知识的理论框架忽略了计算视觉理论的重要性,认为人类视觉和重建无关,然而,在进行物体尺寸判断、物体距离估算等情况时,光靠识别是不够的,必须要依靠三维重建,才能将物体的确切位置、形状等准确地描述出来。

主动视觉理论没有排除三维重建,通过改变摄像机的参数和角度等,来改变物体空间、时间和分辨率的感知效果,从而对图像出来过程进行相关约束,使很多不稳定和不合适的问题得到有效解决,最终完成三维重建。运用主动视觉理论框架,可以大大降低问题的难度,但主动视觉理论框架仍存在缺乏高层知识指导的问题,导致主动视觉框架还不够完整,使计算机视觉理论框架构建受到一定影响。

3计算机视觉理论框架构建的新发展

在计算机视觉理论框架的构建过程中,计算视觉理论比较系统地解释了从二维图中获取三维物体形态的方法和可能性,而基于知识的实际理论和主动视觉理论则对计算视觉理论进行了补充和进一步提升。因此,计算机视觉理论框架的新发展,可以以计算视觉理论为主,将基于知识的视觉理论和主动视觉理论结合到一起,从而使计算机视觉系统框架变得更加完善。

在实际应用过程中,将早期视觉处理分为图像分割、图像预处理和二维模式识别等,以对二维图像进行滤波降噪和图像增强等,因此,不需要知识引导和控制视觉目的。在图像分割、二维图像模式识别、中期处理、后期处理和三维模式识别的过程中,没有知识引导和模型匹配,最终得出的图像效果会更好、更完整。在早期视觉处理和后期视觉处理中,二维模式和三维模式的识别,需要根据物体的实际情况来确定,由于特征、模型等各不一样,所以,二维物体和三维物体的描述方式也各不相同。由于二维信息的质量会影响三维信息的效果,因此,在计算机视觉中,二维信息应当给以高度重视。而模型库和视觉目的的应用,为计算机视觉理论框架构建提供了更多的信息。由此可见,在计算机视觉系统中,通过视觉目的来进行物体形象、位置等的输出判断,同时,运用视觉目的可以对图像分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别等进行有效控制,最终使三维重建的图像信息更加完整。

4结束语

随着高科技信息技术的不断推广,计算机视觉理论框架的研究已经成为目前重点关注对象之一,虽然取得了一定的成绩,但计算机视觉理论框架构建还不够完善。因此,计算机视觉理论框架未来的发展,需要对计算实际理论、基于知识的视觉理论和主动视觉理论进行更深层次的研究,将理论和实践应用紧密结合在一起,从而使计算机视觉理论框架研究的成果可以更加辉煌。

参考文献:

[1]尹宏鹏.基于计算机视觉的运动目标跟踪算法研究[D].重庆大学,2009.

计算机视觉研究方向篇3

关键词计算机视觉;立体匹配;研究情况

中图分类号:tp391文献标识码:a文章编号:1671-7597(2014)07-0001-01

随着科学技术的快速发展,计算机技术也得到了飞速的发展。将计算机技术应用于人类的视觉系统,并辅助人们观察到一些眼睛难以看到的东西,已经逐渐成为一门大家所热捧和追逐的技术。随着人们对视觉传感器技术越来越多的探索,人们也逐渐实现了古代时想拥有千里眼的梦想。目前,人们已经把视觉传感器技术和计算机技术良好的结合在一起,并把这些技术应用到食品、建筑、医药、电子、航天航空等众多领域当中。而该项技术的快速发展,也帮助人们解决了一些日常工作当中人类视觉存在盲区的问题,保证了人们工作过程的安全。视觉技术与it技术的完美结合使得人们的生活变得更加便利,让人们亲身体会到了it技术给人们生活带来的便捷。

1双目立体视觉概述

双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。

双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。

视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。

2双目立体视觉技术的原理

立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。

三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。

双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。

双目立体视觉在计算机技术中实现三维重建的大致流程

如下。

1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。

2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。

3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。

4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。

5)根据得到的视差图最终实现场景的三维图形的重建。

3双目立体匹配技术的研究难点和未来的发展方向

尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。

立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。

1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。

2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。

3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。

从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。

4结束语

人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。

参考文献

[1]高文,陈熙霖.计算机视觉算法与系统原理[m].北京:清华大学出版社,2002.

[2]明祖衡.双目立体视觉测距算法研究[m].北京:北京理工大学,2008.

[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SaD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.

[4]陈蛟.双目立体匹配的算法研究及其多核并行化[m].南京:南京邮电大学,2012.

计算机视觉研究方向篇4

关键词:计算机视觉;跟踪算法;综述;人数统计

中图分类号:tp391文献标识码:aDoi:10.3969/j.issn.1003-6970.2013.03.003

0引言

计算机视觉作为一门多学科的交叉领域,涉及图像处理、计算机图形学、模式识别、人工智能、人工神经网络、计算机、数学、心理学、生理学和物理学等。本文是对视频人数统计技术的综述,属于智能视频监控范畴。

由于智能视屏监控的挑战性以及其巨大的应用价值,越来越多的学校、研究所以及公司的研究人员投入到该领域中来。麻省理工学院、卡内基梅隆大学以及其他国外著名大学成立了专门的计算机视觉及多媒体方向的实验室;nice和objectvideo等公司已经针对飞机场、国界线等应用场合开发了一些相应的智能监控系统。国际上的高级视频和录像(advancedVideoandSignal-BasedSurveillance)论坛每年都会举办petS(performanceevaluationoftrackingSystems)会议专门针对于人群行为分析,包括群体人数统计,人流密度估计;对单个人员以及群体中个体进行跟踪;特殊群体和特殊事件检测等。本文主要针对视频人数识别这个研究方向,从基于特征点、颜色与形状信息、模板匹配三种不同类型识别跟踪方式分析了近些年来国内外的研究工作及最新进展,通过对各种不同识别方法比较,对当前亟需解决的问题做了详细的分析。

1人数识别研究现状

人数统计算法融合了运动物体检测、行人检测与分割、形状分析、特征提取和目标跟踪等多个领域的技术。从采用的手段来讲可以分为直接法和间接法:直接法(或称基于检测的),即首先在场景中检测出每个行人,再计数。第二种称为间接法(也称为基于映射或基于度量的),一般是建立场景特征与行人数量的函数关系来测算人数。在行人高度密集的场景中,间接法比直接法更加可靠,主要因为直接法无法有效分割每个行人,特别是在行人高度密集的场景中,从20世纪90年代起到目前为止这近20年里,出现了众多的视觉跟踪算法,1988年,aggarwal和nanadhakumar对运动图像分析算法进行了总结,将算法分为两类,一类是基于光流法的分析,另一类是基于特征点的分析,此后在视觉跟踪领域中,又出现了许多新的方法,目前,视频中人数的跟踪方法大致分为三类,分别是基于区域的跟踪、基于特征点的跟踪、基于模板和模型的跟踪,这种分类方法概括了目前大多数视觉跟踪算法,因此下面用这种分类方法对视觉跟踪算法进行介绍。

1.1基于特征的人数识别

基于特征的人数跟踪算法选取目标的某个或某些局部特征作为相关时的对象,这种算法的优点在于即使目标的某一部分被遮挡,只要还有一部分特征可以被看到,就可以完成跟踪任务,另外,这种方法与卡尔曼滤波器联合使用,也具有很好的跟踪效果。这种算法的难点是:对某个运动目标,如何确定它的唯一特征集?这也是一个模式识别问题,若采用特征过多,系统效率将降低,且容易产生错误,文献对这一问题进行了讨论,在特征提取时,一般采用Canny算子获得目标的边缘特征,而采用SUSan算子获得目标的角点信息。有关基于特征的跟踪算法还可参见文献。在2009年,albiol使用角点个数作为场景特征来估测人数,首先通过Harris角检测器检测出图像角点,然后进行角点匹配以区分人身上的角点和背景角点,albiol认为每帧总人数与人身上角点的个数成正比例关系,以此估测人数,算法虽然简单,但在petS2010“人数统计与密度估计”竞赛中取得优胜。2010年,Conte等“”基于albiol的方法提出改进。采用的SURF(SpeedupRo.bustFeature)特征点以代替角点,同时,Conte等不仅考虑到特征点个数对人数估测的影响,还考虑到透视投影(拍摄距离d)密度人群遮掩(特征点密度p)对于估测的影响,同时对所有SURF点进行分组回归以提高精度,在这个基础上张茂军等相比Conte等的研究成果在处理远距离人群上精度提高,主要因为使用“非最大抑制聚类”——对不同拍摄距离的人群采取不同的聚类标准,有效解决远距离人群的类过大问题,提取人身上特征点的方法是在掩模上直接检测特征点,使得特征点个数更加稳定,有利于SVm预测。

1.2基于区域的人数识别

基于区域的跟踪算法基本思想是:首先得包含目标的模板(template),该模板通过图像分割获得或是预先人为确定,模板通常为略大于目标的矩形,也可为不规则形状;然后在序列图像中,运用相关算法跟踪目标,对灰度图像可以采用基于纹理和特征的相关,对彩色图像还可利用基于颜色的相关。

mcKenna等首先利用色彩和梯度信息建立自适应的背景模型,并且利用背景减除方法提取运动区域,有效地消除了影子的影响;然后,跟踪过程在区域、人、人群三个抽象级别上执行,区域可以合并和分离,而人是由许多身体部分区域在满足几何约束的条件下组成的,同时人群又是由单个的人组成的,因此利用区域跟踪器并结合人的表面颜色模型,在遮挡情况下也能够较好地完成多人的跟踪。marana等认为低密度人群在图像上体现出粗糙纹理特征,而高密度人群则体现出精细纹理特征。文献分别采用自组织理论和minkowsld不规则维度理论从图像纹理特征预测人群密度。Lin等则结合Harr小波变换(Hwt)和支持向量机(SVm)进行行人头部轮廓检测,从而达到人数统计的目的。文献利用颜色和形状信息实现人头的检测,包含两个步骤:黑色区域提取和形状分析。通过对HSV空间V通道的像素设置阈值这种方法有效地检测出黑色区域,同时可以少受光照变化和阴影的影响。使用一种基于形状描述的快速弧形结构提取方法实现人头检测。姬红兵等提出了一种基于局部特征的目标跟踪算法,通过多尺度分析方法,根据颜色和空间上的相似性将目标分割为多个区域,每个区域由一个团块表示,团块包含了该区域所有像素的颜色均值、形状和位置,根据团块特征构造目标的外观模型,定义团块的匹配准则,通过团块匹配进行目标跟踪。

1.3基于模板匹配的人数识别

采用模板匹配识别跟踪方法首先将图像序列转换为一组静态形状模式然后在识别过程中和预先存储的行为标本相比较,

部分学者在运动前景提取的基础上使用了轮廓匹配方法对目标进行定位,文献使用了半圆模型搜索前景中人头肩所在位置,然后使用Snake模型与卡尔曼滤波相结合对目标进行跟踪目标,但Snake模型比较适合单目标的跟踪,当行人发生重叠时,定位精度会有一定的下降;在此基础上文献提出使用含有人harr特征分类器(使用头肩部上半身样本),对行人重叠情况下的检测精度有一定的提升。文献提出使用垂直摄像头降低行人之间的遮挡程度,通过对基于adaBoost的人头检测本方法,建立一个良好的人头检测分类器。然后根据运动人头的特征去除误检区域。最后配合过线跟踪实现出入口人数统计。

2视频跟踪问题中的难点

从上面的阐述可以看出,各种方法都有自己的优点和不足,是在文献基础上分析得到的几种具体识别方法的比较结果,由于各种方法在设定理想情况下都有较好的准确率,所以不对各种方法的准确率做出比较,而是从各种算法的复杂度、鲁棒性、先验知识需求、高密度复杂人群适应性(有遮挡出现)等方面进行相对的比较分析,分析结果如表1。

2.1视觉跟踪问题中的难点

从控制的观点来看,视觉跟踪问题所面临的主要难点可以归结为对视觉跟踪算法在三个方面的要求,即对算法的鲁棒性、准确性和快速性。

鲁棒性是指视觉跟踪算法能够在各种环境条件下实现对运动目标持续稳定的跟踪。影响人数跟踪系统鲁棒性的最主要原因在于目标处环境的光照变化以及部分遮挡引起的运动目标不规则变形和全部遮挡引起的目标的暂时消失。当运动目标所处环境的光照发生改变时,采用图像灰度信息或色彩信息作为跟踪基础的视觉跟踪算法一般都会失效,而基于图像特征的方法往往不受光照改变的影响,如利用运动目标的边缘信息能有效避免光照变化对运动目标的影响,但在复杂环境中要将运动目标的边缘和周围其它目标边缘区分开来是非常困难的,遮挡问题是视觉跟踪算法中又一难点问题,利用单摄像机解决遮挡问题也一直是视觉跟踪领域中的热点。而利用多摄像机可以在很大程度上解决这一问题,但正如前所述,多摄像机的应用又会引入新的难题。

在视觉跟踪研究中,准确性包括两个方面,一是指对运动目标检测的准确性,另一个是指对运动目标分割的准确性,对运动目标检测准确性的目的是尽量避免运动目标虚检和漏检,从而提高对真实运动目标的检测概率。由于实际复杂环境中存在大量噪声。至今已经出现了上千种各种类型的分割算法,但由于尚无通用的分割理论,目前并没有一种适合于所有图像的通用分割算法。

一个实用的视觉跟踪系统必须能够实现对运动目标的实时跟踪,这就要求视觉跟踪算法必须具有快速性但是,视觉跟踪算法处理的对象是包含巨大数据量的图像,这些算法往往需要大量的运算时间,很难达到实时处理的要求,通常,简单算法能够实现实时跟踪,但跟踪精度却很差;复杂算法具有很高的跟踪精度,实时性却很差,一种通用的减小视觉跟踪算法运算量的方法是利用金字塔分解或小波变换将图像分层处理。

3展望与结束语

3.1展望

实现一个具有鲁棒性、准确性和快速性的视觉跟踪系统是当前视觉跟踪技术努力的方向。但视觉跟踪技术在这几个方面中每前进一步都是非常困难的,因为该技术的发展与人的感知特性的研究紧密联系在一起,由于目前对人的感知特性没有一个主流的理论,其数学模型更是难以建立。同时,在计算机视觉中大多数问题是不确定的,这就更增加了视觉跟踪技术发展的难度。但是,近几十年来,数学理论方面取得了巨大的进步,因此合理的使用在数学理论方面的知识提高系统的性能能够很好的解决视觉跟踪问题。例如现在已经应用在诸多领域的模糊算法,神经网络等提高系统性能,简化计算复杂度。

3.2结束语

计算机视觉研究方向篇5

关键词:数字图像技术;应用;发展趋势

中图分类号:tp391.41

计算机的特点在于能够处理各种数据,数字图像能够经过增强、复原、分割等处理,随着计算机技术的不断发展和进步,现在的数字图像技术具有图像处理多样性、精度高、图像的再现性好、处理量大的优点,本文主要研究数字图像处理技术的发展现状和发展趋势。

1数字图像处理技术研究现状

所谓图像处理是指利用计算机来处理图像的过程,主要是实现改善图像的视觉效果,研究的内容主要包括图像数字化、图像增强、图像还原以及图像分割等。数字图像处理最早来源于20世纪20年代的报纸业,到20世纪50年代,随着计算机的发展,数字图像处理技术得到人们的普遍关注,数字图像处理技术随着太空计划得到很大的发展,最具有典型的例子,是对月球照片的处理。

进入到20世纪70年代后,数字图像处理技术随着计算机断层扫面(Ct)的出现得到发展,在以后的时间里,数字图像处理技术不断有新的研究成果,1975年ewi公司研究的Ct装置获得诺贝尔奖,目前数字图像技术已广泛应用在各行各业中。

2数字图像处理技术的应用

数字图像处理技术目前在各行各业中都得到了很大的进展。在遥感航空航天方面,不少国家都派出了侦查飞机对目标地区进行空中摄影,进而通过图像处理技术来分析照片,节省了人力、物理,也能够从图片中得到其他的有用信息。在20世纪60年代以来,美国以及其他的一些国家发射了资源遥感卫星,由于成像条件非常差,因此图像本身的质量也不高,需要采取数字图像处理技术处理,如采用多波段扫描器进行扫描成像,图像分辨率为30m,这些图像转变为数字信号传送下来,再经过处理。数字图像处理技术在各国的应用中已非常广泛,如用在森林调查、灾害监测、资源勘查以及城市规划中。

数字图像处理技术最早来源于医药方面,因此在生物医学工程方面,数字图像处理技术也发挥出了巨大作用,除了上文所讲述的Ct之外,还有一些显微图像处理技术,主要是识别红细胞、白细胞以及染色体分析等,在医学诊治方面X光肺图像增强、心电图分析以及超声波图像处理技术等发挥出了重要作用。

在通信工程方面,目前通信主要的发展趋势为综合性的多媒体通信,也就是将电视、计算机以及电话联合在一起在数字通信网上传输,在传输的过程中最为复杂和困难的地方集中在图像的处理中,比如说,彩色电视信号速率为100mbit/s以上,想要传输出去就需要压缩信息的比特量,因此技术成败的关键就在于编码压缩。目前国家正在大力研发的新的编码方法,如小波变换图像压缩编码以及自适应图像网络编码等。

在工业和工程方面,主要的应用集中在自动装置配线中检测零件的质量、弹性力学照片的应力分析以及邮政信件的自动分检等,另外在智能机器人中也有应用。在军事、公安方面,数字图像处理技术的应用主要集中在导弹的精确制导、侦查照片以及图像的传输和显示方面,在公安方面,主要应用在鉴别人脸、识别指纹以及图片复原方面。数字图像处理技术除了以上所讲述的应用领域之外,在电视图像的编辑、服装设计、发型设计以及文物资料复原等方面也有广泛的使用。

3数字图像处理技术的发展趋势

目前数字图像技术随着科技的进步得到了很大的发展,随着低成本硬件相关技术的发展可以想象数字图像技术将会得到更加广泛的应用,目前国内的研究成果主要集中在一些诊断、图像压缩编码以及目标识别等方面,但是还没有广泛应用在实际生活中。数字图像处理技术将会向着高分辨率、立体化、超高速以及智能化等方面发展,下面具体讲述数字图像处理技术的发展趋势。

随着计算机、人工智能以及思维科学研究的不断发展,数字图像处理技术在计算机视觉方面将会进一步的发展,智能机器人的重要感觉器官是视觉,目前研究的开放话题集中在理解和识别三维应力,将会应用在军事勘察、危险环境作业以及家庭服务等方面,目前人们对于自身的视觉了解的还非常少,因此在计算机视觉方面还需要进一步的探索。

数字图像处理技术还会向着虚拟现实发展,所谓虚拟现实就是使用计算机构成一个虚拟的三维空间,这项技术的发展是在计算机硬件技术的提高方面提出的,人们应用机器人身上的摄像机能够真实的感受到所在的环境,进而操纵机器人的行为,另外网上虚拟现实也是未来的一个发展方向。人们在完成社会生产中往往习惯使用自身的认识和工具,将这些掌握在自身手中,因此目前时代的发展趋势就是将原来二维的东西向着三维发展,如三维重建技术在地图方面的使用,在军事方面能够使用电子沙盘实现任意角度的转化和计算,也能够真实的直观的反应两点之间的障碍物等,还能够实现模拟飞行路线,为作战指挥带来极大的便利。在计算机中进行三维重建目前的热点和难点问题主要是计算机视觉研究领域。在图像压缩、识别以及分割方面,目前已取得很大的研究进展,目前图像处理面临的新的问题主要是图像专业压缩算法、图像识别算法等。

4结束语

综上所述,本文先分析了数字图像处理技术研究现状和主要的应用领域,进而研究数字图像技术的发展趋势。目前数字图像处理技术已广泛的应用在生活中,如在网络、手机等中的应用,数字图像处理技术的发展与人们的生活息息相关,随着技术的不断发展,数字图像处理技术还会不断得到进步,这些还需要更多的人努力去研究。

参考文献:

[1]孔大力,崔洋.数字图像处理技术的研究现状与发展方向[J].山东水利职业学院院刊,2012(04):11-14.

[2]陈炳权,刘宏立,孟凡斌.数字图像处理技术的现状及其发展方向[J].吉首大学学报(自然科学版),2009(01):63-70.

[3]吕戈静.浅谈数字图像处理技术的现状及发展[J].电脑知识与技术,2012(33):8035-8036.

[4]丁可.数字图像处理技术研究与发展方向[J].经济研究导刊,2013(18):246+270.

计算机视觉研究方向篇6

abstract:Surfacedefectdetectionisanessentialandimportantlinkinthesystemtoensurethequalityoftheproducts.Surfacedetectiontechnologybasedonmachinevisionimagingmethodhasbecomeameansofreformonlinesurfaceinspection.thispaperanalyzesthemeansofdetection,andgivesthemethodstoresearchLeDlightsourcedesign,surfacedefectvisualimaging.

关键词:表面缺陷检测;视觉检测;LeD光源

Keywords:surfacedefectdetection;visualinspection;LeDlightsource

中图分类号:tp391文献标识码:a文章编号:1006-4311(2014)16-0057-02

0引言

机器视觉检测技术是用视觉传感器和计算机组成的采集与控制系统对被测对象进行成像,再利用图像处理技术提取被测量信息的测量技术。机器视觉检测系统通常由视觉传感器、计算机采集与控制、图像处理三大模块组成,其中视觉传感器是由特定的照明光源和成像器件组成。在机器视觉表面缺陷检测量方法上关键要解决照明方法与成像方法两个问题。

1LeD光源照明的打光技巧与LeD光源模组设计分析

在视觉检测中,LeD光源的设计,是实现正确打光技巧的前题。打光方法是否合理关系到目标信息是否能准确的摄取。因此,LeD光源设计与打光技巧是视觉检测中的关键问题。

首先在理论上解决以下两个问题:一是明场照明与暗场照明、直接照明与散射照明、倾斜照明与同轴照明、投射照明、偏振照明等照明方式同表面粗糙度和表面特征之间的关系;二是照面光源的色温和光谱特性同目标特征的颜色以及背景颜色之间的互补关系,以及光谱与色温对目标特征增强的影响规律。

然后以光的反射、散射等物理光学及光度学为理论基础,以Lighttools和tracepro为光源设计工具软件,结合图1对LeD光源的要求,研究LeD光源照明的打光技巧和LeD光源的设计原理和方法。

2表面缺陷视觉在线检测中大孔径远心光路成像技术分析

不论是点扫描成像、线扫描成像还是帧成像,通常在图像传感器的前方需要放置一个物镜,在特定的照明方式下,在特定的空间位置,把含有表面缺陷信息的散射光场汇聚到图像传感器的感光面上。由于成像物镜一般都有有限的孔径,在近几年的研究中发现,这种小孔径视觉成像,在大面积表面缺陷测量中,对很多缺陷不敏感,要解决这个问题,需要研究采用大孔径远心光路成像。而在大面积表面缺陷检测中,大孔径远心光路系统又很难实现。

以往的研究中发现用线阵扫描方法或面阵摄像机直接对被测表面成像时,即使摄像机的分辨率很高,有时都难以分辨表面上的微观缺陷,主要原因是摄像机镜头的孔径大小改变了光线的传播方向。为了解决这个问题,只有让散射光场中的光线平行地投射到感光面上,即采用远心光路系统。图1给出了高速线阵扫描的两种可能的视觉成像方式。

3表面缺陷计算机自动识别技术分析

采用计算机从视觉图像中自动识别表面缺陷,在理论上与实际应用中一直都是一个非常难的问题,尤其是复杂背景的视觉图像中表面缺陷的自动识别。这通常是表面缺陷在线检测中的一个主要瓶颈。不过近些年来,随着数学形态学、计算机纹理分析技术与模式识别技术的发展,各种新的自动识别方法不断出现,为表面缺陷的自动识别在理论与方法上提供了很好的支持。

目前研究工作中,常用的途径是采用数学形态学与纹理分析等分类法。如anand等人对焊接的缺陷图像首先利用Canny算子探测出缺陷的边界,再用膨胀法连接哪些相似的边界,用腐蚀去除掉哪些不相干的边界,最后根据缺陷的特性进行分类。Chetverikov等人在视觉检测具有规则纹理结构表面的缺陷时,采用形态学对纹理中的缺陷进行增强,然后根据纹理的规则性与局部方向性把缺陷从纹理图像中分离出来。

可以分析得出,将数学形态学与计算机纹理分析技术结合起来,进行表面缺陷的自动识别技术研究将是一种可行的方法。形态学方法一般比较适合用于表面缺陷视觉图像的前期处理,因为用它对缺陷图像进行变换,可以增强表面缺陷的特征,但是它难以单独完成缺陷的自动识别任务。纹理分类有四大种类,每个种类有许多不同的分类方法,利用纹理中的特征值或函数,可以完成图像自动识别。但是在纹理分类法中,目前现有的分类方法对复杂的纹理图像识别精度不是很高,有时难以胜任表面缺陷在线自动检测的需要。因此如果把形态学方法与纹理分类法结合起来,也许是一条比较好的提高自动识别精度的途径。

参考文献:

[1]a.anand,p.Kumar,“Flawdetectioninradiographicweldimagesusingmorphologicalapproach,”nDt&einternational,Vol.39,2006:29-23.

[2]D.Chetverikov,a.Hanbury,“Findingdefectsintextureusingregularityandlocalorientation,”patternRecognition,Vol.35,2002:2165-2180.

计算机视觉研究方向篇7

>>关于社会信用体系建设的实践和启示企业网站的视觉体系建设国外商业银行内部审计体系运行的经验及启示搜索服务的价值来源及商业模式分析国外创新型城市的建设实践及启示西方海绵城市建设的理论实践及启示程序员搜索习惯的研究及对搜索工具开发的启示领域导向的数字图书馆移动视觉搜索引擎建设研究视觉工作记忆内容对视觉搜索的影响推进公共文化服务体系建设的实践与启示基层服务型党组织建设的实践与启示美国反商业贿赂控防实践及启示我国视觉素养教育的特色及启示建设节约型医院的意义、途径及实践学习型组织建设实践与启示我国商业银行的内部评级体系:实践及挑战基于应用型创新人才培养的实践教学体系建设的思考以就业为导向的中职会计专业实践型核心课程体系建设应用型本科院校物理实验教学体系的建设与实践应用型本科园艺专业教学体系建设的实践与思考常见问题解答当前所在位置:.

[5]国务院关于积极推进“互联网+”行动的指导意见[eB/oL].[2016-04-01].http:///zhengce/content/2015-07/04/content_10002.htm.

[6]国家自然科学基金委员会.“大数据驱动的管理与决策研究”重大研究计划2015年度项目指南[eB/oL].[2016-04-01].http:///publish/portal0/tab38/info49994.htm.

[7]王元卓,贾岩涛,赵泽亚,等.openKn―网络大数据时代的知识计算引擎[J].中国计算机学会通讯,2014,10(11):30-35.

[8]张兴旺,黄晓斌.国外移动视觉搜索研究述评[J].中国图书馆学报,2014(3):114-128.

[9]张兴旺,李晨晖.数字图书馆移动视觉搜索机制建设的若干关键问题[J].图书情报工作,2015,59(15):42-48.

[10]段凌宇,黄铁军,高文.移动视觉搜索技术研究与标准化进展[J].信息通信技术,2012(6):51-58.

计算机视觉研究方向篇8

>>Logisim在计算机专业硬件基础课程综合性实验中的应用探索巧用大学计算机实验教学中的综合性实验计算机类综合性与设计性实验的设计与思考综合性大学非计算机专业《计算机基础》课程改革基于问卷调查法的计算机仿真技术课程综合性实验效果分析评价计算机网络综合性创新实验项目探析综合性大学计算机基础课程改革与设计面向计算机专业的递进式综合实验教学方案计算机互联网应用的综合性分析论综合性大学计算机科学与技术师范专业的建设地方综合性大学计算机中心管理的研究与实践计算机硬件课程与实验平台建设浅议高校计算机视觉课程教学的创新谈计算机视觉课程的教学创新面向就业的中职计算机课程研究面向对象的计算机导论课程教学计算机基础类课程网络实验平台构建的研究计算机组成原理实验课程网络在线试验平台建设模式的思考基于Vmware的计算机网络课程虚拟实验平台搭建面向卓越工程师的计算机网络实验课程教学改革常见问题解答当前所在位置:l.

[3]Computervision[eB/oL].[2016-12-26].https://courses.cs.washington.edu/courses/cse576/16sp/.

[4]Zhangputervision[eB/oL].[2016-12-26].http:///linzhang/CV/CV.htm.

计算机视觉研究方向篇9

该文围绕基于内容的图像检索技术展开研究,对国内外基于内容的图像检索算法技术进行对比,概括了基于内容的图像检索算法技术的特点,在基于内容的图像检索算法技术中采用的相关核心技术进行了简要分析。

关键词:图像检索;图像特征提取;RGB

中图分类号:tp393文献标识码:a文章编号:1009-3044(2016)01-0206-02

1概述

视频信息处理的基础是图像信息处理技术,我们生活在一个科学的信息时代,平时我们从外界接触到的信息主要都来至图像、文本、视频等,自然世界本来面貌的反应来至图像和视频,图像和视频是最贴近大自然的,图像信息在我们的信息处理领域中占有很重要的地位。

人们在计算机技术和互联网技术的发展中接触到大量的信息,人们之所以可以获得大量的多媒体信息主要依靠互联网,互联网具有动态发展和快速增长的特点。信息量的暴增,信息量的不断增加导致信息大爆炸,我们怎么样对信息快速而准确的查找,怎么更好地对大量的信息进行管理是一个关键性问题。视觉信息是人们获取信息的主要方式,视觉信息可以对人们周边的事物还原本来的面貌,给人自然贴切的感觉,人们对内容丰富、表达直接的多媒体图像信息很关注,我们每天的天气预报需要卫星云图,网上购物时候商品主要都是以图片的形式展现给消费者。面对人们对图片信息的需求,快速准确的检索出来我们需要的图片信息是急需解决的问题,图像信息比文本信息表达给我们的要更详细,更容易接受。

基于内容的图像检索技术是一个功能强大的技术,数字图书馆改变的传统图书馆的模式,数字图书馆用数字形式把多媒体和图像都表现出来,把信息收集和整理到一起,我们可以在网络的平台上运用基于内容的图像检索算法技术对图书信息进行检索,基于内容的图像检索算法技术成为数字图书馆应用的重要技术。在医疗上,各大医院在医疗诊断上也应用基于内容的图像检索算法技术,磁共振图像、Ct图等图像,医生可以应用基于内容的图像检索算法技术对这些图像进行分析研究,帮助医生更好的工作。在互联网的电子商务时代,网上购物很大的替代了实体店,网上商品的展示主要是图片信息,用户要想找到符合自己需求的商品,也是要有基于内容的图像检索算法技术的支持。知识经济的发展知识产权被重视,对注册的商标的图片信息,要在图片信息库中进行检索,对比是否有重复的图片,确定商标是否可以被注册,这也是要有图像检索技术的支持。警察在对案件进行侦破的时候要有指纹的采集,这也是图像检索技术。服装设计、新闻广告需要的图片比较多,这就需要图像检索技术搜索出符合自己需求的图片信息。图像检索技术应用在社会的很多领域,军事、工业、教育等。

2国内外研究现状分析

国外基于内容的图像检索算法研究技术主要是基于图像视频媒体,对查询接口和检索内容的管理,iBm早期应用基于内容的图像检索算法研究技术系统,支持weB检索和图像数据库检索,根据颜色纹理特征对照片图像进行检索,系统查询和特征查询的界面直接面向用户,便于用户使用,随着计算机网络发展iBm现在基于内容的图像检索算法研究技术应用到了商业医学等图像检索领域,比较有名的是基于互联网的远程博物馆漫游计划。哥伦比亚大学的比较常用的基于网页界面的图像搜索引擎,采用图像色块的不同的特点进行对比匹配的多种查询方法,在互联网上建立一个用户查询,采用可视化对象的方式,并对图像的特征进行提取,为用户提供检索的接口。加利福尼亚大学早期采用对图像进行分割然后查找出相似的图像,特征表述法可以快速帮助用户对图像进行查询匹配。加州大学基于内容的图像检索算法研究技术系统是先把数据库样例图像进行分割,然后根据用户图像的需要对分割的图像的颜色形状等特点进行检索查询。

国内一些科研研究机构也开始对基于内容的图像检索算法研究技术方面内容进行研究,国内研究还是处于对图像颜色的查询,对于比较成熟的图像形状纹理技术的查询还需要研究,国防科技大学对图像数据库的体系结构,面向用户接口界面等技术有一定的研究基础,对理论比较重视。清华大学图像检索技术应用在对文物壁画的较多,对文物的年代的判断是基于壁画的主色进行判断,也开发了一个比较完整的基于内容的图像系统,这个系统对图像研究采用的检索技术是颜色纹理分布关键词来进行表述的。浙江大学对图像检索技术的研究是在1995年,对图像检索系统的研究主要是特点颜色形状的图像,图像检索系统查询主要是对关键字、颜色纹理布局、全局颜色纹理,拥有自己开发的图像检索系统,并应用于科研工作。

3图像处理技术研究的特点

早期的图像处理技术是人工标注的图像检索,这种技术主要是对图像进行人工分析,对图像特征进行文字标注,建立文本文献索引数据库。在对图像数据库进行检索时候主要是得到图像编号,转变成文字检索。随着计算机和互联网技术发展,人们采用人工标注的图像检索技术已经不能满足对图像检索的需求,基于内容的图像检索算法技术是计算机图像处理技术和数据库技术结合的产物,分析和识别物理图像,用计算机来模拟人对图像的观察,把观察到的物理图像的特征进行标识然后组织管理,人们对图像的检索依据特征的标识在数据库图片信息中找到匹配的信息,从而在大量的数据库中检索出需要的图片信息。

1)基于内容的图像检索算法研究内容特点:基于内容的图像检索算法研究最初椒图像胡匹配,对图像内容和相同处采用全局方式去描述,简单、单一的图像采用这种方式;采用用户自己用计算机检索图像的方法,这种方法我们叫做图像检索反馈技术,用户在用计算机对自己需要的图像进行检索时,把图像按自己的需求分成需要的和不需要的,然后反馈给系统,这样系统会对用户检索的图像进行标识,这样通过反馈的标识进而返回用户满意的检索图像,对查询图像的特征进行查询直到用户满意为止,这种方式采用循环查找匹配;对图像检索采用区域的方法,对图像物体的提取之前先把图像用技术进行分割,把每个图像的自己的特征整合到一起编程图像的整体的特征,对图像的检索采用图像相识度进行对比。

2)基于内容的图像检索算法研究技术特点,基于内容的图像检索算法研究技术与传统的通过关键字进行检索技术不同,基于内容的图像检索算法研究技术是通过在数据库中的图像信息的特征进行检索,满足用户查询的要求,采用相识度的检索技术从大量的数据库中查找出和用户检索内容相似特征的图像,然后把检索出来相识特征的图像进行整理排列,用户在自己筛选最后检索出自己需求的图像信息,在数据库多媒体庞大的信息量时代,对图像特征进行匹配是一个很大的计算,需要快速的检索速度,基于内容的图像检索算法研究技术采用查询图像的界面面向用户。

4基于内容图像检索技术

本文涉及的图像检索技术包括颜色模型技术,图像特征提取、图像纹理特征提取、图像形状特征提取、图像的相似度技术。

颜色模型技术,颜色模型是颜色空间的表现方式,基于视觉的视觉模型和基于物体的颜色模型是颜色空间的两个结构方式,我们对颜色认知上的RGB就是基于物体的颜色模型,视觉模型主要是研究图像相识度的。RGB颜色模型有R、G、B、三个坐标轴,颜色的分布和变化是根据坐标点在三个坐标轴的具置定的,图像的色彩可以用RGB三色的坐标轴来建立,RGB是颜色空间的显示。

图像特征提取,基于内容的图像检索技术的基础就是图像的特征提取,文本特征和可视化特征是图像提取的两种方式,图像特征提取包括图像的共同特征提取比如颜色纹理,和具体的应用在假设的基础上对图像内容比如人体特征提取两种,图像特征提取包括好多的专业性知识。颜色特征是图像检索中的关键因素,图像的物体和场景特征主要在颜色上体现出来,颜色图像特征是人们的视觉特征,蓝色体现大海的颜色特征,绿色体现草原的颜色特征,主要技术包括颜色矩、颜色直方图、颜色相关图等。

图像纹理特征提取,体现图像相同质地表面共有的内在的视觉特征,物体表面的组织信息和物理与周围环境的关系都通过视觉特征表现出来,人们可以采用局域内容的图像检索技术采用纹理特征把相同纹理特征的物理图像从数据库中检索出来,基于内容的图像检索技术主要采用的纹理特征技术包括小波变换技术和灰度矩阵技术等。

图像形状特征提取,图像形状特征和图像颜色、纹理特征不同,图像形状特征是基于图像物理本身划分的各个区域,是计算机视觉模式研究的基础,被应用到特殊的研究中,在物体形状的翻转拉伸等变化不影响图像形状特征,在计算形状的相识度上提出了高的要求。轮廓特征体现在物理的边界表面,区域特征体现在图像物理的整个形状,轮廓特征和区域特征可以很好地把图像特征表示出来,图像形状特征提取技术采用几何变换和傅里叶变换两种计算方法。

图像的相似度技术,传统的文本检索是基于文本的匹配,计算机对图像查询和数据库中图像的相似度是基于内容的图像检索技术完成对图像进行检索的主要方法,基于内容的图像检索技术关键是图像的匹配,图像的相似度计算包括特征向量的归一化、距离函数的相似性技术等。

5总结

基于内容的图像检索算法技术在多媒体数据库中对图像进行检索,采用对图像内容进行分析归纳特征,根据分析出的特征在数据库大量的图像库中对特征进行匹配,找到相似的特征的图像并检索出来供用户选择,基于内容的图像检索技术的关键性是图像特征的提取,本文主要对图像特征的提取技术展开研究,本文技术创新在于基于平面颜色理论的RGB图像检索算法,使用RGB颜色空间,提出颜色的空间分布特征。基于内容的图像检索算法技术最终要实现的是把用户需要的检索结果返回给用户,是计算机图像检索技术的一个新的技术,在图像检索应用上有很大的应用空间。

参考文献:

[1]廖倩倩.基于内容的图像检索系统的实现[J].电视技术,2007(2).

计算机视觉研究方向篇10

关键词智能交通系统;计算机视觉;汽车流量

中图分类号:tn948文献标识码:a文章编号:1671-7597(2014)14-0048-01

基于视觉的图像处理器测量精度高,抗干扰能力强,许多自然及人为的干扰都可以被消除,运用预测技术可以再捕获瞬间丢失的目标,并且能实现对记忆的跟踪。它通常安装在路边或架空安装,不会重新铺设路面,也不会影响埋在地下的水和天然气管道,更不会干扰交通。基于视觉的图像处理有其突出的优点,表现在:可以获得的目标信息非常巨大,获取信息的方法也非常方便。

1研究的实用意义

车辆检测系统在智能交通系统中具有很重要的地位。机动车辆流量计数与监控为智能控制提供了相当重要的数据来源,通过计算机视觉的机动车流量统计系统可以检测很多交通参数,便于我们检测和监控,这些参数中的一个重要参数就是汽车

流量。

基于视频的检测法作为最有前途的方法之一,有以下优点。

1)能高效、准确、安全可靠地的监视和控制道路交通,能够提供高质量高分辨率的图像信息。

2)用于交通监视和控制的主要设备就是安装视频摄像机,现在我国所有城市基本都已经安装了视频摄像机,甚至高清视频摄像机。因为安装视频摄像机破坏性非常低、很方便、也很经济。

3)由计算机视觉得到的交通信息可以通过联网工作,非常有利于对道路交通网的监视以及控制。

4)由于目前对智能交通系统的安全性、实时性和可靠性的要求都非常高,计算机技术和图像处理技术的发展显得极其

重要。

2研究内容

本研究主要包含两大部份:一部分就是采用分类和分割方法把采集到的视频图像的目标进行识别;另一部分就是通过定位方法来实现目标的跟踪。这两部份是缺一不可,紧密联系在一起的。

首先先介绍视频图像的目标识别,视频图像目标的识别方法有很多,但总体上主要有两种方法:一是大家熟悉的相关匹配法,二是特征匹配法。相关匹配法是通过找到最大相关值(最大相关值指的就是当前图像与参考图像间的相关系数的大小)所在的位置来确定当前输入图像中的目标位置。相关匹配法优点是可以在信噪比很小的条件下工作,对噪声抑制能力非常强,在计算形式上比较简单,很容易实现。但它的缺点也很明显,由于相关匹配法对几何和灰度畸变十分敏感,反而计算量偏大,造成的直接后果就是非常容易产生累积误差,而且最关键的就是不能充分利用视频图像目标的几何特性,就不能保证对识别目标的跟踪精度。相关匹配法比较适合于对目标的尺寸变化不大并且场景各部分的相关性不强,当前输入图像和参考图像的产生条件较为一致的场合。特征匹配方法是目前研究较多的一类图像匹配方法,它是通过目标的特征与输入图像中目标的特征来比较辨识目标。它首先提取输入图像和参考图像的相关特征信息,比如边缘、角点等。然后通过测量距离来比较输入图像与参考图像的特征集合,如果输入图像的特征集与参考图像的特征集距离是最小的(在满足给定约束条件下),则判定该目标被识别。它对目标的几何特征、灰度畸变一点都不敏感,但它充分利用了目标图像的特征信息,因而可以保证较高的跟踪精度。

上面介绍了视频图像目标的识别,现在介绍本研究第二部分:通过定位方法来实现目标的跟踪。对于图像目标的跟踪方法通常有下面几个方法。

亮度中心法,其实这种方法计算很简单,只要确定了一个点,就能完成定位。这个点就是一个跟踪点,它就是具有最高灰度的像素点(来自获得的视频目标图像)或这个点上的一个邻域。这种方法、性能很稳定、容易实现,工程上运用的很多。但这种跟踪非常容易受干扰,因为它主要适用于红外和其他放射性目标的跟踪。

最佳空间滤波法是常用跟踪方法之一,它完全是在亮度中心法的基础上建立起来的,为了提高跟踪性能,就要把目标的大小、形状、运动特性等特征都完全利用起来。但目前这类方法也有明显缺点,在实用性、定位精度上和计算量方面都有较大的限制。

投影、形心法是通过目标的投影或形心来确定目标的实际位置和运动姿态。对比前面两种跟踪方法,投影、形心法的优点是计算量非常小,容易通过硬件方式来实现。缺点是它的抗干扰性能力比较差,主要用于均匀背景下跟踪孤立目标。

从以上对研究内容的介绍,现有的各类识别和定位方法都各有优缺点,要想找到一个合适的方法,都达不到满意的效果。要想取得较好的性能,都只能在目标尺寸相对对比度变化都不大、对噪声的干扰又比较小、图像灰度的空间变化并不明显的理论环境中。然而实际的环境通常是变化无常的,通过一种方法来实现目标的识别与跟踪很难有合适的效果。最近几年,结合这些方法的优点和缺点,混合定位识别的方法确能将上述各类基本的识别方法进行混合定位,使它们能够合二为一,相互补充。这代表着目标识别方法非常具有理论研究和应用价值,是一个重要发展方向。

3技术路线

研究的技术路线(如图1):首先提取出摄像机采集到的视频,该视频是以帧为单位的图片文件形式。然后对图像数据进行数学上的处理,比如二值化、提取边缘等。这样就可以识别汽车的位置进行定位,最后对识别出来的汽车数量通过计数器计数。

4研究实现

通过基于计算机视觉的研究,我们设计出了能够实现机动车流量的检测和计数的系统。并且该系统能够对运动目标进行识别与跟踪定位,对出现多目标遮挡和丢失目标,还可以重新匹配。

5结束语

本文创新之处就是将上述各类基本的识别方法进行混合定位,使它们能够相互补充。这代表着目标识别方法非常具有理论研究和应用价值,是一个重要发展方向。

参考文献

[1]章毓晋.图像工程(第2版)[m].清华大学出版社,2007.

[2]夏文龙.基于计算机视觉的汽车流量检测研究[D].四川大学,2003.

[3]葛群辉,浅谈基于视觉的高速公路车流检测技术[J].科技资讯,2010(2).

[4]刘萌萌,基于无标度摄像机的车流跟踪与速度估计算法研究[D].西南交通大学,2005.