计算机立体视觉技术十篇

发布时间:2024-04-26 02:01:09

计算机立体视觉技术篇1

1双目立体视觉概述

双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。

双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。

视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。

2双目立体视觉技术的原理

立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。

三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。

双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。

双目立体视觉在计算机技术中实现三维重建的大致流程

如下。

1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。

2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。

3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。

4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。

5)根据得到的视差图最终实现场景的三维图形的重建。

3双目立体匹配技术的研究难点和未来的发展方向

尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。

立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。

1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。

2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。

3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。

从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。

4结束语

人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。

参考文献

[1]高文,陈熙霖.计算机视觉算法与系统原理[m].北京:清华大学出版社,2002.

[2]明祖衡.双目立体视觉测距算法研究[m].北京:北京理工大学,2008.

[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SaD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.

[4]陈蛟.双目立体匹配的算法研究及其多核并行化[m].南京:南京邮电大学,2012.

计算机立体视觉技术篇2

关键词计算机;视觉技术;应用研究

中图分类号:tp212文献标识码:a文章编号:1671-7597(2013)16-0114-01

计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。

1计算机视觉技术

计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。

2计算机视觉技术在各领域的应用分析

随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。

2.1在工业领域中的应用

工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。

2.2在农业生产领域中的应用

该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。

2.3在林业生产中的应用

该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。

2.4在农产品检测中的应用

农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。

2.5在电力系统自动化中的应用

计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。

2.6在图书馆工作中的应用

随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。

3结束语

通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。

参考文献

计算机立体视觉技术篇3

abstract:Fornowthedefectsoffiremonitor’slocationtechnologyinlargespacebuilding,thebinocularstereovisionisappliedtoorientatingfireinthesebuildings,theproblemofreal-timeoffiremonitoriswellsolved,havingveryhighusevalue.

关键词:高大空间建筑双目立体视觉火源定位

Keywords:LargeSpaceBuilding,BinocularStereovision,FireLocation

中图分类号:G267文献标识码:a文章编号:

1.概述

改革开放以来,我国各种民用建筑类型都得到了长足的发展。特别是近年来高大空间建筑日益增多。高大空间建筑由于建筑结构的特殊性和使用功能的复杂性,导致其防火分隔很困难,常规的灭火设施功能难以施展。针对这一情况,人们对适合于此类建筑的灭火技术进行了大量的研究,已有相关产品(智能消防炮)应用到实际工程中。目前消防炮定位技术主要集中在红外线、紫外线火灾探测器的扫描搜索定位以及基于机器视觉技术进行火灾空间自动定位,这一方法是利用安装在炮管上的单目摄像机进行扫描定位。然而这两种装置完成对一个火源的定位,需要把探测器调整到两个理想位置,硬件调整所需时间较算法实现所需时间要长的多,因而系统定位过程所需时间主要花费在探测器位置调整上,因而具有明显滞后性,不符合火灾扑救实时性要求[1]。针对这一情况,本文采用双目立体视觉定位技术来实现火源定位来弥补滞后性问题,具有很高的利用价值。

2.双目立体视觉定位基本理论介绍

2.1双目立体视觉原理[3]

双目立体视觉(BinocularStereoVision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。己知两摄像机之间的位置关系,便可以获取两摄像机公共视场内物体的三维尺寸及空间物体特征点的三维坐标。

2.2摄像机模型

摄像机采集到的图像二维信息,要想根据这个二维信息得到物体实际的三维信息,就要建立图像坐标系与世界坐标系之间的映射模型。本文用经典针孔摄像机模型来描述这一关系,如图1所示。其中XwYwZw为世界坐标系,XCYCZC为摄像机坐标系,xy为图像物理坐标系,uv为图像像素坐标系。

图1摄像机针孔模型

上述模型存在以下关系:

(2-1)

m1为内部参数矩阵,m2为外部参数矩阵。

2.3双目立体视觉三维测量原理

双目立体视觉三维测量是基于视差原理,图2所示为简单的平视双目立体成像原理图,两摄像机的投影中心连线的距离,即基线距为B。两摄像机在同一时刻观看空间物体的同一特征点p,分别在“左眼”和“右眼”上获取了点p的图像,它们的图像坐标分别为pleft=(Xleft,Yleft),pright=(Xright,Yright)。假定两摄像机的图像在同一个平面上,则特征点p的图像坐标的Y坐标相同,即Yleft=Yright,则由三角几何关系得到:

(2-2)

图2双目立体成像模型

则视差为:D=Xleft-Xright。由此可计算出特征点p在摄像机坐标系下的三维坐标为:

(2-3)

因此,左摄像机像面上的任意一点只要能在右摄像机像面上找到对应的匹配点,就可以确定出该点的三维坐标。这种方法是点对点的运算,像面上所有点只要存在相应的匹配点,就可以参与上述运算,从而获取其相应的三维坐标。

3.双目立体视觉定位关键技术

双目立体视觉系统包括图像采集、摄像机标定、特征提取和立体匹配等部分,其中最关键的是摄像机标定和立体匹配这两项技术[2]。

所谓摄像机标定,就是确定摄像机内外参数m1、m2的过程,本文使用ZhangZ.Y.提出的基于2D平面靶标的摄像机标定方法[3]。

立体匹配其基本原理是从两个视点观察同一景物以获取立体像对,匹配出相应像点,从而计算出视差并获得三维信息。从各具特色的双目立体匹配算法框架来看,算法有效性主要依赖3个因素,即选择准确的匹配基元(决策变量)、寻找相应的匹配准则(目标函数和约束条件)和构建能够准确匹配所选基元的稳定算法(求解过程)。

在本文中,考虑到火灾火焰定位报警这种实时性要求较高的场合,我们采用的匹配算法主要是局部匹配算法中的区域匹配法。区域匹配是直接对图像像素进行匹配,匹配结果不受特征检测精度和密度的影响,可得到较高的定位精度,使得区域匹配的鲁棒性有很大提高,同时也能满足实事性需求。匹配准则利用双目立体视觉中的极线几何约束条件。

4.实验平台

4.1硬件平台实现

采用陕西维视数字图像技术有限公司提供的系统开发平台方案搭建硬件平台,整个系统总体构架如图3所示。

图3硬件系统总体架构

该系统介绍如下,用两部微型高清晰黑白工业相机获得火灾图像,该两部摄像机摄像机水平平行放置。经两路工业高清图像采集卡(mV-采集后送至台式电脑,该采集卡支持VB、VC、DeLpHi二次开发,提供开发实例源代码。带软压存储软件,支持多种操作系统。利用安装在电脑里的开发软件(VisualC++2008+openCV2.0)来实现摄像机标定以及火源空间定位软件的开发工作。利用开发的软件计算出火源空间三维坐标后,电脑给机器视觉可精确控制运动高速云台发出指令,来验证定位的准确性和实时性。该云台可通过运动控制卡(内置)来精

确控制。控制范围水平面不小于-157度到+157度,垂直平面内不小于-36度到+36度,控制精度0.0129°,60步/s-1000步/s数字化加速度控制,运动速度可控可调,用于自动控制、自动跟踪、视觉仿真等机器视觉平台的搭建,可以二次开发。

4.2软件平台实现

openCV(opensourceComputervisionLibrary)[4]是intel公司开发的开源计算机视库,它由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉方而的很多通用算法,具备强大的图像和矩阵运算能力。它拥有包括300多个c/c++函数的跨平台的中、高层api,不依赖于其它的外部库(尽管也可以使用某些外部库),通过调用openCV算法库,研究者们可以在前人己完成的成熟算法基础上迅速开展自己的工作。作为一个基本的计算机视觉、图像处理和模式识别的开源项目,openCV可以直接应用于很多领域,作为二次开发的理想工具。

该平台基于windows7操作系统,利用VisualC++2008开发了一个基于openCV2.0的火源定位系统。

图4软件平台模块功能图

图5是在本系统在openCV下生成的tsukuba三维重建图,由此可见我们便可以借助三维重建的方法,达到对火灾火源空间定位。

图5tsukuba图相对的三维重建图

5.结论

随着经济和社会的不断发展进步,大空间建筑越来越多,随之带来的高大空间建筑的火灾扑救问题受到更多的关注。本文针对目前消防炮定位技术的不足,提出了双目摄像机立体视觉空间火源定位技术,将定位和联动独立开来,可以更实时地实现定点灭火,把火灾造成的损失减小到最小程度,必将具有广阔的应用前景和使用价值。

参考文献

[1]侯杰,钱稼茹等.高大空间建筑火灾探测及扑救技术发展思考[J].华中科技大学学报(城市科学版),2008,25(4):196-201.

[2]原思聪,刘金颂等.双目立体视觉中的图像匹配方法研究[J].计算机工程与应用,2008,44(8):75-77.

计算机立体视觉技术篇4

关键词:平面设计;视觉美学;计算机辅助

1前言

随着科学技术的快速发展,计算机辅助逐渐在各个领域得以应用。所谓计算机辅助技术就是指在产品设计和测试的过程中,借助计算机平台来完成的技术。计算机辅助技术使用的过程中,人的主观性是十分重要的,特别是在平面设计视觉美学之中。计算机辅助技术的使用,可以使得平面设计中的几何设计得以更好的进行。

2计算机辅助技术下的平面设计综述

随着科学技术的快速发展,计算机辅助技术越来越成熟,其应用范围也越来越广,并逐步在平面设计中得到应用。这一新技术的应用,在很大程度上促进了平面设计的发展:基于计算机辅助技术这一平台,平面设计中的视觉美学得到体现的同时,平面设计的视觉元素也逐渐多元化。

好的平面设计作品都自觉或不自觉的遵循视觉美学的基本原则,这些规则在平面设计红枣年糕就表现为几何设计的基本原理,具体来说就是在设计的时候,要着重突出几何图形的对称性以及黄金分割等元素。只有这些几何元素的得以突出,而且得到有效搭配,那么设计作品在视觉上才能够更加和谐,视觉美学才能得以构建。因此,各设计元素之间的位置关系、自身的比例关系等都对于平面设计作品的好坏有着直接的影响,进而直接影响着平面设计的价值。故在平面设计的时候,要充分使用计算机辅助技术,对设计中的元素进行合理的构建,使他们之间得以和谐的搭配。

3平面设计中几何视觉美学的构建

在平面设计的视觉美学之中,几何美学常常占据着十分重要的作用,特别是对称以及黄金分割等设计元素的构建,这对于视觉美的形成有着特别重要的作用。而在很大程度上,这些几何视觉美学的构建,需要依赖于计算机辅助技术。

3.1对称视觉美学的构建

在平面设计视觉美学构建的时候,大多使用对称几何元素。这可以使得诸如人体对陈美、建筑物对称美之类的事物的潜在美得以体现。所以,在进行平面设计的时候,要充分发挥计算机辅助技术的作用性,对设计内容的位置进行合理的设计,并做出精确的计算,最终使得所形成的平面设计作品能够体现对称视觉的美。要知道,计算机辅助技术的使用,可以使得对称视觉美显得更加的匀称舒适,在一定程度上可以说这是现代平面设计带给视觉美的一大冲击。

3.2黄金分割点的视觉美构建

从美学的角度来见,黄金分割点可以体现事物的本质美。在进行平面作品设计的时候应该遵循黄金分割点即0.618∶1的比例来进行,这可以使得所设计的作品能够符合视觉美的需求,使得视觉美得以体现。而对于黄金分割点的设计,则需要使用计算机辅助技术进行计算来完成,在计算机帮助下,要对所要设计作品的元素进行全面分析,使得元素的设计能够符合黄金分割的要求,从而使得作品的自然视觉美得到彰显,达到平面设计自然美的要求。

4平面设计视觉美学中的计算机辅助技术分析

上文已提到,在进行平面设计的时候,要特别注意几何美学视觉的设计。在进行平面设计时要想设计出完美的设计作品,必须注重几何美学的设计,只有这样才能使得设计的视觉美学得以体现。从平面设计中的视觉美学方面出发,计算机辅助技术的使用主要体现在两个方面:即系统平台构建和辅助工具的使用。所谓系统平台构建就是指在进行平面设计的时候在计算机上构建完善的系统框架。主要有以下步骤:首先,应该建立图形输入端,从而实现图形数据的输入;其次,要从设计元素的视觉美观的角度出发,建立以图幅分析、图形分割以及辅助工具模板为核心的子系统。第三,着手构建系统平台的数字处理功能,从而实现图形比例的计算、位置控制等功能。最后,要基于设计元素的构建,对整个辅助平台进行修改完善。

4.1设计元素分析

设计元素的分析主要从图幅分析的角度来进行。依靠图形输入端,各设计元素都被导入到各个子系统中,从而实现对各图形元素的分析。在对图形元素的分析的过程中,应该根据使用的实际需求,逐步对图形的操作功能进行完善,从而确保图幅分析能够达到预期效果。

4.2几何设计平台

在进行平面设计的时候,图形分割点、线要依靠设计平台来完成。在进行平面设计的时候,点、线元素的构建是特别重要的,应引起高度重视。计算机辅技术的使用可以使得点、线设计元素达到良好的人机互动,最终使得幅图的剪切效果的自然美观更突出。

4.3工具模板

通过计算机辅助工具模板,可以进一步的对幅图进行详细的分析。通过计算机辅助技术,设计元素的剪割会具有更多的层次感,这对于平面设计的视觉美学构建有着很大的影响。

[参考文献]

计算机立体视觉技术篇5

计算机理论双目立体视觉运动平台的动力学仿真分析

一、引言

随着信息、处理、计算机技术的发展,人们对于机器能够仅仅获取以一些平面的二维视觉信息越来越不满意,人们设想借助计算机的技术,能使机器人真正能“看到”精彩的三维世界。计算机技术、视觉传感器技术、摄像技术以及立体视觉理论的发展,利用视觉传感器来获取环境图像,并用计算机实现对视觉信息的处理,从而形成立体视觉,逐渐使这一设想变成现实[1-4]。本文采用了目前国内外进行机电一体化系统设计时最常用的虚拟样机技术,基于3D数字化设计平台UG,采用赫尔姆霍茨模型作为参考设计了一种新型的具有三自由度的双目立体视觉运动平台,如图1所示。

二、运动学仿真验证立体视觉运动平台的运动空间范围

运动学仿真的目的是为了验证立体视觉运动平台动力模型建模的合理性,检查运动自由度范围是否达到设计指标中要求的“眼睛”左右偏航运动空间范围(±60o)、“头部”俯仰运动空间范围(±45o)。同时通过运动学仿真,还可以检查视觉运动平台动力模型各个部件的之间有没有产生运动碰撞干涉。本文采用机械系统动力学自动分析软件aDamS对运动平台进行运动仿真分析[5]。

经过运行运动学仿真,可以得知各个自由度的运动空间范围如下:

(一)左偏航极限±60度、右偏航极限±60度、俯仰极限±45度位置,如图2所示

(三)没有发生偏航运动,仰视极限负45度位置,如图4所示

偏航和俯仰运动各个自由度运动范围曲线图如图5,图6,图7所示。从上面各个极限位置、偏航和俯仰运动各个自由度运动空间范围曲线图可以观察到部件之间没有产生运动碰撞干涉现象,各个自由度的运动空间范围达到了设计的要求,从仿真结果也可以看出本运动平台运动空间范围广,验证了本视觉运动平台达到了运动功能的要求,说明本立体视觉运动平台的机械系统结构设计是合理的,这为一般机器人立体视觉运动平台的机械结构设计提供实用的改进和参考依据。

三、驱动电机的输入扭矩分析

要验证选择的驱动电机的输入扭矩是否够,那么要测量俯仰电机和偏航电机的扭矩。在立体视觉运动平台中,电机主要是要克服转动过程中转动头和摄像机等运动部件的负载转矩。运动部件的负载扭矩在aDamS中通过测量扭矩的方式测量出来,如下图8,图9分别是偏航电机和俯仰电机的负载扭矩。

通过图8和图9,可以知道偏航和俯仰电机的负载是时间连续曲线。当偏航或俯仰运动到极限点时,驱动电机要进行变向运行,负载扭矩的方向也发生变化而出现突变拐点,拐点的值便是负载扭矩最大值,可以得知选择的电机的扭矩是足够的。仿真结果对双目立体视觉运动平台的控制系统的性能定性分析提供了一种评价手段。

四、结论

仿真的结果验证了视觉运动平台的俯仰和左右偏航自由度的运动空间范围符合设计要求。根据仿真结果可以看出本运动平台运动空间范围广,验证了本视觉运动平台达到了运动功能的要求,说明本立体视觉运动平台的机械机构设计是合理的,这为一般机器人立体视觉运动平台的机械系统结构设计提供实用的改进和参考依据。

并通过仿真求解出俯仰电机和左右偏航电机的负载扭矩曲线,仿真结果对双目立体视觉运动平台的控制系统的性能定性分析提供了一种评价手段。

参考文献:

[2]贾云得.机器视觉[m].北京:科学出版社,2000,(4):1-10.

计算机立体视觉技术篇6

关键词:虚拟现实,飞行模拟器

虚拟现实(VirtualReality),简称VR,是利用计算机技术生成一个逼真的、具有视、听、触等多种感知的虚拟环境,用户通过使用各种交互设备,同虚拟环境中的实体相互作用,使之产生身临其境感觉的交互式视景仿真和信息交流,是一种先进的人机交互技术。虚拟现实集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、立体显示技术等技术,是一项综合的集成技术。它所具有的沉浸性(immersion)、交互性(interaction)和构想性(imagination),使人们能沉浸其中,形成具有交互功能的多维化的信息环境。

一般来说,一个完整的虚拟现实系统由虚拟环境、以高性能计算机为核心的虚拟环境处理器、以头盔显示器为核心的视觉系统、以语音识别、声音合成与声音定位为核心的听觉系统、以方位跟踪器、数据手套和数据衣为主体的身体方位姿态跟踪设备,以及味觉、嗅觉、触觉与力觉反馈系统等功能单元构成。

在国内外科技场馆中,使用多媒体虚拟现实技术的展品有很多,如汽车模拟驾驶、太空探险等展品。下面笔者将以东莞科技馆信息与高新技术展厅展品“飞行模拟器”为范例,分析其构成和系统原理,并探讨该技术的发展趋势。

一、系统构成

“飞行模拟器”展品是国内科技馆游客最喜欢的互动展品之一。游客可尝试当一名军人,模仿空军作战的紧张场景;也可作为一名飞机控制师,操纵飞机翱翔于蓝天与白云间等。

1.液压运动平台系统

六自由度平台实现刚体在空间六个自由度的运动,即沿X、Y、Z轴的移动及绕X、Y、Z轴的转动。由于刚体在空间的位置最多由六个自由度来描述,因此该平台可模拟刚体在空间的任意运动状态。其液压源经蓄能器同时向六个阀控伺服缸供油,油缸与下台基、上平台之间分别采用球铰连接,六个油缸可在缸长方向作线性移动。平台正是通过六个油缸的协调动作来实现六个自由度运动。平台的位置姿态与油缸的伸缩量间存在位置耦合关系,包括位置逆解和位置正解。其中位置逆解由平台的给定位置姿态各油缸的伸缩量,以便进行平台的六个自由度位置控制,位置正解由各油缸的伸缩量求解平台六自由度位置量,用于平台位置的间接测量。

2.玻璃钢飞机模型

由玻璃钢模型、显示设备、操纵控制杆、仪表盘等组成。 玻璃钢模型由机身、舱盖、机翼、机尾等几大块组成,座舱座位与机身为一体,机翼、机尾单独制作,然后与机身组装。座舱盖可以向一侧翻开,上人之后可盖回。座舱内有两套液晶显示器,每套显示器加装一套红外立体显示设备,由立体眼镜观看。

3.显示系统

机上图像显示采用两台液晶显示器,前座与后座游客各观看一台,每台液晶显示器各加装一套立体眼镜适配器,观众通过红外立体眼镜观看。

二、系统原理

飞行模拟器采用计算机控制方式,其控制原理如下:

首先计算机采集控制台启动按键,当启动按键按下后,开始检测操纵杆信号。当操纵信号启动后,进入飞行过程中,图像播放飞行状态。在飞行过程中,计算机根据图像过程中的运动状态,同时结合检测到的操纵控制信号,控制液压运动平台的运动,使飞机模型产生前后俯仰、左右仰斜、上下升降以及几个状态的联运动作。当操纵杆控制空中格斗时,根据控制信号在图像中加入发射枪炮,以及发射导弹的画面。当飞机返航时,根据检测操纵杆的信号,判定降落机场的成功与失败,此过程可以由计算机设置难易程度。不论降落成功与否,都由计算机控制液压运动平台恢复安全平稳状态,由工作人员推动活动舷梯,来到运动平台跟前,由工作人员揭开座舱盖,游客从舷梯下来离开,准备供下一批游客使用。

三、虚拟现实技术的发展趋势

1.展示效果趋于真实

(1)沉浸感(immension)逐渐完善。画面的质量不断提高,三维效果不断完善,能使操作者有“身临其境”的感觉,就像现实世界一样。让操作人员相信在虚拟境界中人也是确实存在的,而且在操作过程中他可以自始至终地发挥作用,就像真正的客观现实世界一样。

(2)交互性(interactivity)不断增强。操作者与虚拟环境中所遇到的各种对象的相互作用的能力,操作者不再是被动接收信息,用户是交互作用的主体,与虚拟物体可进行多行为的交谈。

计算机立体视觉技术篇7

关键词:计算机视觉;案例推理;图像处理;图像描述

中图分类号:tp391.41文献标识码:a文章编号:1009-3044(2007)04-11102-03

1引言

基于案例推理(case-basereasoning)是人工智能中正不断发展的一项重要推理技术。基于案例推理与类比推理方法相似,案例推理将旧经验或教训转换为知识,出现新问题时,首先查找以前是否有相似的案例,并用相似案例解决新问题。如果没遇到相似案例的,经过推理后解决新问题的方法,又会成为新的案例或新经验,下一次再遇到相同问题时,就可以复用这些案例或经验。

这与人遇到问题时,首先会用经验思考解决问题的方式相似,这也是解决问题较好的方法。基于案例推理应用于工业产品检测或故障诊断时具有以下特点:

CBR智能化程度较高。利用案例中隐含的难以规则化的知识,以辅助规则推理的不足,提高故障诊断系统的智能化程度。

CBR较好解决“知识获取”的瓶颈。CBR知识表示以案例为基础,案例的获取比规则获取要容易,大大简化知识获取的过。

CBR求解效率较高。是对过去的求解结果进行复用,而不是再次从头开始推导,可以提高对新问题的求解效率。

CBR求解的质量较高。CBR以过去求解成功或失败的经历,可以指导当前求解时该怎样走向成功或避开失败。

CBR持续不断的学习能力,使得它可以适应于将来问题的解决。

所以基于案例推理方法正不断应用在产品质量检测和设备故障诊断方面,并取得较好的经济效益。为了产品检测和设备故障诊断中,更为智能化,更容易实现现场检测和诊断,计算机视觉技术起到很大的作用。

计算机视觉是研究用计算机来模拟人和生物的视觉系统功能的技术学科,使计算机具有感知周围视觉世界的能力。通过计算机视觉,进行图像的获取预处理、图像分割与特征抽取、识别与分类、三维信息理解、景物描述、图像解释,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。

计算机视觉随着科学技术发展,特别计算机技术、通信技术、图像采集技术、传感器技术等,以及神经网络理论、模糊数学理论、小波的分析理论等计算机视觉理论的不断发展和日趋成熟,使计算机视觉从上世纪60年代开始兴起发展到现在,取得快速发展,已经从简单图像质量处理发展到围绕着纹理分析、图像编码、图像分割和滤波等研究。图像的分析与处理,也由静止转向运动,由二维转向三维,并主要着眼于对图像的识别和理解上,也使计算机视觉的应用领域更为广泛,为案例推理中运用计算机视觉打下基础。

2案例推理系统的主要关键技术

(1)案例的表示与组织

案例的表示与组织即是如何抽取案例的特征变量,并以一定的结构在计算机中组织存储。如何将信息抽取出特征变量,选择什么语言描述案例和选择什么内容存放在案例中,案例按什么组织结构存放在存储器中,这关系到基于案例推理方法的效率,而且对于案例数量越来越多,结构十分复杂的案例库,尤其重要。

(2)案例的索引与检索

案例的索引与检索即是为了查找最佳相似案例,如何建立案例索引和相似度算法,利用检索信息从案例库中检索并选择潜在可用相似案例。后面的工作能否发挥出应有的作用,很大程度上依赖于这一阶段得到的案例质量的高低,因此这一步非常关键。

(3)案例的复用和调整

案例的复用即是如何根据旧案例得出新解,涉及到找出案例与新问题之间的不同之处,案例中的哪些部分可以用于新问题,哪些部分不适合应用于新问题的解决。而复用还分案例的结果复用,案例的求解方法复用。

(4)案例的学习

案例的学习即是将新解添加到案例库中,扩充案例库的案例种类与数量,这过程也是知识获取。此过程涉及选取哪些信息保留,以及如何把新案例有机集成到案例库中,包括如何存储,如何建立索引等等。

针对案例推理的关键技术,根据检测和故障诊断系统的特点,计算机视觉主要解决如何将产品图像输入系统,如何将产品图像特征进行抽取和描述,如何区别产品不同之处。以便案例推理系统进行案例建模,确立案例的表示形成和案例相似度的计算。本文主要从计算机视觉如何运用在案例推理系统进行探讨。

3产品输入系统

产品输入系统在不同产品类型和生产环境可能有不同之处,主要应有传感器单元和图像采集单元。如图1。

图1产品输入系统结构

传感器单元主要判断是否有产品存在,是否需要进行图像采集,是否继续下一个产品图像的采集。这简单传感器可使用光电开关,配合光源,当产品经过时,产品遮挡住光源,使光电开关产生一个0值,而没有产品经过时,光电开关产生相反的1值,系统通过判断光电开关的值,从而判断是否有产品。

图像采集单元简单地说是将产品拍摄并形成数字化图像,主要包括光源、反射镜、CCD相机和图像采集卡等组成。光源和反射镜作用主要使图像中的物体和背景之间有较大灰度。CCD相机主要是拍摄设备。图像采集卡主要是将图像数字化。通过传感器判断有产品后,光源发出的光均匀地照在被测件上,CCD相机拍摄,拍摄图像经过图像采集卡数字化后输入存储设备。存储设备即为计算机硬盘。存放原始图像、数据、处理结果等。

这是案例推理系统的原始数据,是图像处理、图像特征抽取描述的基础。

4图像处理

在案例推理系统中,需要对案例的组织和案例建模,案例的组织即案例的表示,相对计算机而言,即图像特征的抽取,即某图像具有与其它图像不同之处,用于区别其它图像,具有唯一性。同时,又能完整地表示该图像。所以案例的表示要体现案例的完整性、唯一性、操作容易性。

图像中有颜色区别、又有物体大小之分以及图像由不同的物体组成。如何表示图像,或说图像内部包含表示的本质,即图像的描述。根据图像特点,确立图像案例的表示,以图像的像素、图像的数字化外观、图像物体的数字组成等属性。这需要对产品输入的原始图像进行处理。

在计算机视觉技术中,对原始图像主要进行图像增强、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。具体工作流程如图2所示:

图2计算机视觉的任务与工作流程

图像预处理是将产品的数字图像输入计算机后,首先要进行图像的预处理,主要完成对图像噪声的消除以及零件的边缘提取。预处理的步骤为:图像二值化处理;图像的平滑处理;图像的边缘提取。

图像二值化处理主将灰度图形二值化的关键是阈值的选取,由于物体与背景有明显的灰度差,可以选取根据灰度直方图中两峰之间的谷值作为阈值来分割目标和背景。

图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息。

图像边缘提取是为了将图像中有意义的对象与其背景分开,并使之具有某种指定的数学或符号表达形式,使计算机能够理解对象的具体含义,检测出边缘的图像就可以进行特征提取和形状分析了。可采用多种算法,如采用Sobel算子提取边缘。

图像预处理是为下一步的特征描述打基础,预处理的好坏直接影响案例推理的结果和检测诊断的效率。

特征提取是对图像进行描述,是案例建模关键,案例建模是根据案例组织要求抽取图像特征,是建立案例索引和检索的关键。如果图像没有特征,就谈不上进行检索。图像特征可通过图像边界、图像分割、图像的纹理等方法,确定图像特征,包括是什么产品、产品形状大小、产品颜色,产品有什么缺陷、产品缺陷在什么位置等特征,根据这些图像特征进行描述,形成计算机中属性值,并从数据库查找相应信息资料,从而确定产品之间的关系,相似度,也就是案例推理的方向。

5系统的检索

根据案例推理原理和相应算法,建立案例推理系统模型,如图3所示。

图3案例推理系统

对话系统:完成人机交互、问题描述、结果显示和系统总控制。

案例库系统:由案例库及案例库管理系统组成。

数据析取系统:对各种已有的源数据库的数据通过转换而形成所需的数据。

多库协同器:根据问题求解的需要,按照一定的数据抽取策略,完成问题求解过程中对模型库系统、方法库系统、知识库系统和数据库系统等资源的调度与协调。

知识库系统:由产生式规则组成,这些知识包括专家经验和以规则形式表示的有关知识,也可以是数据挖掘结论,支持案例检索、案例分析、案例调整等。模型库系统:由模型库、算法库、模型库管理系统组成。完成模型识别和调用,并把结果综合,送入对话系统显示,作为补充信息供案例检索、调整使用。

数据库系统:存放待决策支持的所有问题,并完成其维护与查询等功能。

由于系统主要应用产品的现场实时检测监控或故障诊断,所以系统的检索时,也必须输入检索值,即输入现场产品的图像,在通过产品预处理、图像的二值化、分割和边界处理后,进行图像特征描述,根据图像描述进行分类识别。根据案例推理的算法检索案例库中,是否有相似的案例。即确定相似度。相似度确定主要由案例推理的算法确定,如贴近分析法。确定相似度最大作为结果,并将案例的解输出,给相关控制系统进行决策。如产品质量检测,确定产品质量是否合格,是否有不合格产品,不合格产品是什么原因造成,故障源是什么,如何解决和排除故障,等等。

6结论

案例推理方法有效地解决计算机视觉技术中图像检索问题。对提高图像检索的效率和准确度提供了平台。

计算机视觉技术也为案例推理系统实现产品现场实时检测、监控、诊断提供技术支持。计算机视觉技术现场的数据采集、处理为案例推理打好基础。

两者的结合设计的系统适用范围很广,只要产品需要进行质量检测、监控,或设备需要进行故障诊断和维护,都可以适用。

系统提供的实时检测、监控和诊断功能,提高企业的生产效益,降低了生产成本。

参考文献:

[1](美)桑肯(Sonka,m).图像处理分析与机器视觉[m].人民邮电出版社.

[2]王宏等译.计算机视觉[m].电子工业出版社.

[3]蔡建荣.自然场景下成熟水果的计算机视觉识别[J].农业机械,36(2):61-64.

[4]王宇辉.基于计算机视觉的锥体零件尺寸在线检测算法[J].重型机械,2005,2:4-6

[5]骆志坚.基于计算机视觉检测技术自动计数系统的研究与应用[J].仪表技术与传感器,2005,3:41-43.

[6]左小德.贴近度分析法在案例库推理中的应用[J],南大学学报(自然科学版),1997,18(1):21-26.

[7]姜丽红.案例推理在智能化预测支持系统中的应用研究[J].决策与决策支持系统,1996,6(4):63-69.

计算机立体视觉技术篇8

   关键词:双目立体视觉计算机视觉立体匹配摄像机标定特征提取

   双目立体视觉是计算机视觉的一个重要分支,即由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,通过计算空间点在两幅国像中的视差,获得该点的三维坐标值。80年代美国麻省理工学院人工智能实验室的marr提出了一种视觉计算理论并应用在双睛匹配上,使两张有视差的平面图产生在深度的立体图形,奠定了双目立体视觉发展理论基础。相比其他类的体视方法,如透镜板三维成像、投影式三维显示、全息照相术等,双目本视直接模拟人类双眼处理景物的方式,可靠简便,在许多领域均极具应用价值,如微操作系统的位姿检测与控制、机器人导航与航测、三维测量学及虚拟现实等。

   1双目体视的技术特点

   双目标视技术的实现可分为以下步骤:图像获取、摄像机标定、特征提取、图像匹配和三维重建,下面依次介绍各个步骤的实现方法和技术特点。

   1.1图像获取

   双目体视的图像获取是由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,获取立体图像对。其针孔模型如图1。假定摄像机C1与C2的角距和内部参数都相等,两摄像机的光轴互相平行,二维成像平面X1o1Y1和X2o2Y2重合,p1与p2分别是空间点p在C1与C2上的成像点。但一般情况下,针孔模型两个摄像机的内部参数不可能完成相同,摄像机安装时无法看到光轴和成像平面,故实际中难以应用。

   上海交大在理论上对会摄式双目体视系统的测量精度与系统结构参数之间的关系作了详尽分析,并通过试验指出,对某一特定点进行三角测量。该点测量误差与两CCD光轴夹角是一复杂的函数关系;若两摄像头光轴夹角一定,则被测坐标与摄像头坐标系之间距离越大,测量得到点距离的误差就越大。在满足测量范围的前提下,应选择两CCD之间夹角在50℃~80℃之间。

   1.2摄像机的标定

   对双目体视而言,CCD摄像机、数码相机是利用计算机技术对物理世界进行重建前的基本测量工具,对它们的标定是实现立体视觉基本而又关键的一步。通常先采用单摄像机的标定方法,分别得到两个摄像机的内、外参数;再通过同一世界坐标中的一组定标点来建立两个摄像机之间的位置关系。目前常用的单摄像机标定方法主要有:

   (1)摄影测量学的传统设备标定法。利用至少17个参数描述摄像机与三维物体空间的结束关系,计算量非常大。

   (2)直接线性变换性。涉及的参数少、便于计算。

   (3)透视变换短阵法。从透视变换的角度来建立摄像机的成像模型,无需初始值,可进行实时计算。

   (4)相机标定的两步法。首先采用透视短阵变换的方法求解线性系统的摄像机参数,再以求得的参数为初始值,考虑畸变因素,利用最优化方法求得非线性解,标定精度较高。

   (5)双平面标定法。

   在双摄像机标定中,需要精确的外部参数。由于结构配置很难准确,两个摄像机的距离和视角受到限制,一般都需要至少6个以上(建议取10个以上)的已知世界坐标点,才能得到比较满意的参数矩阵,所以实际测量过程不但复杂,而且效果并不一定理想,大大地限制了其应用范围。此外双摄像机标定还需考虑镜头的非线性校正、测量范围和精度的问题,目前户外的应用还有少。

   上海大学通信与信息工程学院提出了基于神经网络的双目立体视觉摄像机标定方法。首先对摄像机进行线性标定,然后通过网络训练建立起三维空间点位置补偿的多层前馈神经网络模型。此方法对双目立体视觉摄像机的标定具有较好的通用性,但是精确测量控制点的世界坐标和图像坐标是一项严格的工作。因此神经网络中训练样本集的获得非常困难。

   1.3特征点提取

   立体像对中需要撮的特征点应满足以下要求:与传感器类型及抽取特征所用技术等相适应;具有足够的鲁棒性和一致性。需要说明的是:在进行特征点像的坐标提取前,需对获取的图像进行预处理。因为在图像获取过程中,存在一系列的噪声源,通过此处理可显着改进图像质量,使图像中特征点更加突出。

   1.4立体匹配

   立体匹配是双目体视中最关系、困难的一步。与普通的图像配准不同,立体像对之间的差异是由摄像时观察点的不同引起的,而不是由其它如景物本身的变化、运动所引起的。根据匹配基元的不同,立体匹配可分为区域匹配、特征匹配和相位匹配三大类。

   区域匹配算法的实质是利用局部窗口之间灰度信息的相关程度,它在变化平缓且细节丰富的地方可以达到较高的精度。但该算法的匹配窗大小难以选择,通常借助于窗口形状技术来改善视差不连续处的匹配;其次是计算量大、速度慢,采取由粗至精分级匹配策略能大大减少搜索空间的大小,与匹配窗大小无关的互相关运算能显着提高运算速度。

   特片匹配不直接依赖于灰度,具有较强的抗干扰性,计算量小,速度快。但也同样存一些不足:特征在图像中的稀疏性决定特征匹配只能得到稀疏的视差场;特征的撮和定位过程直接影响匹配结果的精确度。改善办法是将特征匹配的鲁棒性和区域匹配的致密性充分结合,利用对高频噪声不敏感的模型来提取和定位特征。

   相位匹配是近二十年才发展起来的一类匹配算法。相位作为匹配基元,本身反映信号的结构信息,对图像的高频噪声有很好的抑制作用,适于并行处理,能获得亚像素级精度的致密视差。但存在相位奇点和相位卷绕的问题,需加入自适应滤波器解决。

计算机立体视觉技术篇9

关键词:视觉 艺术网络 虚拟现实

艺术活动反应时代的现象,且在各种意义上,艺术与时代革新或改造的根本精神,有着密切的关系。在艺术创作的过程中,感情的自发形成占了大部分,但在有些状态下理性的计划性成分亦占有相当的比例,尤其在新媒体、新美学观念、新素材及新的科学技术高度发展的今天,以理性为诉求的创作灵感,已占有绝对的重要性及审美价值。

科技的革新,从计算机、网络到虚拟现实,在艺术创作上产生极大的变化,具有实验精神的先驱艺术家们热衷于新媒体与材料与新艺术形式的探求,从十九世纪末到今天,其中发生了难以计数的艺术运动,一部新媒体艺术史,几乎就是一部近代科技史,而我们仍然活在其中,变化日新月异,很难去归纳风格,或下任何定论。到目前为止,网络艺术、包括虚拟实境的交互式装置,似乎是互动艺术的主流。科学的发明与发现,大量地运用在改善人类生活上,不过是近五十年的事,却带给人类前所未有的便捷与刺激。改变的不仅是物质的层面,在精神上的意义也相当深远。

尤其是60年代末70年代初,当电子媒体与计算机科技开始普及之时,媒体深深影响我们对世界的认知,人们视野变宽了,世界变小了。当时,艺术、科技与科学间的关系常受争议。艺术与科技运动吸引许多艺术家、科学家、工程师以及业者参与,意图发展出跨领域的合作架构,然而时至今日,这种系统化的合作模式,仍然只是一个理想。因为科技、艺术都是文化有机整体的一部分,原本就不容分割。

运用科技的视觉艺术,一个明显的议题便是科技带来的艺术品复制性与真实性的问题,一切展演都只是以复制品呈现,要观赏者破除原有的观赏习惯,在传统上的艺术价值包含了独创性、唯一性、与真实性,都将被重新思考。

数字化科技成熟后,讲求光与速度,去物质化的虚拟影像透过媒体四处传播,复制已经不再是模仿、替代真实或是真实的幻觉,数字世界已然成为另外一种真实。因为影像可被转换为数字语言,可被任意操弄,因而影像成为一种信息,于是艺术行为也大大不同于前,艺术家在庞杂的影像信息中,选择、过滤、重新组装,不只是利用技术来解决视觉问题,开发新的视觉经验,更利用新媒体去呈现人们生活中的种种困境,作品意义的产生存在于事件的脉络还有与观赏者的互动中。观赏者从最早的被

动接受,到目前已然成为参与者,甚而是展演内容的提供者。以往视觉艺术的形式,可大分为平面的绘画与立体的雕刻,而影像的领域今后将与前述二者并列为视觉艺术的重要形式之一。未来随着计算机图像处理,多媒体、高画质等新媒体技术的高度发展,传统的录像技术也将面临新的整合。

十九世纪八十年代以后高科技产品发展迅速,计算机、雷射光线、传真机、复印机、卫星传播等。这些尖端科学技术,都成为创造想象和架构的创作工具,这些新的媒介能仿真真实世界,也能创造出幻想境界中的奇景。高科技艺术是十九世纪八十年代以后,兴起于美国的新艺术。它是泛指以运用高科技创造的现代美术作品,诸如计算机艺术、雷射光艺术等作品,在美学领域中带来明显意义,结合了人类智能和科技产生的大量新颖技巧。潜藏在这种深具潜力的新视觉技巧下,有一个更深入的意义:在高科技的辅助下,视野更加瞭阔,并为艺术创作,提供了新的美学向度,跳跃连结代替线性思考,多向度空间取代绘画透视,前所未有互动性功能。

尤其是,自从计算机出现以后,因为可以储存、修改,容易重新绘制及复制,所有有关绘画的行为起了很大的改变。1952年美国的BenF.Laposky利用计算机做出一个抽象的图像,1956年才开始能创作出彩色的电子影像,1960年德国K.alsleben及w.Fetter发表最早的计算机绘图作品,直至1994年网际网络开始盛行,四、五十年间,人们对于空间的思考模式随之改变,我们离开了复杂而趋向一个快速沟通、大纲式了解的理想。我们不再需要画一堆很复杂辅助线去处理放置一个三维物体于二维平面上的问题,计算机影像帮我们解决了这些问题。因此,艺术家已把兴趣放在如何避免复杂的建构,因为人们想象的空间已经改变,波浪的、拥挤的西方绘画已被纯粹的、无限空间的现代绘画所取代。

计算机对现代艺术造成的冲击及影响之巨,超乎想象。计算机一般被认为是一个空间可视化的简单辅助工具,但它不只是一件工具,一种媒体和材料,更重要的是一种新的美学方向,新的再现可能。多数计算机艺术的创作者,深信虽然计算机本来不是为艺术创作的理由而发明,但它会持续发展出特有的本质,继续为艺术家提供最好的工作伙伴。

通常,计算机比传统铅笔的方式更简单、便宜、快速地生产,计算机让艺术家与音乐创作者更快速的生产,这也就是我为什们称之为“罐头艺术”的原因,然后,计算机也可提供一种艺术替代品更快速的方法,这也是我为什么称其为“麦当劳艺术”。当然,计算机艺术有它的隐忧。虽然计算机为艺术带来发展的新契机,却也有不少令人不安的地方。

第一:由于计算机也是科技的产物,自然有现代和传统的冲突,如何把过去的传统艺术,配合新的计算机媒材,加以融合表现出来,呈现附合时代的新风貌而被接受,是值的深思的问题。因为全世界都是用相同的软件和设备,如果一窝蜂的跟着主流,则艺术创作则会划地自限,而显露大量复制和类似的肤浅平面感,失去艺术的美感和深度。第二:如同前面提到的,工具的方便,却造成个人风格的丧失,并且

失去敏锐度,因为一旦创作者习于依赖计算机的修改功能,创作的动力则渐渐退去,例如:惯用pHotoSHop的摄影者很可能因此,不在意拍照的决定性时刻,因为可以透过计算机仿真修改,不怕拍不好,但即使效果逼真,却失去艺术价值了。

计算机立体视觉技术篇10

关键词:计算机视觉;地图匹配;SLam;机器人导航;路径规划

1概述

计算机视觉在人工智能学科占据重要地位,为自主移动机器人视觉导航做了深厚的理论铺垫。目前,机器人导航技术有很多种,传感器导航技术如里程计、激光雷达、超声波、红外线、微波雷达、陀螺仪、指南针、速度、加速度计或触觉等得到了普遍应用,与上述非计算机视觉导航技术相比较,计算机视觉导航技术如人眼般具有灵敏度高且可捕获的信息量大以及成本低等优点。由于室内相对室外空间比较狭小且内部环境复杂,所以普通移动机器人在作业过程中,完成躲避眼前障碍物、自主导航以及为自身找出一条可行路径等一系列操作会相对比较困难。计算机视觉导航技术可利用本身的摄像头获得室内周围的环境信息,实时对其周身的场景进行快速反馈,对视野前方障碍物进行快速识别和检测,从而确定一条高效的可行的安全路径。本文对计算机视觉导航技术进行分类研究,主要分为3类:第一类是环境地图事先已知,提前对外界环境特征进行提取和处理,建立全局地图,并将地图信息存储在机器人内存数据库中,在导航的时候实时进行地图匹配;第二类是同时定位与地图构建,移动机器人在自身位置不确定的情况下根据自身的摄像头获取周围未知环境信息,在作业时逐步构建周围的环境地图,根据构建的增量式地图自主实时定位和导航;第三类是不依赖环境地图,自主移动机器人不需要依赖任何的环境地图,其在作业活动时的可行区域主要取决于摄像头实时识别和检测的环境相对信息。

2环境地图的表示方法

目前,计算机视觉导航技术多采用栅格地图、几何地图、拓扑地图和混合地图构建环境地图信息。

2.1栅格地图

栅格地图,将栅格图像考虑为一矩形,均分为一系列栅格单元,将每个栅格单元赋予一个平均概率值,并利用传感信息估计每个单元内部内存障碍物的概率。构建栅格地图的优点是其地图表达形式直观,创建和维护比较容易;但当划分的栅格单元数量不断增多时,实时性就会慢慢变差;当划分的栅格单元越大时,环境地图的分辨率越低。

2.2几何地图

几何地图利用几何特征如点、直线、平面等来构成环境主要框架,需要知道这些特征在环境中信息的具置,所以几何地图通常使用其对应的三维空间坐标来表示。几何地图构建过程相对简单,保留了室内环境的各种重要信息,是基于计算机视觉的定位与地图构建算法中最常用的一种表示方式。但是为了完成环境的建模需要标记大量的特征,从而计算量也非常的大,降低了实时性,其重建的地图也容易出现与全局不一致的情况。

2.3拓扑地图

拓扑地图用许多节点和连接这些节点的曲线来表示环境信息。其中,每个节点相对应真实环境中的特征点(如门角、窗户、椅子、桌子角及拐角等),而节点之间的曲线表示两个节点对应的地点是相联通的。拓扑地图把环境信息表上在一线图上,不需要精确表示不同节点间的地理位置关系,图像较为抽象,表示起来方便且简单。机器人首先识别这些节点进而根据识别的节点选择节点与节点间的曲线作为可作业的路径。

2.4混合地图

混合地图主要包括3种形式:栅格一几何地图、几何一拓扑地图以及栅格一拓扑地图。混合地图采用多种地图表示,可结合多种地图的优势,与单一的地图表示相比更具有灵活性、准确性和鲁棒性,但其不同类别的地图结合起来管理会比较复杂,难以协调,增加了地图构建的难度。文献针对室内环境所建立的模型分为全局拓扑和局部几何表述部分,整体环境通过拓扑节点串连起来,维护了整体环境表述的全局一致性;而以每个拓扑节点为核心所采用的几何表述则可确保局部精确定位的实现,这样建立的几何一拓扑混合环境模型可将二者的优势都表现出来,使得移动机器人定位和地图构建同时进行,实现容易。

3基于计算机视觉的室内导航

基于计算机视觉的室内导航技术可利用摄像头捕获机器人周围环境的全部信息,对其周身的场景进行反馈,对障碍物进行快速识别和检测,从而确定一条高效的可行的安全路径。本文将计算机视觉室内导航技术主要分为3类:第一类是环境地图事先已知;第二类是定位与地图构建同时进行;第三类是不依赖环境地图。

3.1环境地图事先已知

提前对外界环境特征进行提取和处理,建立全局地图,并将地图信息存储在机器人内存数据库中,在导航的时候实时进行地图匹配,即预存环境地图。在环境地图事先已知的导航中,路标信息保存在计算机内存的数据库中,视觉系统中心利用图像特征直接或间接向移动机器人提供一系列路标信息,一旦路标被确定后,通过匹配观察到的图像和所期望图像,机器人借助地图实现自身精确定位和导航。该导航技术过程可分为以下步骤:

a)图像获取:摄像头获取其周围的视频图像;

b)路标识别及检测:利用相关图像处理算法对图像进行一系列预处理如进行边缘检测和提取、平滑、滤波、区域分割;

c)路标匹配标志:在观察到的图像和所期望图像之间进行匹配,搜索现有的路标数据库进行标志路标;

d)位置计算:当有特征点进行匹配时,视觉系统会根据数据库中的路标位置进行自身精确定位和导航。

在基于计算机视觉的地图匹配定位过程中,主要有2种地图匹配较为典型。

①已知起点,已知地图。这种条件下的定位称为局部定位,采用的是一种相对定位的方法,如图1所示为其位姿估计过程,这种情况目前导航技术研究得最多。

②不知起点,已知地图。这种条件下的定位称为全局定位。当机器人需要重置时,通常使用这种定位方法来检索机器人的当前位置(即姿态初始化)。常用的辅助方法是在环境中添加一些人造信标,如无线收发器,几何信标,条码技术,红外或超声波接收系统进行位置识别,利用视觉系统识别自然标志,自主定位。

3.2定位与地图构建同时进行

不知起点,不知地图。SLam技术最早由Smith等人于1986年提出,移动机器人在自身位置不确定的情况下根据自身的摄像头获取周围未知环境信息,在作业时逐步构建周围的环境地图,根据构建的增量式地图自主实时定位和导航。在日后的导航研究中,混合地图中的几何一拓扑混合环境模型被得到广泛应用,主要用来解决SLam问题。

2003年,在解决SLam技术难题上,arras等人采用基于Kalman滤波器和最邻近(nearestneighbor)匹配策略的随机地图创建方法。下面是该算法步骤:

a)数据采集:首先初始化系统,从摄像头传感器采集距离数据;

b)状态预测:视觉系统预测机器人运动状态,实时返回新位姿信息和协方差矩阵,预测地图;

c)观测:从原始捕获的信息中提取主要特征信息并将此信息返回给局部地图;

d)测量预测:预测机器人当前位姿的全局地图;

e)位置匹配:应用最邻近滤波器匹配局部地图中的观测点和预测点;

f)估计:使用扩展Kalman滤波器更新地图;

g)创建:将非相关的观测点加入地图,对机器人返回增量式地图;

h)输出地图。

制约机器人视觉系统性能的重要因素是信息实时处理的计算复杂度和处理效率,SLam算法需要在地图密度与计算效率之间取得权衡。

3.3无环境地图

在这类系统中,机器人不需要依赖任何的环境地图信息,机器人的活动取决于其当时识别和提取出来的环境信息,这些环境信息可能是桌子、椅子和门等,不需要知道这些环境元素的绝对位置。无环境地图的导航技术典型的技术有3大类:基于光流的导航技术、基于外观信息的导航技术、基于目标识别的导航技术和基于目标跟踪的导航技术。

3.3.1基于光流的导航技术

光流是三维空间运动物体在观测成像面上的像素运动的瞬时速度,也是图像亮度的运动信息描述。光流法计算最初是由Horn和Schunck于1981年提出的,其利用二维速度场与灰度,引入光流约束方程,得到光流计算的基本算法。光流计算基于物体移动的光学特性提出了2个假设:①运动物体的灰度在很短的间隔时间内保持不变;②给定邻域内的速度向量场变化是缓慢的。如Santos-Victor等人研发了一种基于光流的robee视觉系统,该系统模拟了蜜蜂的视觉行为。在robee视觉系统中,使用单独的双目视觉方法来模拟蜜蜂的中心反射(CenteringReflex):当机器人移动到走廊两侧的墙壁中心时,左眼捕获场景的瞬时速度与右眼捕获场景的瞬时速度是相同的,几乎没有差别,那么机器人就可以知道他们在走廊的中心。如果眼睛两侧的眼睛的瞬时变化速度不同,则机器人移动到较慢的速度。在自动机器人导航的实现中,基于这个想法是测量摄像机捕获图像场景瞬时速度差异。这种导航技术只能用于室内单通道直走道导航,不能引导机器人改变方向,具有一定的局限性。

3.3.2基于外观信息的导航技术

基于外观的机器人导航方法,不需要构建真实的地图导航,机器人通过自身所携带的摄像头和传感器感知周围目标的外观信息进行自主定位和导航。其中,所述的外观信息多为目标信息的颜色、亮度、形状、空间大小和物理纹路等。机器人在导航时存储连续视频帧的环境图像信息,并将连续视频帧与控制指令相关联,从而再执行指令规划有效路径到达目的地。

3.3.3基于目标识别导航技术

为了达到目标点或是识别目标,机器人很多时候只能获取少量的图像信息。Kim等人提出了一种用符号代替导航各个位置的赋值方法。该赋值方法中,机器人执行命令如“去窗边”“去你后面的椅子旁”等。这样,通过相关的符号命令,机器人自动识别并建立路标,通过符号指令到达目标点。例如“去你后面的椅子旁”,这样的命令就是告诉机器人路标是椅子、路径向后。该导航技术的难点在于目标是否可以准确实时识别路标。第一,识别大量不同类别的物体,室内环境有许多不同类别的物体,需要将它们组织到一个在给定的容易搜索图像数据结构中去,起到容易识别是用什么度量来区分物体;第二,识别大量不同背景下的物体,一个合适的物体表达式有助于将图像组织成片断,而这些片断来自于物体的种类且与物体无关的;第三,在抽象层次上识别物体,机器人可以不需要在看到一个具体的杯子之前便能知道它是一个杯子,相关程序能够类似的物体进行识别和区分。

3.3.4基于目标跟踪的导航技术

基于目标跟踪的导航技术,为机器人构造一个虚拟地图,机器人通过摄像头获取连续的视频序定一个跟踪的目标,为了达到对目标的精确定位和实时跟踪,可以利用粒子滤波算法对需要跟踪的目标进行建模。基于粒子滤波的目标跟踪主要包含四个阶段,分别是初始化目标区域,概率转移,目标区域权重计算,目标区域重采样。在机器人导航之前,通过视频序列的当前几帧标注机器人所需要跟踪的目标,在导航时,机器人通过连续的视频帧感知周围的待跟踪目标,同时对所需要跟踪的目标散播粒子,当获取的视频帧对目标区域重采样后足以让机器人确定所需要跟踪的目标时,机器人通过确定的目标为自己规划最有效的路径到达目的地。获取视频序列目标跟踪是算机视觉领域中的重要分支,它在工业生产、交通导航、国防建设、航空导航等各个领域有着广泛的应用。