计算机视觉前沿方向十篇

发布时间:2024-04-26 03:06:34

计算机视觉前沿方向篇1

关键词计算机网络前沿技术技术分析

中图分类号:tp39113文献标识码:a

1现代计算机网络的前沿技术分析

1.1GiS与“数字地球”

GiS简称地理信息系统,地理信息系统通常泛指用于获取、储存、查询、综合、处理、分析和显示地理空间数据及其相关信息的计算机系统。随着人造卫星的出现和计算机的普及,地理信息系统在人们的生产和生活中扮演着更加重要的角色。以往的传统模拟地图仍然存在局限性,比如信息滞后、储存受限、传输方式单一和模拟能力有限等问题。而地理信息系统脱胎于地图,它与地图一样,也具有载负和传输地理信息的功能。同时它还具备了以下特点,(1)提高了空间信息的几何精度;(2)扩大空间信息储蓄量;(3)便于空间信息的转换和传输;(4)扩大地图制图功能;(5)便于精确、快速计算;(6)便于地图自动分析。GiS正在快速发展起来,但是它仍面临着地图学的挑战。随着信息科学的不断发展,GiS也对地图学提出了不少挑战并且推动地图学的发展。

数字地球是一种利用巨大地球空间数据对人类赖以生存的地球所做的三维、多级、多分辨率的数字化整体表达,它同时也为人类提供一个网络化的界面体系和超媒体的现实虚拟环境。数字地球概念的提出,是空间技术、信息技术及其应用技术发展到一定的产物。要在电子计算机上实现数字地球不是一件简单的事,它需要诸多学科的支持,特别是信息科学技术。数字地球被应用在多个方面,比如精细农业、智能交通、Cybercity、专家服务和现代大战等方面。数字地球的提出是全球信息化的必然产物,它是一项长期的战略目标,需要经过全人类的共同努力才能实现。同时,数字地球的建设与发展将加快全球信息化的步伐,在很大程度上改变人们的生活方式,并创造出巨大的社会财富,为人类社会的发展作出巨大贡献。

1.2虚拟现实技术

虚拟现实是利用电脑模拟产生一个三维空间的虚拟世界,提供体验者听觉、视觉,触觉等方面的感受,让其觉得身临其境一般。虚拟现实是多种技术的结合,包括实时三维计算机图形技术、广角立体显示技术、对观察者各种触觉,感觉网络输出输入技术。虚拟现实技术的应用比较广泛。在医学方面,虚拟环境中,可以建立虚拟的人体模型,便于学生了解人体的各个器官结构,而且能让学生进行虚拟手术,便于学生的学习;在娱乐方面,丰富的感官享受和3D显示环境成为理想的视频游戏工具,令玩家能感觉身临其境,更加富有真实感;同时,虚拟现实技术在艺术领域具有的潜在应用能力也是不可估量的,它可以使观赏者更加了解艺术家的思想艺术;在军事航天方面,模拟训练一直是军事方面的重要课题,虚拟现实技术的应用可以让士兵们进行模拟军事演练,提高他们的战斗能力及应变能力。在其他方面,虚拟现实技术也得到广泛应用,比如还有室内设计、工业制造等等。虚拟现实技术的发展仍然存在着阻碍,比如没有真正进入虚拟现实世界的方法,如何输入的困扰,缺乏统一的标准和容易让人感到疲劳。

1.3网络技术云计算和下一代网

云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。云计算的特点是超大规模化、虚拟化、高可靠性、通用性、高可扩展性、便宜等等。云计算在现代社会得到广泛应用。同时,云计算是商业模式的创新,云计算通过互联网提供软件与服务,并有网络浏览器界面完成。云计算有三类典型的服务模式,分别是“软件即服务”,“平台即服务”和“基础设施即服务”。通过云计算衍生出来的技术还有云储存、云游戏等等。21世纪10年代,云计算作为一个新的技术趋势已经得到了快速的发展。云计算带来一个前所未有的工作方式,也改变了传统软件工程企业。

1.4智能信息处理技术

智能信息技术是近年发展起来的,它通过结合计算机技术、通信技术、电子技术及控制技术实现信息的采集、处理以及显示的自动化。随着经济的发展,网络的普遍普及,智能信息处理技术将得到更加广泛的应用。智能信息处理技术可分为智能数据采集、智能信息处理和智能数据显示三部分。它具有智能,准确,高效三个特点。它被广泛应用于语音处理、音像处理等数据处理。在这个信息化的时代,信息作为记载我们人类生活数据的载体,智能信息处理技术将会得到更大的重视。

2结语

随着信息化时代的到来,我国的现代计算机网络的前沿技术发展速度明显增快,现代计算机前沿技术的发展关系着我们的日常生活、国家的文化发展水平,世界的先进程度等等。所以我国新一代也要致力于现代计算机行业的研究,探索出更加先进的网络技术,帮助我们解决生活中的问题,为世界网络文明发展做出贡献。

参考文献

计算机视觉前沿方向篇2

关键词:无人机;捷联惯性导航系统;计算机视觉;组合导航;卡尔曼滤波

Doi:10.16640/ki.37-1222/t.2016.22.256

0引言

随着无人机技术的发展,导航系统的种类也越来越多,通常有惯性导航系统、卫星导航系统、多普勒导航系统和地形辅助导航系统等[1]。然而,单一的导航装置已难以满足当前实际应用中的飞行要求,多种形式的组合导航方案随之产生,组合方案的采用使各导航系统之间取长补短,利用组合系统提供的冗余信息可以有效提高系统的导航精度和可靠性[2]。本文针对GpS/SinS组合导航系统中GpS信号易受干扰、易丢失等缺点,提出了SinS/GpS/视觉组合导航方案,提高了系统的可靠性和导航精度,具有一定的工程实际意义。

1SinS/GpS/视觉组合导航系统方案

捷联惯导系统SinS为主导航系统,全球定位系统GpS和计算机视觉系统则作为导航辅助子系统。SinS采用姿态解算算法将memS传感器输出数据解算为需要的导航参数,GpS接收机获取的信号经由计算机转换为用户所需的机置和速度参数,而视觉系统则根据连续时刻的图像信息估计机体的姿态参数[2]。利用SinS系统误差模型、GpS量测误差模型及视觉量测误差模型构成扩展卡尔曼滤波器,两个子滤波器给出局部最优估计,再依据信息融合技术将局部估计有机合成,从而得到捷联惯导系统状态的全局最优估计。SinS/GpS/视觉组合导航结构如图1所示。

2SinS/GpS/视觉组合导航系统状态方程的建立

本系统采用的组合方式为SinS分别与GpS和视觉系统构成子组合,且都采用输出校正,因而可采用同一组状态方程。

2.1SinS姿态误差方程

理论上,SinS姿态矩阵满足微分方程

(1)

其中,表示由向量构成的反对称矩阵,且有。

而在实际中需要考虑陀螺仪的测量误差和计算误差,根据相似变换法则及反对称矩阵与向量之间的关系,可得SinS姿态误差方程为

(2)

为了使模型适用于特定的场合且便于分析,在可接受范围内认为(2)式中陀螺测量误差主要指陀螺随机常值漂移,因而可简化为

(3)

2SinS速度误差方程

理想情况下,SinS速度微分方程为:

(4)

实际系统中,基于误差的SinS速度微分方程为:

(5)

其中,,为速度计算误差;

;;;,在此只考虑主要误差源,而加速度计测量误差主要包含加速度计随机常值偏置,则有;

将式(5)与式(4)相减,忽略的影响,并略去二阶小量,可得速度误差方程:

(6)

2.3SinS位置误差方程

机体的纬度、经度变化分别是由北向速度分量和东向速度分量引起的,而高度信息则与地向速度有关[3]。由此确定的位置方程为:

(7)

由式(7)可得位置误差方程如下:

(8)

(9)

(10)

将(3)、(6)、(8)~(10)式联立即可得到SinS误差模型,即组合导航系统的状态方程。

3SinS/GpS/视觉组合导航系统量测方程的建立

SinS/GpS子系统有两组量测值,一组为位置量测值,即SinS和GpS接收机给出的位置信息的差值;另一组为速度量测值,即两个系统给出的速度差值。而SinS/视觉子系统只包含一组量测值,利用视觉图像信息估计得到的机姿信息和SinS给出的姿态角信息之间的差值作为量测值。

SinS系统的位置信息和速度信息可表达为真值与相应误差之和:

GpS全球定位系统的位置信息和速度信息可表示为真值与相应误差之差:

其中,,,分别为纬度,经度和高度的真实值;,,为GpS接收机沿北、东、地方向的位置误差;,,为GpS接收机沿北、东、地方向的速度误差。两个子系统的量测方程为:

(11)

其中,

4SinS/GpS/视觉组合导航系统仿真实验

卡尔曼滤波是实现组合导航的关键性环节。基于先前建立的状态方程和量测方程设计扩展卡尔曼滤波器,并将其作为导航系统子滤波器。同时,采用联邦滤波技术对子滤波器输出信息进行有效融合[4]。

轨迹发生器的参数选取如下:

位置参数:初始纬度、经度、高度,,,,。

姿态参数:,,,,,。

卡尔曼滤波器参数:初始位置误差5m,初始速度误差0.1m,初始平台误差角均为,陀螺白噪声漂移,加速度计零偏,GpS接收机位置误差10m,GpS接收机速度误差0.5m/s,联邦滤波器参数。

获取特征点信息的帧间图像间隔时间为150ms。SinS解算频率为50Hz,GpS接收频率为1Hz,组合频率为1Hz。

由图3~图11所示误差曲线可知,SinS/GpS系统的姿态角误差波动范围约为SinS/GpS/视觉系统的1.39倍;速度误差波动范围约为SinS/GpS/视觉系统的1.45倍;位置误差中,高度、纬度和经度误差波动范围分别为SinS/GpS/视觉系统的1.40倍、1.28倍、1.13倍,整体而言,SinS/GpS/视觉组合系统的误差波动范围减小且误差曲线整体的收敛性优于SinS/GpS系统,稳态趋向更平稳。综上所述,SinS/GpS/视觉组合系统的导航定位精度优于SinS/GpS系统。

此外,即使GpS信号丢失或受到干扰,系统仍可采用SinS/视觉组合完成导航任务,维持系统正常工作。视觉导航技术的辅助作用使得系统的可靠性增强。

5结束语

无人机众多导航系统中,SinS/GpS组合导航系统最为常见,但是,由于GpS存在信号易受干扰甚至丢失的缺点,以提高系统的精度和可靠性为目标,分别从状态方程和量测方程的建立、卡尔曼滤波算法及联邦滤波等多方面进行研究和改进,相比SinS/GpS导航系统,本文提出的SinS/GpS/视觉组合导航技术在提高定位精度和系统可靠性方面都有着显著的优势。

参考文献:

[1]魏瑞轩,李学仁.无人机系统及作战使用[m].北京:国防工业出版社,2009:23-26.

[2]万明.基于视觉导航的无人机自主着陆飞行参数估计方法[D].南京航空航天大学,2009.

计算机视觉前沿方向篇3

关键词:mCLa;计算机教学;教学研究;教学改革

中图分类号:G642文献标识码:B

1引言

高校计算机教育的过程中,难点知识的教和学是困扰着教师和学生的重要问题,对于难点知识教学方法的研究,引起了广大高校计算机教师的重视,其研究成果已经在高校计算机教育中起到了越来越重要的作用。难点知识一般分布在学生的专业基础课和专业选修课中,这些知识点往往理论性较强,需要较好的数学基础才能一次性掌握,这些知识点往往是某一门课程或某个研究方向的核心或者基础,如果不能很好地掌握,又影响到后续知识的学习和研究的开展。类似的知识点如:“数据结构”中的“最短路径”和“Kmp算法”、“计算机视觉”中的“各向异性扩散的偏微分方程(pDes)”、“编译原理”中的“有限自动机”、“面向对象程序设计”中的“多态性”、“计算机网络”中的“七层协议的实现”等。

提升难点知识的教学效果显得非常重要,但是传统的教学方法中,由于各种因素的影响,往往采用从理论到实践的教学过程。首先讲解知识的数学背景,然后阐述其理论框架,接下来讲解该框架中的相关公理或者定理,推出一系列公式,最后加以应用。在这种背景下,由于学生知识储备的差异性,以及学生听课状态的波动性,这种教学方法往往造成部分学生在学习的过程中,无法理解他们看起来很高深理论,从而失去学习兴趣,放弃后续学习,靠做题应付考试,最终即使得到高分,对知识点知其然不知

其所以然,更不要说进行创新。实践证明,该方法确实导致部分学生无法清楚地掌握知识的实质,造成了教学过程中的无用功和教学资源的浪费。

为了克服以上方法的不足之处,我们借鉴了国外著名教育机构的教学方法,将其引入到我们的教学过程中去。mCLa(modelCenteredLearningarchitecture)教学法来源于印度国家信息技术学院(印度niit),该教学方法的基础是:以“模型”为中心,通过完成“模型”来讲解理论,在该学院的教学中起到了巨大的作用。本文针对计算机难点知识教学过程中遇到的问题,结合相关经验,将mCLa教学方法应用到教学过程中去,以“图像处理中的各向异性扩散的偏微分方程”的讲解为案例,阐述mCLa方法在教学过程中的应用。实践证明,该教学方法能够加强学生对知识的理解,取得了较好的教学效果。文章最后还对该方法适用的

范围进行了讨论。

2传统教学方法的问题

难点知识在高校计算机教育中,不仅对于学生是学习难点,而且对于教师也是讲授难点。它难就难在理论性强,数学基础要求较高,教师即使能够熟练精通地掌握,由于学生数学知识储备的差异,学生就不一定能掌握;即使学生数学知识储备足够,由于听课状态波动,如果兴趣不高也会无法听懂,造成知识的遗落;教师将自己会的知识教给学生,学生却没学会,不能不说是教学资源的巨大浪费。

2.1教学案例描述

本文以“计算机视觉”中的“各向异性扩散的偏微分方程”为例,来阐述这个问题。

“计算机视觉”是高校计算机专业的一门专业选修课,对于即将攻读研究生并从事模式识别和图像处理的学生,是一门基础性课程。“各向异性扩散的偏微分方程”属于计算机视觉中的前沿技术,一般在书本的后半部分讲授。在此之前,学生已经学习了图像处理的基本知识,如基本的图像存储、变换、滤波以及常见的图像特征提取方法。

在计算即视觉中,“各向异性扩散的偏微分方程”最简单的情况是用于图像的平滑。在平滑图像的过程中,能够较好地保持边缘。该框架下,图像的平滑被假定类似于化学物质的扩散过程,图像的灰度(化学物质)将随着时间的变化而变化(扩散)。在某一个时间点,变化后的图像(扩散的结果)就是试图得到的平滑后的图像。描述如下:

设表示一幅二维灰度图像,为像素点处的灰度值。表示图像随着时间变化的状态,具有边界停止功能的方程中,图像随着时间变化的状态或者图像的平滑过程被如下的扩散方程描述:式中,为散度算子,,是的空间梯度。在这里,必须是个减函数,当较大,扩散必须很小,图像的边缘得到保持;较小,扩散应该很大,图像将会得到平滑。对于的设计对系统的正确工作起着决定性的作用,一般可令:

从以上数学模型可以看出,,为非增函数,当点位于图像灰度变化不大的区域,即的值相对较小的时候,的值相对较强;反之,在图像的边缘点上,的值相对较大,则扩散速度相对较小。为梯度门限,是一个正数。的值小于时,扩散过程进行,当接近时,扩散过程停止。

实际处理过程中,输入的图像为二维图像,必须能够对图像的处理过程进行离散化。一般采用如下形式:

其中,是离散采样图像上的像素点在时刻的灰度值,是时间离散步长,常量,决定了扩散的速度。的下标表示的计算与像素和相关。表示像素的空间邻域,表示邻域像素点的个数(如在8邻域情况下,取=8),将图像梯度沿着特定的方向近似为:

最后的实验中,我们可以采用一些需要平滑的图像,分别用传统的低通滤波的方法和pDes方法进行平滑,来检测其平滑效果。

2.2传统讲授方法及其效果

传统方法在讲授的过程中,一般采用如下步骤:

(1)首先讲解“各向异性扩散的偏微分方程”的作用:在平滑图像的过程中,能够较好地保持边缘,但也能对其它部分作平滑。

(2)讲解“各向异性扩散的偏微分方程”的数学模型,特别强调扩散方程以及其中参数、算子的选择。

(3)对该模型进行离散化。

(4)最后举例说明“各向异性扩散的偏微分方程”在实际中的应用,并一定的实例让学生阅读,最后布置习题。

该方法在步骤(1)中,确实提到了“各向异性扩散的偏微分方程”的作用,激起学生的兴趣。但是可惜的是,这个兴趣只是在学生脑海里面逗留了片刻,就被后面大量的数学公式淹没了。除了少数比较认真的学生能够保持兴趣,将这些数学公式紧扣其作用,其它学生一旦遇到听不懂的内容,便放弃学习了。结果只能是教师一直在讲课,却只有部分学生能够理解教师的讲解。当然,最后的实例,大部分学生都会阅读,也能读懂,对于练习,也能模仿习题进行编程实现,最后应付考试。但对于该习题和前面讲解的数学公式之间有什么关系,学生是很难理解的。我们知道,理论的创新都是来源于知识点的抽象表达,如果那些原理没有理解清楚,即使学生升入研究生进行科学研究,也无法进行创新。

针对这种方法,我们在南京某大学设计了一个实验,随机抽取50名计算机应用技术专业的本科学生,选修了“计算机视觉”的课程,并且已经学习了“各向异性扩散的偏微分方程”的前续知识,我们用此方法进行讲解,得到的问卷如表1所示。

从上表可以看出,96%的学生对该知识点的作用还是了解的,也就是说从课程开始学生还是有兴趣的,但是自从对数学公式无法理解之后,直接影响了后面知识的理解,更不要说创新了。

3mCLa教学法的实践

mCLa(modelCenteredLearningarchitecture)是基于模型的学习方法,该方法在教师引导下的独立解决实际问题。其步骤如下:

(1)教师根据知识点内容,结合实际应用情况,对学生进行知识点的概况介绍,提出一个典型案例,激起学生兴趣。

(2)教师用所设计的案例,采用任务驱动的示范性教学。将知识点隐含到每一个任务中,使得学生更容易接受相关的知识内容。

(3)当教师在用系统的方法完成各项任务,成功解决问题时,学生在一旁观察以通过观察思考形成一种行之有效的思维方式。

(4)布置类似的案例,引导学生进行实践。

(5)引导学生进行创新探索,并能针对所探索的结果进行演讲。

mCLa的独特之处在于,它不但要教会学生如何在实际问题中应用所学的知识和培养其专业技能,而且也要培养学生信息搜索和分析的能力、团队合作的能力以及对所学知识达到综合性理解和应用的能力。这有助于学生提高在技术探索和创新方面的技能,并使其成为一种习惯。

3.1教学过程

(1)提出模型

在该过程中,教师首先不讲解“各向异性扩散的偏微分方程”的作用,而提出一个实际图像处理中遇到的一个问题:在出版、公安、医学、控制等应用系统中,往往需要使用计算机来实现字符的正确识别。字符识别的过程一般是针对字符图像输入,运用一系列的识别算法得到正确的结果。但是,由于各种因素的影响,输入图像的真实性可能会受到一些损害。比如,字符可能由于分辨率不足而失真,最典型的就是字符的断裂和缺口,如图1所示。

由此提出一个问题:怎样将缺口的部分连接起来?引起学生讨论,激发学生兴趣。

由于学生已经学习了前续知识,不少学生可能会提到可以将图像进行低通滤波,即:通过将图像变平滑、模糊,用以造成字符黑色边缘扩散,扩散之后看能否将缺口部分连起来。

于是,教师采用低通滤波方法,利用已有的程序,将该图像进行滤波,图2是截止频率为80时的高斯低通滤波器得到的结果。

学生可能对该方法的效果没有一个客观的认识,可以提醒学生:从上图可以看出,利用高斯低通滤波器可以较好地解决字符断裂和缺损的问题,断裂部分基本连接起来了,为后期的特征提取打下良好的基础,它实际上是一个图像平滑的过程。但是,从图2我们可以看出,输出的图像虽然在断裂处有了明显的改进,但其边缘却产生了过度的模糊,从而在某种程度上可能丢失一些特征信息。此外,一个更为严重的后果是,针对某些线条比较密的字符,对图像的平滑可能会造成线条的互相干涉,如e字母,上半部分已经进行了过度的模糊,给后期的工作带来一些障碍。因此,寻找一种既可以对字符的断裂进行复原,又可以保证不会将字符图像边缘进行过度平滑的方法就非常重要。由此引出“各向异性扩散的偏微分方程”,并提出它的作用:在垂直于字符边缘的方向不进行平滑,在沿着字符边缘的方向进行平滑。

(2)建立任务

任务:将图1的断裂字符,断裂部分尽量连接起来,但又不要过度模糊。

任务的核心:在将字符进行平滑的时候,在垂直于字符边缘的方向少进行平滑,在沿着字符边缘的方向进行平滑。

任务难点:

①怎样知道一个像素点是否在字符边缘?

②怎样确定垂直于字符的边缘的方向和沿着字符边缘的方向?

③怎样进行平滑?

这些问题都可以让学生在课堂上讨论。

(3)讲解知识

针对第一个问题,怎样知道一个像素点是否在字符边缘?可以引导学生提出“图像灰度变化率”的概念。在边缘处,垂直于边缘的方向,图像灰度变化率是最大的,再次引导学生将其用数学模型表示:即梯度;而平行于边缘的方向,字体内部,图像的背景,灰度变化率最小。

于是,问题变成:在梯度较大的位置,图像不要进行平滑,梯度较小的位置,图像进行平滑。第二个问题得到解决。

通过和学生的互动讨论,由此引出如下公式(具体表达式的含义已在上节叙述,此处不再重复):

并可以强调,应该是一个关于梯度的减函数,因为当较大,扩散必须很小,图像的边缘得到保持;较小,扩散应该很大,图像将会得到平滑。并可以说明,这就是偏微分方程里面最简单的“各向异性扩散的偏微分方程”,也就是本节课要讲解的内容。到此为止学生的兴趣就完全被调用起来了。更重要的是学会了将实践问题抽象为数学理论的方法。

接下来讲解的选取,选取各种关于梯度的减函数让学生评价,最后引出比较经典的选取方式:

说明理由,并对的意义稍作说明。

这些内容讲解完毕,就可以进行离散化,解决第三个问题,在这里可以让学生进行讨论离散化过程,得出如上节的离散化公式。

最后教师可以用该方法做一个实验,图3即为实验效果,可让学生和图2的作比较。

(4)学生实践

通过上一步的讲解,学生基本了解了“各向异性扩散的偏微分方程”进行图像处理的方法和性质,并通过案例建立了感性认识,该步骤中可以布置一个类似的案例让学生回去练习。并让学生设计不同的函数进行测试,观察其效果。

(5)创新搜索与演讲

在布置作业的过程中,可以另外让学生搜索一下当前偏微分方程在图像处理方面的其它的一些应用,最好能够

提出创新观点,将学生分为每5人1组,各选择不同的方面,如图像平滑、图像分割、图像去噪等等。在接下来的课程中,进行演讲,让学生加深认识,培养其创新能力。

3.2教学效果

针对这种方法,我们也设计了一个实验,另外随机抽取50名计算机应用技术专业的本科学生,选修了“计算机视觉”的课程,并且已经学习了“各向异性扩散的偏微分方程”的前续知识,我们用mCLa方法进行讲解,得到的问卷如表所示:

表2mCLa教学方法效果

说明完全理解(%)一般理解(%)无法理解(%)

从上表可以看出,在mCLa方法应用于教学实践之后,学生对该知识点的掌握程度大大加强,并且具有的创新意念更加活跃。

4结束语

该文介绍了mCLa(modelCenteredLearningarchitecture)教学法在高校计算机难点知识教学中的应用,针对计算机难点知识教学过程中遇到的问题,结合相关经验,将mCLa教学方法应用到教学过程中去,以“各向异性扩散的偏微分方程(pDes)的图像处理”的讲解为案例,阐述mCLa方法在教学过程中的应用。实践证明,该教学方法能够加强学生对知识的理解,取得了较好的教学效果。

该方法对教师提出了更高的要求。首先,教师应该对知识点特别熟悉,并能和相关应用案例联系起来;另外,并不是每一个知识点都能够寻找到相应的案例,不过可以指出的是,在计算机专业的课程中,大多数知识点都是有案例可循的。

参考文献:

[1]覃华,苏一丹.印度niit教学法及其在高校教学中应用的研究[J].广西大学学报,2004(9):73-78.

[2]俞仲文.关于发展高等技术教育的若干思考[J].高等工程教育研究,2005(2):18-22.

[3]peronap,malikJ.ScalespaceandedgeDetectionUsinganisotropicDiffusion[J].ieeetransonpami,1990;12(7);1629-1639.

[4]郭克华,刘传才,杨静宇.有损字符图像复原的偏微分方程方法[J].计算机工程与应用,2007,43(8):24-27.

[5]milanSonka,VaclavHlavac,RogerBoyle.imageprocessing,analysis,andmachineVision[m].2nded.Beijing:posts&telecompress,2003:69-72.

theDesignandimplementoftheBasisofapplicationsofmCLainDifficultComputerKnowledgeteaching

GUoKe-hua,Limin

(SchoolofinformationScience&engineering,CentralSouthUniversity,Changsha410083,China)

计算机视觉前沿方向篇4

【关键词】aGV技术巡检机器人本体导引方式

aGV是自动导引运输车(automatedGuidedVehicle)的英文缩写。在国内电力领域已经开始研制变电站自动巡检机器人,这种机器人系统一般主要有移动机器人本体、自动控制系统、信息检测系统等部分。其采用了GpS定位、光码盘校正定位、激光雷达扫描、路径跟踪技术、本体控制技术、临场感应遥控辅助、无线通信局域网和物联网等技术划分出相应的子系统模块,实现了自控机器人在变电站现场自主巡检的功能。机器人本体能够携带多种仪器和传感器,以自主或遥控的方式,代替人对室外高压设备进行巡测,及时发现电力设备的内部热缺陷、外部机械或电气问题如:异物、损伤、发热、漏油等,诊断电力设备运行中的事故隐患和故障先兆,对设备热缺陷,声音异常、移动目标、人与动物闯入,烟雾能自动判断和报警,以便及时采取措施消除事故隐患。aGV的导引技术是aGV控制的核心技术,它决定了aGV的导引方式。aGV导引方式按导引线路的形式主要分固定路径导引和自由路径导引两大类。固定路径导引是在行驶的路径上设置导引用的信息媒介物,aGV通过车体上的传感器检测出它的信息而得到导引。具体的线路可以是电磁感应方式中的导引电缆、机械方式中的轨道、磁导引方式中的磁条及光导引方式中的反光带等。自由路径导引方式是指aGV上存储着布局上的尺寸坐标,通过识别车体当前方位,自主地决定行驶路径。自由路径导引方式主要有惯性导引、信标定位、位姿积算及计算机视觉等几种。

一、导引方式

(一)电磁导引方式。利用电磁感应的原理,在沿运行线路的地面上设置一条宽约8mm、深约20mm的浅沟,浅沟中敷设导线,馈以5-30kHz的交变电流,以形成沿导线扩展的交变电磁场,车上的捡拾传感器接收此信号,并根据信号场强度的判断使车辆正确地沿埋线跟踪导向运行。电磁导向有单频制导向和多频制导向两种方式。单频制方式是在整个线路上均提供单一频率振荡电磁信号,通过接通或断开各线路段的馈送电流来规定运行线路,引导车辆运行。这种导向方式要求有集中的控制站,并在各线路交叉和分支处装设传感标志(如磁铁等)和分支线段的通断接口。多频制方式是线路中每个环线或分支线都设置自己的线路频率,分别由不同频率的振荡器来馈电。

(二)光学控制带导引方式。光学导向系统有识别式和反射式两种。它是在线路上敷设一种具有稳定反光率的专门漆带。导向车上装备有发射和接收功能的红外光源,用以照射漆带,同时还设有接收反射光的光电传感器,均匀分布在漆带及两侧位置上,通过对由传感器检测到的光信号进行比较计算,调整小车的运动方向,从而达到导向运行的目的。

(三)激光测距与测角导引方式。该方法的主要特点是在aGV行走空间的特定位置处,布置一批激光光束的反射镜模型计算aGV的位置,实现引导。aGV行驶过程中,车上的激光扫描头不断地扫描周围环境,当扫描到行驶路径周围预先垂直设定好的反射板时,即“看见”了“路标”。只要扫描到三个或三个以上的反射板,即可根据它们的坐标值,以及各块反光板相对于车体纵向轴的方位角,由定位计算机算出aGV当前在全局坐标系中的X、Y坐标,距离和当前行驶方向与该坐标系X轴的夹角,实现准确定位和定向。该导引方法的特点是,当提供了足够多反射镜面和宽阔的扫描空间后,aGV导引与定位精度十分高,地面无需其他辅助定位,且路径灵活,适合多种环境。

(四)超声波制导方式。该方法类似于激光测量方法,不同之处在于不需要设置专门的反射镜面,而是利用一般的墙面或类似物体就能进行引导,因而在特定环境下提供了更大的柔性和低成本的方案。

(五)磁导引方式。这种方式和电磁导引比较类似,只是把导引线换成磁条。

(六)视觉导引方式。视觉导引是通过CCD摄像机生成aGV周围场景的图象,与计算机系统中存储的环境地图进行特征匹配,从而可以确定出车体的当前位姿。

(七)GpS导引方式。GpS导引方式通过全球定位系统对非固定路面系统中的控制对象进行跟踪和制导。

aGV有以上多种制导原理,其中,工厂aGV大多采用电磁制导,而激光、视觉导航具有引导柔性好、工作可靠和智能化水平高的特点,已成为技术先进、性能优越aGV的发展趋势。实验室一般采用光学制导,其运行范围大,运行精度高,地面费用低,但要求工作环境清洁,不适于工作条件比较恶劣的环境。

二、系统构成和意义

aGV控制系统中的三个主要技术:导航、路径规划和导引控制。为了能够解决好这些问题,控制系统分为地面(上位)控制系统、车载(单机)控制系统及导航/导引系统,其中,地面控制系统指aGV系统的固定设备,主要负责任务分配,车辆调度,路径(线)管理,交通管理,自动充电等功能;车载控制系统在收到上位系统的指令后,负责aGV的导航计算,导引实现,车辆行走,装卸操作等功能;导航/导引系统为aGV单机提供系统绝对或相对位置及航向等。该系统的研制将大大降低电厂变电站相关工作人员的劳动强度,能在第一时间监测和发现安全隐患,对突发事故能第一时间响应并处置,从而避免或降低事故风险。

参考文献:

[1]叶菁.磁导式aGV控制系统设计与研究[D]武汉理工大学,2006.

[2]徐海贵,王春香,杨汝清,杨明.磁传感系统在室外移动机器人导航中的研究[J].机器人,2007,29(1):61-66

计算机视觉前沿方向篇5

1.虚拟现实简介

虚拟现实(VR)是一种由计算机和电子技术创造的新世界,是一个看似真实的模拟环境,通过多种传感设备用户可根据自身的感觉,使用人的自然技能对虚拟世界的物体进行考察或操作,参与其中的事件;同时提供视觉、听觉、触觉等多通道的信息,用户通过视、听、摸等直观而又自然的实时感知,并使参与者沉浸于模拟环境中。VR的三个最突出的特征,即它的3“i”特性:交互性(interactivity)、沉浸感(illusionofimmersion)、想象(imagination)。

虚拟现实技术是在众多相关技术如计算机图形学、仿真技术、多媒体技术、传感器技术、人工智能的基础上发展起来的。虚拟现实技术在最近十年里获得了极大的发展,这主要归因于计算机软、硬件条件的飞速发展,以及虚拟现实专用设备价格的下降和性能的提高。目前虚拟现实技术已经获得了广泛的应用,而且日益普及,不仅在诸如naSa的大型工程得到应用,也出现在一些游戏中,在一些高档的pC机上甚至可以构建自己的个人pCVRS(个人虚拟现实系统)。

设计一个虚拟现实系统除了硬件条件一般个人无法定制外,能够充分发挥个人能动性的就只能是在系统软的方面下功夫了。设计一个VR系统,首要的问题是创造一个虚拟环境,这个虚拟环境包括三维模型、三维声音等,在这些要素中,因为在人的感觉中,视觉摄取的信息量最大,反应亦最为灵敏,所以创造一个逼真而又合理的模型,并且能够实时动态地显示是最重要的。虚拟现实系统构建的很大一部分工作也是建造逼真合适的三维模型。

2.3DStudiomaX简介

3DStudiomaX是Kinetix公司推出的一套强大的三维建模软件,由于它是基于winnt或win98平台的,方便易学,又因其相对低廉的价格优势,所以成为目前个人pC上最为流行的三维建模软件。其3.0版本的推出,更是巩固了它在个人pC平台上的地位。它的3.0版本相较以前的版本有了明显的改进,具体表现在以下几个方面:

⑴工作流模式使得工作组的协调更容易,效率更高。3DStudiomaXR3引入了工作流模式,在具体的实现上从外部参考体系(XRef)、示意视图(SchematicView)的引入以及现在3DmaX可以使用其他程序从外部加以控制,而不必激活它的工作界面。

⑵易用性的改进。操作界面的改进是Release3.0版本的最显著的变化,除了外观的变化之外,R3.0版本还增加了诸如用户自定义界面、宏记录、插件代码、变换Gizmo、轨迹条等功能。

⑶渲染的改进。autodesk公司在收购了以渲染和视频技术闻名的DiscreetLogic公司,吸收了该公司的先进技术,3DmaXR3对其渲染器几乎做了重新设计,不仅增加了渲染的速度,而且提高了画面渲染的质量。

⑷建模技术的增强。建模技术的增强是3DStudiomaX最重要、最突出的改进,这也是在虚拟现实系统构建中应用它的一个有力的原因。主要的改进包括:

①细分曲面技术(SubdivisionSurface)。3DSmaX包含了细分曲面技术,细分曲面技术是1998年以来业界最流行的建模技术,大有赶超nURBS技术之势,它可以使模型建立更容易,而且效果更好。

②柔性选择。此项技术可以“部分地”选择顶点,从而在变换顶点时获得光滑、柔和的效果,这对建立复杂物体的模型时非常有用。

③曲面工具和改进的nURBS技术。使用曲面工具可以产生很复杂的“面片”模型,这亦是一种重要的建模方法,Release3.0版本中的nURBS技术不但速度加快,而且增加了一系列方便、易用的功能。

⑸对游戏的更好支持。3DStudiomaXR3大大增强了对游戏的支持,而且这些特性也可以用于其他场合。

①增加了角色动画功能。Release3.0版本内置了制作角色动画的功能,可以方便制作人物或动物的动作、柔软物体的效果以及变形效果。

②顶点信息以及加强的贴图坐标功能。现在可以对顶点着色,并增加了顶点的通道,增强了UVwUnwarp的功能,并增加了worldXYZ贴图坐标。

此外,3DStudiomaXR3也显著增强了动画功能。

3.3DSmaX在VR系统构建过程中的应用

如前所述,VR系统要求实时动态逼真地模拟环境,考虑到硬件的限制和虚拟现实系统的实时性的要求,VR系统的建模与以造型为主的动画建模方法有着显著的不同,VR的建模大都采用模型分割、纹理映射等技术。目前VR中的虚拟场景的构造主要有以下途径:基于模型的方法和iBR(基于图像的绘制)方法两种。这两种方法都可以在3DSmaX中加以实现和验证,下面具体展开加以说明。

3.1基于模型的构造方法。3DSmaX的几何建模方法主要有多边形(polygon)建模、非均匀有理B样条曲线建模(nURBS)、细分曲面技术建模(SubdivisionSurface)。通常建立一个模型可以分别通过几种方法得到,但有优劣、繁简之分。

⑴多边形建模。多边形建模技术是最早采用的一种建模技术,它的思想很简单,就是用小平面来模拟曲面,从而制作出各种形状的三维物体,小平面可以是三角形、矩形或其他多边形但实际中多是三角形或矩形。使用多边形建模可以通过直接创建基本的几何体,再根据要求采用修改器调整物体形状或通过使用放样、曲面片造型、组合物体来制作虚拟现实作品。多边形建模的主要优点是简单、方便和快速但它难于生成光滑的曲面,故而多边形建模技术适合于构造具有规则形状的物体,如大部分的人造物体,同时可根据虚拟现实系统的要求,仅仅通过调整所建立模型的参数就可以获得不同分辨率的模型,以适应虚拟场景实时显示的需要。

⑵nURBS建模。nURBS是non-UniformRationalB-Splines(非均匀有理B样条曲线)的缩写,它纯粹是计算机图形学的一个数学概念。nURBS建模技术是最近4年来三维动画最主要的建模方法之一,特别适合于创建光滑的、复杂的模型,而且在应用的广泛性和模型的细节逼真性方面具有其他技术无可比拟的优势。但由于nURBS建模必须使用曲面片作为其基本的建模单元,所以它也有以下局限性:nURBS曲面只有有限的几种拓扑结构,导致它很难制作拓扑结构很复杂的物体(例如带空洞的物体);nURBS曲面片的基本结构是网格状的,若模型比较复杂,会导致控制点急剧增加而难于控制;构造复杂模型时经常需要裁剪曲面,但大量裁剪容易导致计算错误;nURBS技术很难构造“带有分枝的”物体。

⑶细分曲面技术。细分曲面技术是1998年才引入的三维建模方法,它解决了nURBS技术在建立曲面时面临的困难,它使用任意多面体作为控制网格,然后自动根据控制网格来生成平滑的曲面。细分曲面技术的网格可以是任意形状,因而可以很容易地构造出各种拓扑结构,并始终保持整个曲面的光滑性。细分曲面技术的另一个重要特点是“细分”,就是只在物体的局部增加细节,而不必增加整个物体的复杂程度,同时还能维持增加了细节的物体的光滑性。但由于细分曲面技术是一种刚出现不久的技术,3DStudiomaXR3对它的支持还显得稚嫩,还不能完成一些十分复杂的模型创作。

有了以上3DSmaX几种建模方法的认识,就可以在为虚拟现实系统制作相应模型前,根据虚拟现实系统的要求选取合适的建模途径,多快好省地完成虚拟现实的作品的制作。

在虚拟现实作品制作的时候应当遵循一个原则:在能够保证视觉效果的前提下,尽量采用比较简单的模型,而且若能够用参数化方法构建的对象尽量用参数化方法构建,同时,在模型创作过程中,对模型进行分割,分别建模,以利于在虚拟现实系统中进行操作和考察。

对于复杂对象的运动或原理演示,我们可以预先将对象的运动和说明做成动画存为avi文件,然后等待VR系统合适的触发事件,播放该avi文件即可。

3.2基于图像的绘制(iBR),传统图形绘制技术均是面向景物几何而设计的,因而绘制过程涉及到复杂的建模、消隐和光亮度计算。尽管通过可见性预计算技术及场景几何简化技术可大大减少需处理景物的面片数目,但对高度复杂的场景,现有的计算机硬件仍无法实时绘制简化后的场景几何。因而我们面临的一个重要问题是如何在具有普通计算能力的计算机上实现真实感图形的实时绘制。iBR技术就是为实现这一目标而设计的一种全新的图形绘制方式。该技术基于一些预先生成的图像(或环境映照)来生成不同视点的场景画面,与传统绘制技术相比,它有着鲜明的特点:

⑴图形绘制独立于场景复杂性,仅与所要生成画面的分辨率有关。

⑵预先存储的图像(或环境映照)既可以是计算机合成的,亦可以是实际拍摄的画面,而且两者可以混合使用。

⑶该绘制技术对计算资源的要求不高,因而可以在普通工作站和个人计算机上实现复杂场景的实时显示。

由于每一帧场景画面都只描述了给定视点沿某一特定视线方向观察场景的结果,并不是从图像中恢复几何或光学景象模型,为了摆脱单帧画面视域的局限性,我们可在一给定视点处拍摄或通过计算得到其沿所有方向的图像,并将它们拼接成一张全景图像。为使用户能在场景中漫游,我们需要建立场景在不同位置处的全景图,继而通过视图插值或变形来获得临近视点的对应的视图。iBR技术是新兴的研究领域,它将改变人们对计算机图形学的传统认识,从而使计算机图形学获得更加广泛的应用。

3DSmaX在iBR中的应用是自然的,3DSmaX的出色的纹理贴图,强大的贴图控制能力,各种空间扭曲和变形,都提供了对图像和环境映照的容易的处理途径。例如,在各种iBR的应用中,全景图的生成是经常需要解决的问题,这方面,利用3DSmaX可以根据所需的全景图类型先生成对应的基板,比如,柱面全景图就先生成一个圆柱,然后控制各个方向的条状图像沿着圆柱面进行贴图即可。而且可以将图像拼接的过程编制成Script文件做成插件嵌入3DSmaX环境中,可以容易地生成全景图并且预先观察在虚拟现实系统中漫游的效果,这通过在Videopost设置摄像机的运动轨迹即可。事实上,目前已经有一些全景图生成和校正的插件。

在用3DSmaX为VR系统创作好模型后,结合VR系统的要求,看是否需要采用诸如LoD(LevelofDetail)模型,如果需要可利用maX自带的LoD插件直接生成对象的LoD模型,最后根据VR系统的编辑环境将模型输出为编辑环境所能接收的文件类型,如VRmL97或DXF等格式的文件。

以上主要介绍了3DSmaX制作VR作品,下面再简单介绍一些3DSmaX的另外的应用。

计算机视觉前沿方向篇6

关键词:机器人;LabView;图形化系统;移动机器人;无人驾驶车

引言

移动机器人构成复杂、应用灵活,目前商业化程度还不高,相对处于前沿研究的阶段,因此一直以来都是科学家和工程师们关注的重点。移动机器人具有某些共同的构架和组成部分,是一个融合了众多机电系统和子系统的综合体系。并通过这些组成部分与子系统的有机结合协调工作,虽然部分子系统已有现成的软硬件工具和解决方案,但如何快速地把各子系统集成在一起、进行早期的整体功能性验证,就成了决定机器人设计成败的关键性环节。

图形化系统设计一机器人设计的前沿方法

在GooglexpRiZe机构、FiRSt组织(科学技术的启示与认知组织)、RoboCup以及美国国防高级研究计划局(DaRpa)之间展开的竞争推进了机器入学领域的创新。富有创新思维的开发者们将机器人学的前沿方法推进到了图形化系统设计。在LabView图形化编程平台下,机器人学的领域专家能够对复杂的机器人方案进行快速的原型设计。这些创新工作者能够不用关心底层的实现细节,可以将注意力集中到解决手上的工程问题中去。

机器人设计通常包含以下部分的工作内容,如图1所示。

感知系统――连接到陀螺仪、CCD、光电、超声等传感器,获取并处理信息。

决策规划――相当于机器人的‘大脑’,根据算法进行控制决策,完成管理协调、信息处理、运动规划等任务。

执行控制――根据具体的作业指令,通过驱动控制器、编码器和电机完成机器人的伺服控制与运动执行。

网络通讯与控制――机器人各子系统间的通讯网络,完成分布式控制与实时控制。

过去,由于在每个领域中必须使用各自的传统工具,其中涉及的知识具有较大的纵向深度,机械工程师、电气工程师以及程序员团队都各自领导机器人学的开发。LabView和ni硬件提供了一个独特的、功能多样的平台,它提供了一套标准的可供所有机器人设计人员使用的工具,从而使机器人开发得到了统一。

来自弗吉尼亚理工大学机器入学与机械实验室(KomeLa)正在进行智能动态拟人机器人(DaRwin)的双足类人机器人的开发和研究,目的是对假肢进行研究和开发。DaRwin使用niLabView图形化系统设计平台,能够实现全范围运动,并且能够准确地模拟人类运动。LabView可以分析动态双足运动、设计并开发机器人控制系统的原型。如果开发的原型能够令人满意地工作,他们就将控制算法部署到运行LabView实时模块的pC/104单板计算机上。

通过LabView,设计人员无需成为计算机专家或程序员、就可以开发高级机器人。例如,一位只有有限LabView和机器视觉经验的学生在短短几个小时之内,就设计了一个让机器人利用它带有的ieee1394相机和ni机器

视觉开发模块跟踪一个红球的算法。工程师们使用LabView和ni硬件,就可以使用功能强大的图形化编程语言快速地设计并开发复杂算法的原型:并通过代码生成方便地将控制算法部署到pC、FpGa、微控制器或实时系统之中:还可以与几乎所有的传感器、执行器进行连接。通过LabView和ni硬件平台、可以支持Can、以太网、串口、USB等多种接口,方便构建机器人系统的通讯网络。领域专家不仅仅能够完成机械工程师的工作,还能够成为机器人设计者。

实例分析1:南洋理工大学使用niLabView设计救生机器人蜘蛛

南洋理工大学开发了一个用于支持营救工作的六足机器人蜘蛛。它是一个尺寸较小、可移动的智能机器人,在搜寻被陷的受害者时,它可以越过障碍并到达通常难以触及的地方。替代如清扫雷区使之无雷化等危险任务中的工作人员也是机器人蜘蛛的另一个潜在应用领域。

他们设计了一个高度可移动的行走方案,它由六只独立的下肢组成,可以任意方向移动机器人,即使在机器人移动通常不可行或过于危险的地带。行走与旋转均属于模仿六足昆虫而得的基本的高层次运动模式。通过三条下肢移动而另外三条下肢抬高,机器人可以达到期望的行走速度,并提供恶劣地带所需的足够平衡。爬行时,机器人可以挤压通过紧凑的空间和狭缝。单下肢的低层次运动步态是3D空间内的几何原语,如长方形或圆形轨道。

24个自由度的多功能机电系统及智能运动控制

下肢结构与运动控制构成了机器人蜘蛛关键特性的一部分。24只智能Dc有刷电机共同驱动这些下肢,并充当行走结构中不可或缺的关节。这样得到了一个坚固的轻型结构、从而降低了功耗并改善了运动动态特性。

除了这些下肢,机器人蜘蛛的特性还在于典型的自主机器人子系统,其中包括机器视觉、远程测量和无线通信。机器人坚固的壳体内包含有嵌入式硬件、两节7.2伏的锃聚合物电池和电量测量装置。任务参数、i/o设置和新的运动步态均可以通过无线通信或可移动存储介质传递。

机器人蜘蛛的低层次运动有赖于运行时计算的复杂数学模型。凭借aDi公司的Blackfin处理器的高级嵌入式计算能力和LabView的确定性实时性能,机器人的运动表现得有力而平稳。基于niLabView嵌入式模块的程序连续运行一个逆动力学算法,算法包含三角函数和矩阵运算,求解恰当的关节角θ1与θ2,以沿着3D空间内的期望轨线精确移动末端执行装置。

所有六足的关节角度的计算并行完成以确保动态运动,相应地也得到了连续计算所得的24个电机的设置点。这些设置点通过一个串行RS485网络传递至每只电机,并由分散pD控制器转换为实际执行动作。通过同样的网络,完成所有24只执行装置的位置、反馈和温度读数的采集。

图形化的实时系统设计平台

机器人蜘蛛应用软件是利用面向Blackfin处理器的LabView嵌入式模块编程实现的。LabView为高层次编程、图形化调试、图形化多任务处理和确定性的实时行为,提供了一个理想的嵌入式软件平台。面向对象的设计模式有助于进一步控制图形化层次上的复杂度。例如电机或传感器等主要对象,通过LabView中表示类的功能性全局变量加以抽象。主要的应用框架由以下多个任务组成。

・顶层主循环对由一个经典状态机表示的动作进行规划,而状态机通过软件队列和同步方法(如信号量)与其他循环连接。通信任务保持一个与外部世界的无线数据连接。

・视觉任务负责低层次的图像处理和距离读数。

・运动控制任务管理高层次的运动模式与低层次的肢体控制,并监测马达的位置与状态。

・日常任务充当一个通用错误处理器。检测事件与异常,并将其及时间记录到可移动的存储介质,以供后续读取。

通过采用LabView嵌入式模块所提供的图形化编程环境,以及Blackfin处理器的高处理器性能,开发周期也大为缩短。基于LabView的图形化快速调试模式在算法的工程实现过程中非常有用,缩短了s倍的开发时间。

实例分析2:弗吉尼亚理工大学使用niLabView设计全自主地面车参加DaRpa城市挑战赛

DaRiia城市挑战赛需要设计一辆全自主地面车能够在城市环境中自动导航行驶。在整个赛程中、全自主车需要在6小时内穿越60英里,途经道路、路口和停车场等各种交通状态。

来自弗吉尼亚理工大学的团队需要在12个月开发出全自主地面车,他们将开发任务分成4个主要部分:基础平台、感知系统、决策规划和通讯架构,如图4所示。每一部分都基于ni的软硬件平台进行开发:通过ni硬件与现有车载系统进行交互,并提供操作接口;使用LabView图形化编程环境来开发系统软件,包括通讯架构、传感器处理和目标识别算法、激光测距仪和基于视觉的道路检测、驾驶行为控制、以及底层的车辆接口。

参赛车odin是2005年福特翼虎(escape)混合动力型越野车,并为自主驾驶做了一定程度的改装。niCompactRio系统与翼虎操控系统进行交互,通过线控驱动的方式控制油门、方向盘、转向和制动。利用LabView控制设计与仿真模块开发了路径曲率和速度控制系统,并通过LabView实时模块和ppGa模块部署到CompactRio硬件平台加以实现,从而建立了一个独立的车辆控制平台。与此同时使用LabView触摸屏模块和nitpC-2006触摸屏构建用户界面并安装在控制台。

通过LabView开发环境,团队快速可以构建系统原型并加快设计的往复周期。LabView与硬件的无缝连接,对于执行某些关键操作如传感器处理和车辆控制是至关重要的。由于城市挑战赛问题复杂且开发时间很短,这些因素对于开发团队的成功发挥了关键作用。

计算机视觉前沿方向篇7

关键词:公路建设;环境影响;评价指标

前言 公路建设项口环境影响评价关系到国计民生,因此构建社会、经济环境评价体系,对建设项目进行量化的经济损益分析研究,是公路建设项目可行性研究的重要内容。对公路建设项目环境影响评价体系的研究,克服了单个项目评价缺乏整个环境影响分析及整体环境对策规划的缺陷,能有效地控制各类污染源及污染物的排放总量和交通建设对环境造成的影响,使环境影响评价成为有效辅助决策、规划、计划的手段之一。

1.公路建设环境影响评价概况

   现代社会,公路交通运输是人类赖以生存和发展的基础条件之一。我国公路交通建设的高速发展,有效地解决了自然资源、劳动力、生产设施等生产要素相分离的矛盾,为实现共同富裕和可持续发展已经做出了巨大的贡献,而且将发挥更重要的作用。公路交通建设一方面积极促进国民经济的飞速发展;另一方面,公路基础设施在建设前、建设中和建设完成以后都会以不同形式对社会经济环境、自然景观、生态环境、环境大气、环境噪声等产生各种影响。

   公路建社对环境的影响客观地要求对公路建设项目做深入透彻的评价研究和分析,并通过评价研究分析找寻合理可行的方案,保障公路建设沿着可持续发展道路顺利前进。公路建设环境影响评价研究是监督和减缓工程环境的不利影响,达到经济发展和环境保护相协调,保证可持续发展的重要手段之一。

2.公路建设环境评价体系中存在的问题

   在公路建设环境影响评价中,部分评价体系还未构建或未完善,评价体系因子的量化关联问题的处理还没解决。并且由于公路建设项目的线性性质,各个地区的生态环境评价体系也不尽相同。因此,在评价项目建设对生态环境的影响时应建立适合项目沿线地区的评价体系。总结起来,其主要问题表现在以下几方面[1]:

(1)模型和模型参数存在的问题:关于评价方法中的一些数值模拟参数有待于改进。《公路建设项目环境影响评价规范(试行)》的应用仍然具有一定的局限性。具体表现在模型应用具有一定的局限性,参数的取定具有不确定的概括性。如对噪声的预测模型只适用于双向四车道,且设计行车速度有一定的限制。

(2)缺乏可持续发展理论的应用:公路交通建设建立了开发资源、协调资源、合理利用资源、加快经济发展的纽带,同时也是消耗资源、影响环境的举措。因此,在评价中运用可持续发展的观点、理论和方法尤为重要。而现有的评价体系和实践应用中,这一理论没有得到充分的体现。

(3)实际应用中缺乏科学的评价手段:由于科学技术的飞速发展和计算机技术在环境研究领域的广泛运用,对于环境监控己经基本实现计算机控制和数据处理。在国内,专门用于环境评价研究的软件层次很低,而这些软件对于“公路建设项目环境影响评价”却无能为力。

   以上提到的问题在应用中确实存在,问题的出现将损害对公路建设环境评价的合理性、准确性、有效性和可依据性。

3.环境影响评价的要素分析

   公路工程项目对环境影响的重点是线性的带状影响。其特点是路线长、范围广、施工期长、影响大。因此环境影响评价要素应包括如下内容[2]:

  (1)工程分析:工程分析是针对性很强的评价工作,分析内容包括各工程方案对环境的影响;路基设计对环境的影响;取、弃土石方工程对环境的影响;排水系统对环境的影响;绿化与美化;沿线管道埋设;

  (2)环境影响因子:公路建设项目对环境影响因子的识别应根据项目建设在不同时期对环境的作用。通常包含三大类:工程位置对环境的影响;施工对环境的影响;营运对环境的影响;

  (3)环境影响评价的现状调查、监测;

  (4)环境敏感地区、敏感点的确定;

  (5)环境影响识别;

  (6)评价指标体系结构的建立;

  (7)预测模型与参数:评价的关键是预测,预测模型要符合实际情况。模型选定后,参数选用正确与否直接影响计算结果的精度及评价结论的可信程度;

  (8)环境保护对策研究。

4.道路环境影响指标体系的建立

   道路环境影响指标体系按照计算方法可分两类:一类是可以由具体数值直接计算得到,另一种是无法直接计算得到,比如目前一般认为景观协调方面是不容易量化的。对于可以量化的指标可以用相应的计算模型就可以得到,而对于这类不易量化的指标就要采取其他方法,比如采取打分或排序的方法得到相应的指标值,同样也可以进行有效的评价。

4.1道路声环境评价指标

   目前国内外道路噪声评价中一般用等效噪声级l作为评价指标,l的数值和人们的主观吵闹感觉程度有较好的相关性,可以分三步计算[3]:

(1)各道路单元点在计算点产生的基础噪声

   首先将实际道路划分成一系列的道路单元,按交通量预测噪声的大小及不同的速度和同重车百分比对噪声进行的修正,同时考虑坡度对噪声产生的影响,求取一个道路单元噪声

  (2)计算扩散传播对交通噪声的修正值

   通过交通量预测和有关道路因素的修正,可以得到汽车在道路上行使时产生的噪声强弱,但是要进行道路声环境评价不但要计算汽车行使线上的噪声的大小,而且要计算离汽车行使线不同距离和不同高度处的噪声值,噪声扩散、传播时的衰减和加强通过测试数据进行修正。

  (3)计算交通噪声评价值

   将由交通量计算得到的基础噪声值加上由扩散和传播产生修正值,最终可以得到第i个道路单元点在计算点处产生的噪声评价值。然后将计算点范围内的第n个道路单元在计算点处产生的噪声值合并起来,就得到交通噪声评价值。

4.2道路大气环境评价指标

   在道路建设项目大气环境影响评价中以尾气污染指数最为实用,为计算尾气污染物在计算点产生的浓度,可将道路划分成一系列的道路单元,分别计算各道路单元污染物排放在该点产生的浓度,然后再求和计算整条道路尾气污染物排放在该点产生的浓度。以道路单元中心为坐标原点,下风向为x轴正方向对整个道路单元建立平面坐标系,则可求出整个有限线源对计算点上污染浓度的贡献。

4.3道路景观的评价指标

   公路景观设计应力争使自然景观与公路工程结构物达到有限的协调,建立起新的完整的公路景观系统。所以道路景观应从使用者的视觉、心理出发,达到公路功能、美观及经济的一致性。目前研究道路景观是采用综合指标的方法,先确定道路景观的评价指标,然后在此基础上对各分级指标进行评价,在对道路景观进行评价时,可以从以下方向考虑[4]:

  (1)通视:要求路线各组成部分的空间位置配合协调,使司乘人员感到线形流畅、清晰、行驶舒适安全。

  (2)导向:建立一个区域性的视觉系统,使司机在视觉所及的范围内,能预见到公路方向和路况的变化,并能及时采取安全的行驶措施。

(3)协调:使公路线形及沿线设施与沿途空间景观环境相协调。

(4)绿化:利用绿化来补充和改善沿线景观。

公路景观可以从以上四个或更多方面计算出道路景观综合评价指数,这样可以较全面和真实的反映道路景观的综合性和复杂性。

随着科学技术的进步以及人们对环境问题认识的逐步提高,环境评价已不再是一项单纯环境科学知识的简单应用,而是已发展成为一项需要综合应用多学科知识及技术。总之,建议加大环境影响评价技术及方法的研究,用先进的科学的技术及方法及可持续发展的思想武装环境评价,使其在促进公路交通建设与环境可持续发展方面发挥应有的功效。

参考文献:

[1]袁卫宁,任征,高等级公路环境影响综合评价[j],西安公路交通大学学报,1999

[2]陆雍森,环境评价[m],同济大学出版社,2002

[3]赵强,简述高等级公路环境影响评估[j],2001

计算机视觉前沿方向篇8

王海涛

(招远市广播电视局,山东招远265400)

摘要:目前计算机中实现三维场景的通用方法是Z-buffer算法。而Raytracing算法是一个相比于Z-buffer算法,更优的三维场景实现算法。该文详细介绍了Z-buffer算法和ray-tracing算法,并进行了比较。

关键词:Z-buffer算法;raytracing算法

中图分类号:tp311文献标识码:a文章编号:1009-3044(2010)22-6341-01

thealgorithmfortheReal-time3DRendering

wanGHai-tao

(ZhaoyuanBroadcasttelevisionBureau,Zhaoyuan265400,China)

abstract:thegeneralmethodforreal-time3DrenderingalgorithmistheZ-bufferalgorithm,buttheraytracingalgorithmisabetteralgorithmthanZ-bufferalgorithm.thispaperintroducestheZ-bufferalgorithmandtheraytracingalgorithm.

Keywords:Z-buffer;raytracing

Raytracing算法是一个相比于Z-buffer算法,更优的三维场景实现算法。该算法巨大的计算量使得现有体系结构并不能完美的实现该算法。而应用与体系结构间是一个先有鸡还是先有蛋的问题。为了更好的实现该算法,必须设计一种新的体系结构来获得更好的结果。

1Z-buffer算法

计算机中实现三维场景的通用方法是Z-buffer算法。Z-buffer有些类似画家演算法,都是以近景遮盖远景的方法来处理深度问题,所不同的是Z-buffer使用的是裁剪(culling)的方法,并以像素为处理的对象,Z-buffer将绘图画布内所有的坐标当作一个深度缓冲区阵列zbuf[]的索引,每一个zbuf[]的元素记录一个像素绘制时的Z深度资讯,可以使用它来处理隐函式的图形绘制。

假设画布大小为600X400(X,Y),则zbuf[]的大小必须设定为600*400=240000(X*Y),一开始时所有zbuf[]元素的值设定为一个极小值,也就是所有的像素都表示空间中一个极深的位置,开始绘制之后,必须在zbuf[]中记录每一个像素的z值。zbuf[]是个一维阵列,所以我们必须计算坐标的索引值,如果以列为主的话,则(x,y)对应的zbuf[]元素值为:zbuf[x+y*画布高度];当然您也可以使用二维阵列zbuf[][]来直接对应。

如果后来要绘制的点之z值大于zbuf[]中记录的值,表示此点在之前所绘点的前面,于是绘制此点来覆盖之前所绘的点,并更新zbuf[]中的z值为目前点的z值;如果后来要绘制的点之z值小于zbuf[]中记录的值,表示此点在之前所绘点的后面,于是不用绘制此点,当然也不用更新zbuf[]中的z值。

2Raytracing算法

要使得三维场景的视觉效果更为真实,则需要引入复杂的照明模型,如柔影、映像、漫射光的相互作用等。而这些在Z-buffer中并没有体现出来。光线追踪算法最先由apple提出:他首先提出按相反方向跟踪光线,即按从观察者到景物的方向。在早些时期的光线追踪算法中,当光线到达一个不可见的非透明物体表面时终止追踪。即光线追踪在早期仅仅用作隐藏面处理或可见面处理。1980年,whitted提出了一种整体光照模型,发展了光线追踪的算法。光线追踪算法利用光线照射的可逆性原理,沿观察者的视线方向跟踪画面中景物投射光线,求出每一投射光线与环境景物的交点。光线在交点处分成2条:一条沿反射方向,另一条沿折射方向,再继续对2条光线进行跟踪,每求出一条光线与物体的交点,就由已知环境条件求出该点光强。而反射、折射光与景物交点处的光强也应同样跟踪下去,直到光线跟踪出画面或到达指定深度。

对于每个采样点(像素)可建立一个光线/物体相交点组成的光线树,这个像素最后光强的确定是通过搜索这棵树,并根据一定的光照模型计算每个结点的值,树根的值便是这个像素的光强值。

若一条从视点出发的光线穿过某个像素,在这条光线到达光源之前遇到了物体,那么,物体就挡住了这个像素,因而这个像素就处于阴影之中。

3小结

本文详细介绍了三维场景实现的两个主要算法:Z-buffer算法和raytracing算法。可以发现,ray-tracing算法是一个比Z-buffer算法更优的算法,所反映的三维场景更加真实,但是,ray-tracing算法庞大计算量使得现有的体系结构很难适应ray-tracing算法。需要新的体系结构与之适应。

参考文献:

计算机视觉前沿方向篇9

关键词:高速公路;景观绿化;设计;施工

abstract:thispaperanalyzesthebasicideasandprinciplesofexpresswaygreeningdesign,andputsforwardthegreeningdesignandconstructionmethodforthemainproblemsexistingincurrentexpresswaygreeningdesignofexpresswaylandscape.

Keywords:expressway;landscape;design;construction

中图分类号:U415文献标识码:文章编号

1、高速公路景观绿化设计的基本思路

高速公路景观绿化工程在规划设计时,公路本身与附近建筑物、生活环境的协调性及自然生态环境的维系均衡,是现代公路工程设计必须兼予考虑的重要课题。高速公路车速快、行车道多,设置中央分隔带,采用立体交叉,控制出入和具有较为完善的安全防护设施,同时沿线服务设施多,特殊工程如桥梁、隧道也多,所以高速公路景观绿化合理设计选择,使公路与通过地区的自然、景观相协调具有更为重要的意义。公路景观绿化设计就是从使用者的视角、心理出发研究公路的功能、美观及经济的一致性,同时综合考虑以下几个方面:

1.1通视:要求路线各组成部分的空间位置配合协调,使司机感到线型流畅、清晰、行驶舒适安全。

1.2导向:建立一个区域性的视觉系统,使司机在视觉所及的范围内能预见到公路方向和路况的变化,并且采取完全的行驶措施。

1.3协调:使公路线型及沿线设施与沿途空间景观环境相协调。

1.4绿化:应充分利用绿化来补充和改善沿线景观。

2、高速公路景观绿化设计的原则

2.1体现区域人文特色原则

我国地域辽阔,历史悠久,民族众多,山河秀美。高速公路景观设计应充分反映公路沿线的自然景观,风土人情,历史文化等,同时对不同的区域环境分段做出相应的、具有各自独特风格的设计。

2.2满通功能的原则

高速公路景观绿化设计对于公路使用者来说应首先满足安全性、高速性和服务性,其次是满足舒适性、观赏性和愉悦性。即满足公路使用者良好的视觉效果与观赏要求的同时,更要满足人们出行最基本的交通功能需求。实现交通行业“用户第一,行者为本”的核心价值。

2.3树立预防为主的原则

公路建设应树立可持续发展的新理念,公路线形应维护自然界势的延续,尽量降低公路建设对原始地形、地貌的自然性和稳定性的影响。坚持最大限度地保护,最小程度地破坏,最强有力地恢复,实现公路建设与环境保护并重,公路自身景观与自然环境和谐。

2.4服从动态性的原则

高速公路景观绿化设计工作应贯穿工程设计和施工的整个过程,动态跟踪,不断完善。同时景观绿化设计应与周围自然风光有机融合,努力营造公路“动”感行使氛围,使景观形成优美、顺畅、连续的三维空间动画,让公路使用者达到“车在路上行,人在画中游”的感觉。

3、目前高速公路景观绿化设计中存在的主要问题

3.1设计存在形式主义

一些高速公路景观绿化设计人员在设计中缺乏整体意识和宏观感,经常套用已建高速公路的景观绿化设计,而忽视了结合实际地形地貌以及沿途风土人情。他们往往过分注重高速公路的主体设计,对景观绿化设计相对不够重视。

3.2绿化植被材料品种单一,甚至选择不当

在我国有些省市高速公路两旁沿线上百公里同是一种树木,形式单一,片面强调视觉效果和设计方便,忽视恢复自然生态环境,容易造成过往旅客和驾驶人员视觉疲劳和不良情绪。这种单一的品种,必定会带来植被不当的后果。适当的路段应选择适当的植被材料。

3.3高速公路景观绿化设计没有与路基路面及其它附属工程设计同步进行有些高速公路建设工期甚至忽略了景观绿化设计,误以为高速公路通车即算完工,或流于形式,只是做一些简单绿化处理。

3.4忽视高速公路景观绿化施工

有些高速公路路段土石,杂物狼籍,在施工过程中两侧留下了大面积废弃土石方,甚至周边植被反而被大量破坏。

总之,高速公路景观绿化设计应当从设计、施工、管理和维护各个方面着手,加强设计人员责任心和设计水平,控制景观绿化施工质量,加大景观绿化后期管理和维护的投入,重视初期投入,注意年年投入。

4、高速公路景观绿化设计及施工方法

4.1线形设计

高速公路建设对自然景观的影响主要表现在公路线形与自然景观的协调一致上,因此在公路设计中合理掌握标准,灵活运用指标,注重平纵线形配合,提高线形流畅性及与自然地貌的协调性,保障交通安全和为公路使用者提供舒适的动态景观环境是十分重要的。

4.2路基设计

认真研究地形条件,深化工程设计方案。对于地面横坡较陡的地形,横断面为半填半挖,若路基挖方边坡高度超过40m,工程量较大时,就不能单纯地采用整体式断面,应寻求合理的断面形式,考虑采用分离式路基,或半桥半路式,或半桥半隧式等方案,避免或减少深路堑高边坡及高路堤工点。对于路基填高大于20m,挖深大于30m的路段,原则上采用桥、隧方案,以减少对环境的影响。

4.3桥梁设计

桥梁目前已成为许多大城市的主要标志性建筑之一,是重要的旅游景点,桥梁等构造物在塑造公路的风格中也同样扮演者重要角色。高速公路大型桥梁一般都是位于地形复杂地段,或跨越江河,或跨越沟谷,或桥隧相接,因此大型桥梁的桥位、桥型、跨度、结构的比选,应与路线方案、桥隧方案综合考虑,做好环境保护设计和总体设计。合理地运用梁桥、拱桥、悬索桥等桥型,更好地配合地形环境景观。同时桥梁护栏、桥面设施等附属工程同样影响着乘客的视觉效果,设计时也应给予重视。

4.4隧道设计

隧道的洞门是隧道的标志,也是隧道唯一的外露部分。隧道景观设计的重点就是处理好隧道洞门与周围自然景观的和谐统一。隧道进出口的设计要追求自然,要提倡早进洞、晚出洞,与自然地形坡面平顺衔接,按照“整体协调性和自然性原则”进行设计,不强调人工化,不提倡宏大、雄伟、醒目,应提倡简洁、隐蔽、淡化。“零”开挖的理念是隧道工程设计及施工技术发展和环境保护的要求。

4.5交通安全设施设计

交通安全设施设置的目的是以“人为本、以车为本”,强调保障高速公路使用者的安全,同时交通安全设施应与周边环境相协调,成为美化路容的重要因素。其设计应在充分尊重公路及所在路网的道路条件、运营环境及对公路使用者需求进行分析的基础上,采用“灵活、宽容、创作”的设计手段,使安全设施的设计更具有针对性、合理性和观赏性。交通标志作为公路行车的主动引导设施,应将公路沿线的信息及时、准确地传达给公路使用者,其设置应注重系统性、一致性和视认性,整体结构应与道路宽度和周边景观相协调。护栏应力求简洁、通透、和谐,同时有条件的情况下,可增大路侧安全净区,取消护栏,通过绿化美化路容。服务区和停车区应符合新时期高速公路要求,规划应科学合理,结构紧凑、功能完善。建筑应独特新颖,同时又能体现当地人文特点。

参考文献

[1]程胜高.高速公路环境评价与发展[m].中国环境科学出版社,2002.

计算机视觉前沿方向篇10

关键词:openCV;人脸检测;实时

中图分类号:tp391.41

人脸检测(FaceDetection)是指对于给定的图像或视频,采用一定的策略对其进行搜索以确定其中是否含有人脸,如果是则返回一脸的位置、大小和姿态。人脸检测是人脸识别的重要环节,运用摄像机或摄像头采集含有人脸的视频流,并进行实时的人脸检测是目前主流的应用。

openCV(openSourceComputerVisionLibrary)是开源的计算机视觉代码库,它轻量级而且高效,由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉的接口,实现了图像处理和计算机视觉方面的很多通用算法[1]。

1系统设计

本系统采用了openCV的基于boost筛选式级联Haar分类器,该分类器是通过成千上万的物体各个角度的训练图像训练出来的,它先对图像进行直方图均衡化处理,并将图像归一化到同样大小,然后标记是否包含要检测的物体,在人脸检测方面比较擅长。系统加载分类器后,利用openCV的视频捕获函数实时捕获连接在电脑上的摄像头读入的视频流,并将抓取的视频帧转换为图像,然后对图像进行人脸检测和标定,具体流程图如图1所示:

图1系统流程图

2系统实现

本系统在windowsXp操作系统下使用VC++6.0基于openCV1.0进行开发。系统具体实现如下:

(1)初始化声明。通过CvmemStorage*captureFaceStorage=cvCreatememStorage(0);语句创建一个内存存储器,来统一管理各种动态对象的内存,参数为0时创建的内存块默认大小为64k。然后分别声明分类器对象、图像对象级联名称及识别函数等成员:

StaticCvHaarClassifierCascade*cascade=0;

iplimage*frame,*frame_copy=0;

Char*captureFaceCascade_name=haarcascade_frontalface_alt2.xml;

(2)加载分类器。通过cvLoad函数,加载调用CvHaarClassifierCascade类的分类器文件“haarcascade_frontalface_alt2.xml”:

cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);

(3)捕获视频。通过cvCreateCameraCapture函数捕获摄像头,捕获视频后循环执行抓取帧操作cvGrabFrame(cap)和获取图像操作cvRetrieveFrame(cap)操作,从而将帧转换成图像,以便于处理。

(4)图像格式转换。一般从硬盘读入的图片或者通过cvCreateimage方法创建的iplimage图片默认的origin属性为0,即显示的时候都是正的。而由摄像头或者视频文件获取的帧图像origin属性为1,此时显示的图像扫描顺序是从下到上,它会将帧图像的第i行赋值给图像的第height-i行,因此采集的图像会出现倒立现象,为此,应将复制的图像的origin属性调整为与帧图像的origin属性一致。此时需要使用cvFlip(frame,frame_copy,0)函数,实现对帧图像沿X轴的翻转。

(5)识别与检测人脸。本部分主要实现人脸检测功能,首先将从实时视频中提取的图像进行灰度化处理:

然后调整新图像gray,使它精确匹配目标small_img的大小,并利用cvequalizeHist函数进行灰度图像直方图均衡化处理,最终通过cvHaarDetectobjects函数检测出人脸:

(6)标定检出的的人脸。绘制目标圆形区域,标定出检测出的人脸:

最后通过cvShowimage("result",img)显示出检测后的图像,如果检测到人脸,显示效果图。

3结束语

基于的摄像头实时人脸检测系统的实现充分说明了openCV技术在实现人脸检测方面的效率高、功能强的特点,openCV必将在计算机视觉、图形图像处理领域有着广泛地应用前景。

参考文献:

[1]GrayBradski,adrianKaebler.LearningopenCV:ComputerVisionwiththeopenCVLibrary[m].USa:oReillymedia,2008.

[2]梁路宏.人脸检测研究综述[J].计算机学报,2002(05):449-458.

作者简介:徐占鹏(1979.01-),男,山东栖霞人,讲师,硕士,研究方向:计算机应用、计算机图形图像处理和计算机视觉。