计算机视觉心得体会十篇

发布时间:2024-04-26 01:45:57

计算机视觉心得体会篇1

[关键词]计算机视觉视觉框架三维表示

中图分类号:tp338.6文献标识码:a文章编号:1009-914X(2015)47-0133-01

1计算机数字视觉技术研究的地位

长期以来,人类持续不断地试图从多个角度去了解生物视觉和神经系统的奥秘,这些努力的阶段性理论研究成果已经在人们的生产生活中发挥了不可估量的作用。计算机视觉(CV)研究的主要内容是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息,进而完成诸如在复杂的环境中识别和导航等任务。计算机视觉研究的重要性是不言而喻的,会产生深远的经济和科学的影响。

20世纪下半叶以来,很多研究者都曾试图通过视觉传感器和计算机软硬件模拟出人类对三维世界图像的采集、处理、分析和学习能力,以便使计算机和机器人系统具有智能化的视觉功能。今天,数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种图像处理与分析的需求和应用也不断促使数字视觉技术的革新。数字视觉技术的应用十分广泛,如数字图像检索管理、医学影像分析、智能安检、人机交互等。

数字视觉技术是人工智能技术的重要组成部分,也是当今计算机科学研究的前沿领域,经过近年的不断发展。已逐步形成一套以数字信号处理技术、计算机图形图像、信息论和语义学相互结合的综合性技术,并具有较强的边缘性和学科交叉性。

2计算机数字视觉技术研究的核心问题

视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。如何攻克图像信息提取过程中的各种难题一直是当今计算机图像学研究的热点问题,而且在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数问题只能采用逆向推导机制,依据已知或假设的关联将视觉系统的输入数字图像和输出语义描述对应起来。基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前领域普遍采用各种统计模型和机器学习算法的本质原因。

物体的三维表示是计算机视觉研究的一个关键问题。八元树(octree)表示法是一种紧凑、简洁的物体三维表示法,近年来这种表示法被广泛地应用到计算机视觉的研究领域。广义八元树表示法的优点是不受视图个数的限制,通过增加观察方向可以计算出更加精确的物体三维表示。主要缺点是需要进行多次坐标变换,在计算机上实现时需要研究相应的离散技术。线性八元树(linearoctree)是较八元树更加简洁的表示形式。

3计算机视觉技术结构及其研究基本框架

计算机视觉技术内在的逆推机制决定了其在系统开发时必须将原始图像数据与其蕴含的知识之间的语义鸿沟加以弥补,在满足特定应用需求的前提下进行合理的图像内容简化和假设,形成目前普遍使用的计算机视觉系统结构:即图像数据层、图像特征描述层及图像知识获取层。由于各种图像特征都有其优点及不足之处目前趋势是结合不同种类的特征对图像内容进行综合表述,以建立较为可靠的图像信息模型,比如利用时空体数据结构对人体行为等视频内容进行描述。

计算机视觉技术的研究主要围绕着四个基本理论框架:以marr视觉计算理论为核心的深度重建框架;以感知特征群集为主线的基于知识的视觉框架;以“感知一动作”为基础的主动视觉理论框架;以综合集成理论为指导的视觉集成框架。其中,视觉集成理论框架是计算机视觉研究中一个较新的理论框架,并越来越多地受到cv研究者的关注。视觉集成理论的研究内容大致可以分为三个方面,第一方面的研究内容是关于视觉信息与其它类型信息的集成。第二方面的研究内容是关于视觉表示和视觉模型的集成。视觉表示方法主要分为三类:图像表示、表面表示、物体表示。视觉模型王要分为图像模型、结构和形状模型、运动和动态模型、不确定性模型。集成的视觉系统应该能够充分利用这些方法的优点。第二方面的研究内容是系统的集成。

4计算机视觉的发展历程及其趋势

一般认为,计算机视觉技术研究始于20世纪50年代中期,当时的努力主要集中在二维景物图像的分析。区别在于,图像处理的目的是通过处理原始图像得到在某一方面更有利的新图像。模式识别关心的则是将一些模式归入预先定义的有限类别中,主要研究的是二维模式。而计算机视觉主要考虑的是对三维世界的描述和理解。

一般来说,比较一致的观点认为,计算机视觉的研究起始于1965年Rboesrt开创性的工作。Rboert对“积木世界”研究取得的成功激起了人们很高的期望。

60年代末70年代初期,计算机视觉研究领域的很多工作是关于低层视觉处理,从图像中提取重要的强度变化信息――边缘检测。然而,人们很快就认识到很多重要的物体属性无法只通过分析图像的灰度变化得出。到了70年代初期,问题更加明朗化,低层视觉处理无法从单幅图像中普遍地获取对景物的有用描述,计算机视觉的研究领域普遍地发生危机。为了摆脱困境,计算机视觉迫切地需要有一个统一的理论框架作指导。70年代中期到80年代初期,计算机视觉的研究领域首次出现了一个理论框架:视觉计算理论框架,将视觉系统从概念上分成几个独立的模块。80年代后期,计算机视觉的研究领域出现了主动视觉(`vtievsiino)的理论框架。

近年的研究结果表明,单一的图像特征描述机制,无论是对底层像素级特征的描述还是顶层语义特征的描述。都仅能在有限范围内对图像的内容进行建模。巧妙融合多种图像特征因此成为近年图像信息描述方面的主要趋势,近年来,计算机视觉的另一个理论框架――视觉的集成方法越来越多地受到重视。一个重要的趋势是用于识别真实世界中较为复杂的图像内容的技术,适合描述真实场景的各种特征不断得到发展。随着目前互联网络技术的不断发展,另一个值得重视的趋势是计算机图像技术与互联网技术、社交媒体技术等其它计算机技术的融合。

6结语

计算机视觉识别技术虽然是一门新兴学科。但应用前景十分广阔,对其技术的有效性、易用性、实时性及稳定性能等方面有着较高的要求。因此。其技术面临着前所未有的机遇和挑战,该领域的发展亦有过激烈的争论和反思。但是,不可否认的是,计算机视觉技术研究在许多应用领域的应用前景都是广阔的、不可估量的。

参考文献

[1]马玉真,陶立英,王新华.计算机视觉技术的应用[J].试验技术与试验机.2006(01)

[2]潘春洪,张彩霞.计算机视觉简述[J].自动化博览.2005(05)

[3]孙瑾,顾宏斌.计算机视觉系统框架结构研究[J].计算机工程与应用.2004(12)

[4]王天珍.计算机视觉研究进展[J].武汉汽车工业大学学报.1998(01)

计算机视觉心得体会篇2

〔关键词〕课件设计;色彩;心理影响

〔中图分类号〕G44〔文献标识码〕B〔文章编号〕1671-2684(2010)08-0023-02

一、课件与多媒体课件

课件是指具备一定教学功能的计算机辅助教学的教学软件。多媒体课件是指应用了多种媒体的新型课件,它是以计算机为核心,交互地综合处理文字、图形、图像、声音、动画、视频等多种信息的一种教学软件。随着现代教育技术在各类教学中的广泛应用,多媒体课件的设计与制作已成为一个重要的理论与技术课题。即如何使多媒体课件发挥它预想的功效,真正起到提高教学效率和效果的作用,而不是一种教学的附属品。

心理学家赤瑞特拉做过一个关于人类获取信息来源的实验。他通过大量的实验证实:人类获取的信息83%来自视觉,11%来自听觉,3.5%来自嗅觉,1.5%来自触觉,1%来自味觉。而这83%的视觉感受中,最先引人注目的就是它的色彩效果。在现实生活中,色彩几乎是人们不可缺少的视觉感受,学习者对多媒体课件的第一印象来自于视觉,一个多媒体课件设计成功与否,在某种程度上取决于设计者对色彩的运用和搭配。因为多媒体课件设计属于一种平面效果设计,在平面图上,色彩的冲击力是最强的。但由于一些教师缺乏色彩美学和色彩心理学的相关知识,一些课件的内容相当好,但由于配色不科学,在使用中容易造成学生心情压抑、注意力不集中、易形成视觉疲劳等问题,直接影响了教学效果。

二、色彩选择的误区

在色彩选择的问题中,一般会出现这样两个误区:一种是认为色彩只是课件设计中一个可有可无的因素,表现在选择色彩时随心所欲,盲目性大。另一种是,将课件设计的色彩选择等同于艺术设计,只考虑色彩的艺术性,而忽视了色彩对学习者的影响。这两种倾向无论哪一种都是不足取的。为了更好地选择计算机色彩,我们应对计算机色彩显示的方式作一个简单了解。

1.计算机色彩的组成。与美术中的光谱不同,计算机显示的色彩的组成方式不是采用“红、黄、蓝”三原色的方法,而是采用“RGB”模式,即“红、绿、蓝”三原色为基础的显示。虽然通过pHotoSHop等专业图形处理软件的转化,能够将计算机显示的“RGB”模式转为纸质印刷所需要的“CmYK”(青、洋红、黄、黑)四色模式。但是在实际的计算机屏幕呈现时,是不可能显示纯净的“黄色”和“青色”的。

2.色彩对学习者心理的影响。色彩是一种对观察者有强烈情绪影响和心理暗示的视觉因素,色彩心理学也是一门专门研究色彩心理影响的学问。红、蓝、黄三原色以及由三原色直接混合的二级色彩可以被分为冷色调(如:蓝色、紫罗兰色、墨绿色、浅蓝、青色等)与暖色调(如:红色、桔红色、黄色、洋红色、黄绿色等)两种。心理学研究表明,冷色调会减缓人们的时间知觉,使人们对事物的视觉注意力得到持续,与之相反,虽然暖色调在初期比较容易得到视觉注意,但是由于其加快了人们的时间知觉,长时间注意容易使人产生视觉疲劳。还有一类中间色调(如:黑色、白色、灰色、褐色等),这些中间色调也具有比较稳定的情绪特征。当然,每一种色彩都有与之对应的具体情绪体验,在这里不一一叙述。

三、多媒体课件中的色彩搭配

1.色彩的总体构想。一个课件所具有的统一色调,对于统一课件的整体风格,保持学习者一致的稳定的学习情绪是十分必要的。将你的课件色彩选择控制在三到四种色彩之内,其中一种为背景色。色彩的总体构思是设计色彩的初步阶段,形态、布局、色彩是在一定的创作设计命题下同时要考虑的。一般来说,形态和布局在先,设色在后,根据设计内容选择恰当的形式,色彩处理一定要推进内容的完美表现。设计色彩的总体构思可以从以下几个方面进行。

首先,要考虑教学内容和教学对象。内容决定其形式,根据不同的内容明确要求。其次,考虑营造怎样的氛围。例如是热烈的还是温和的,是含蓄深沉的还是活泼开朗的,是欢快的还是宁静的等。最后,确定主色调。确定基本色调是色彩设计的第一步,也是关键性的一步。色彩设计的成败在于是否较好地确定了主色调以及处理了主色调和从属色之间的色彩关系。不平衡的和谐也是设计色彩不可缺少的。

2.背景色彩的选择。背景是整个课件的色彩主体,运用得恰当与否直接关系到课件制作的质量和教学效果。用得好,能够减轻视觉疲劳,反衬重点内容,激发学习情绪,稳定注意力;反之,则使人产生烦躁情绪、兴奋过度、注意力容易涣散。例如在制作文字及概念性内容很多的课件时,背景不是教学内容,故背景应尽量选用中性色和偏冷的颜色以适当转移色彩注意力。这样的背景看上去干净整洁而不光滑反光,不会对视觉造成强烈刺激,会使学生产生一种冷静的感觉,能够以平静的心态阅读大量的文字、概念、公式;相反,若以色彩较纯的红、绿、蓝等色作背景,就会非常刺眼,并且背景对字体色彩的饱和度会形成一定的干扰,不宜把学生的注意力集中到教学内容上。因此建议背景色彩不宜太花太杂乱,尽量少用复杂的、刺眼的色块去堆叠一些鲜亮的过渡色。另外,背景的色彩设计风格要统一。人的视觉生理本能地要求色彩的统一,若没有统一及和谐,没有主色调的杂乱色块和噪音一样,会对人的视觉产生不良刺激,使人的视神经很到疲劳,进而产生厌烦感。

计算机视觉心得体会篇3

 

1计算机视觉定义

 

人类天生具有五感,视觉便是其中之一,而计算机视觉,就是让计算机网络能够睁开眼看世界。让计算机有一定的视觉能力,可以从各个方面帮助人们进行监督、检验检测。利用计算机视觉科学可以使工作变得更加简便。计算机视觉主要应用于对二维码、条形码、照片、视频资料如片段等进行智能处理。

 

2计算机视觉研究在医疗、交通中的作用

 

随着医学成像技术的发展与进步,图像处理在医学研究与临床医学中的应用越来越广泛。最常见的有癌细胞显微图像分割与识别、基于多特征融合的血红细胞识别和乳腺癌细胞计算机的自动识别等。计算机视觉技术的迅猛发展,为医疗诊断带来了很大的方便,同时促进了临床医学的发展。另外,在各大综合医院慢慢发展起的体检体系中,计算机视觉技术起到了决定性因素。随着体检的人数上升,对医院体检的管理、速度、准确性都提出了更高的要求。视觉识别轻而易举的解决了这个问题,只需要去识别体检人员的身份证,就可以将体检人员对号入座,检查过的项目,没有检查的项目一目了然。理化指标的检验,只需要在采血试管或采尿瓶上粘贴与体检者对应的条形码即可,利用视觉技术对号入座,方便而准确的确定每一位体检人员的血样及尿样。及提高了医院的工作效率,又将错误率降到最低。

 

计算机视觉在交通上同样得到了广泛的应用及发展。交通安全是交通运输中的重大问题,随着近年来机动汽车数量的迅猛增长,交通事故的发生也随之越来越频繁,给人类社会带来的危害也日趋严重,使很多的家庭失去亲人,甚至家破人亡。全国一线城市例如:北京、上海、广州、深圳等交通道路供需的矛盾日趋严重,交通安全、交通堵塞及环境污染已成为困扰我国交通领域的三大难题。基于图像处理的计算机视觉技术是通过摄像机获取场景图像,并借助于计算机软件构建一个自动化或半自动化的图像、视频理解和分析系统,并提供及时准确的图像、视频处理结果,以模仿人的视觉功能。主要功能如下:

 

一是基于计算机视觉技术的车辆牌照自动识别:车辆牌照是车辆的唯一身份,对车辆牌照的有效检测与识别在车辆违章检测、停车场管理、不停车收费、被盗车辆稽查等方面有着重要的应用价值。尽管针对车牌识别技术的研究相对成熟,然而在实际的应用场景中,受到天气、光照、拍摄视角、车牌扭曲等因素的影响,车牌识别技术仍然有一定的改善空间。

 

二是基于计算机视觉技术的车辆检测与流量统计:目前城市交通路口的红路灯间隔时间是固定的,而不同路段、不同时间段交通流量是随机变化的。若能根据各个交通路口的交通状况辅以计算机进行自动分析,并判断与预测交通流量,无疑为交通警察出警,红绿灯时间间隔的动态设置等提供技术支持。

 

三是基于计算机视觉技术的公交专用道路非法占道抓拍:公共交通是每个城市交通的重中之重,城市的公共交通为老百姓提供了便捷的出行方式。公共交通的发展,有利于城市的节能减排,有利于降低城市的空气污染指数。由于城市公共交通具有运量大、相对投资少、人均占有道路少等优点,解决城市交通问题必须优先发展城市公共交通。然而目前拥挤、缓慢的公交出行方式已成诟病,因此发展“快速公交”将是未来公交的一种运行模式。道路畅通则是发展“快速公交”的前提,相应地,公交专用车道的设定必不可少。为防止其他社会车辆的驶入,并对违规驶入的其他社会违规车辆进行抓拍与惩罚是保证公交车道公交车专驶的一种重要手段。因此在公交车前部装置摄像头并辅以其他处理设备,从而可以使得每一辆公交车成为了一个流动的监控设备。

 

3计算机视觉在条形码检测中的应用

 

条形码是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。在中国,由中国物品编码中心赋予制造厂商代码。那么最常见的计算机视觉应用与条形码检测就是在超市中。超市中每样产品都有自己的条形码,当人们选择了自己需要的物品后,来到收银台进行结账,我们会看见收银人员会用扫码器对物品的条形码进行扫描,扫描后就会出现产品的信息及价钱。记录以及扫描条形码的技术就是计算机视觉技术。

 

4计算机视觉重要技术——智能识别

 

近年来,基于生物特征的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。指纹、人脸功能已经大范围在生活中应用,其中很多单位的打卡制度就是依据面部识别、指纹识别来实现的。社会飞速发展的今天,很多的单位都实行了上下班打卡制度,这一制度已经被作为单位管理制度中的重要一条。购买的打卡机就是采用计算机视觉的重要技术——智能识别来实现的。利用打卡机的储存功能,记录每个职工的指纹或面部容貌,规定在某一个时间范围内对应识别指纹或面部容貌,视为打卡。在上下班打卡的过程中,员工将面部或指纹对应在打卡机的制定位置上,让打卡机进行识别,当识别的结果与存储结果相同时,打卡成功。这样看起来十分简单的打卡机可以使单位的工作有序化,制度化,而实现这个功能的技术就是计算机视觉技术中的重要技术之一:智能识别。

 

5计算机视觉技术的发展过程及未来

 

计算机视觉技术研究经历了近40年的过程,20世纪50年代的统计模式识别、60年代的Roberts的三围积木世界、70年代的marr为代表的计算理论、80年代的主动视觉,但是仍然面临许多的问题。主要由于计算机视觉是一个逆问题,视觉信息多种多样,视觉知识的表达很困难,图像数据量巨大,信息存储于检索困难,对生物学、神经生物学等的研究有待深入。

 

计算机视觉技术的未来必定会朝着高科技发展,航空遥感测控地形地貌、电影特效制作、工业生产自动化检测、医学影像检测,再到天文领域等,在这些科学领域中计算机视觉将无法取代,成为主流的技术之一。

 

作者简介

计算机视觉心得体会篇4

关键词计算机;视觉技术;应用研究

中图分类号:tp212文献标识码:a文章编号:1671-7597(2013)16-0114-01

计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。

1计算机视觉技术

计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。

2计算机视觉技术在各领域的应用分析

随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。

2.1在工业领域中的应用

工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。

2.2在农业生产领域中的应用

该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。

2.3在林业生产中的应用

该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。

2.4在农产品检测中的应用

农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。

2.5在电力系统自动化中的应用

计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。

2.6在图书馆工作中的应用

随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。

3结束语

通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。

参考文献

计算机视觉心得体会篇5

基于FpGa的机器视觉系统具有良好的性能、能耗低而且体积小,在视觉系统中具有良好的应用前景。文章对FpGa在机器视觉系统中的应用做了一些介绍,并指出了还存在一些问题,需要经过不断研究和发展。

【关键词】FpGa视觉系统算法

【关键词】FpGa视觉系统算法

1前言

机器视觉系统一般要处理一系列的信息才能获得有用的信息,它利用机器替代人的眼睛进行测量和感官。这是一种仿造人类视觉和大脑的系统,具有高度的自动化性能,所以机器视觉系统系统的发展程度也被当做现代工业发展水平的衡量标准之一。随着计算机技术的不断发展,特别是数字图像处理、多媒体、集成电路的飞快发展,机器视觉系统在各领域中应用越来越广泛,并得到了广泛的认可。

机器视觉系统一般由三个主要部分构成:图像的获取、处理和分析以及输出,这些主要是通过计算机处理。然而,受到计算机CpU的限制,那些计算非常复杂的视觉算法很难及时有效地得到解决,很难满足系统的正常需求。虽然现在有些计算机采用GpU,具有很高的计算速度,但是它同样有体积大、功耗高等不足之处,很难利用自身携带的电池进行长时间的运作。

专用集成电路aSiC(applicationSpecificintegratedCircuit)的应用可以很好地解决机器视觉系统的功耗、体积及其性能之间的问题,但是,它具有很长的开发周期,不方便修改,并且不能广泛通用。

FpGa(FieldprogrammableGatearray)是一种高性能的可编程控制的逻辑器件,它的内部逻辑能使用编程的方法来实现,操作较简单方便,能实现高速计算的同时,也具有较低的功率消耗,这方面远远优于CpU和GpU视觉系统(前者通常功耗在1w以下,后两者一般可以达到100w)。所以,随着FpGa技术不断发展,它在视觉机器中应用越来越广泛,是视觉系统重要的发展方向。

2FpGa上实现低层图像处理算法

低层图像处理包括了图像滤波、边缘检测等最基本的图像处理运算,它们一般需要大量单一的运算,并且可以同时并行运算,这些特点非常适合FpGa来操作。

2.1图像滤波与降噪

图像滤波的主要功能是将图像平滑化处理以及降低其噪音等,这是在图像处理中最常用的一种方法。滤波一般使用基于窗口操作的流水线结构,其中一种具有高效的结构方案是Systolic,它不仅具有普遍滤波适用性,还能够实现图像的灰度形态学操作,完成图像匹配等多种功能。

图像滤波主要采用卷积运算,卷积的计算方式为:(1)卷积核绕自己的核心元素沿着顺时针的方向旋转180°;(2)将卷积的核心元素移到输入图像等待处理的像素的上方;(3)在卷积核中,使用输入图像的像素值作为权重进行乘法运算;(4)将(3)中计算的结果进行相加,所得的和作为输出像素。FpGa的内部图像卷积核在设计过程中,其窗口大小、参数、输入像素字长以及图像大小是可以调节的,可以满足用户不同的图像处理需求。

图像滤波还有其他的一些方法,例如使用FpGa可以实现中值滤波、小波域图像降噪以及基于遗传算法的滤波等等,它们都能大幅提高滤波的某一或者多方面的性能要求。

2.2边缘检测

边缘检测主要是为了检测出数字图像中亮度变化十分明显的点,这些点一般能够反映出事物的重要事件和变化,主要有深度断裂、方向不一致、照明条件改变等等内容。边缘检测能够去掉那些与图像不相关的信息,从而有效地减少数据处理量并且不会改变图像最重要的结构信息。

Canny算子可以有效地处理受白噪声干扰的阶跃型边缘,它包括了去噪声、寻找图像中的亮度梯度以及在图像中跟踪边缘等步骤,但是这种算法有点复杂。将FpGa应用到Canny算法中能优化检测效果。

3利用FpGa实现特征点提取和图像匹配

特征点提取和图像匹配与上面所述的低层图像处理不同,它是较高层的操作,在它的基础之上可以实现物体识别、三维视觉以及目标跟踪等。

3.1SiFt算法

SiFt算法是ScaleinvariantFeaturetransform的简称,它能够实现图像的平移、旋转以及尺度不变等功能,运用此算法能正确定位特征点,还能提取良好的特征描述符,以实现对特征点良好的匹配。然而这种算法十分复杂,在计算机上运行时需要耗费大量的时间,难以满足用户的及时要求。

将计算机的硬件和软件进行合理的分工协作,发挥FpGa的并行计算能力可以有效解决SiFt算法的速度问题。采用硬件计算来实现特征点的定位检测,使用niosii软核的计算提取特征描述符。使用这种方法,对于320x240的图像处理时间不会超过0.8ms,可以满足用户的一般需求。

3.2图像匹配

图像匹配是使用一些算法来识别两幅或两幅以上图像中的同名点,它包括灰度匹配和特征匹配,使用的方法有基于块匹配和基于频域匹配等。

基于块匹配的计算方法中,将两幅图像中两个相同大小的块的灰度值进行比较,并计算差值的绝对值,然后将这些值求和。在硬件上,可以采用静态、动态以及半动态三种不同的结构方式来实现图像的匹配,而动态结构可以改变FpGa的内部逻辑以适应实物形状和模板大小。

4FpGa实现立体视觉算法

立体视觉就是将系统获取的两幅或两幅以上的图像中还原出实物的三维模型,以获得其三维深度信息。立体视觉算法需要解决的最主要问题是对应点的匹配。在FpGa中,可以使用SaD的块匹配方法,选用尺寸变化的窗口,并选择平行匹配区域,在各个窗口中均使用树状结构,方便并行操作。也可以采用相位相关算法或其他基于频域的匹配方法,它们在处理噪声和变形问题时,具有更好的优越性。

5结语

机器视觉系统一般需要具有良好的性能、较低功率消耗以及体积小等优点,基于FpGa的视觉系统完全能满足这种需求。但是它同样存在着实际应用系统较少、算法模块化程度较低等缺点,相信经过不断研究,这些问题能够得到很好地解决。

参考文献

[1]陈炜,白瑞林,赵洁.嵌入式机器视觉检测软件的构件化设计[J].自动化仪表,2011(10):103-105.

[2]张翼成,屠大维,赵其杰.机器视觉摄像机标定的一般正多边形方法[J].应用科学学报,2010(8):58-62.

[3]罗露,胡跃明.基于机器视觉的FpC嵌入式检测系统[J].计算机测量与控制,2011(11):32-36.

计算机视觉心得体会篇6

[关键词]物流企业;自动化;算法

[中图分类号]F252;tp39[文献标识码]a[文章编号]1673-0194(2013)06-0058-03

0引言

随着物流业被列入我国十大行业振兴计划,物流业已经成为我国经济发展的不可缺少的重要组成部分。物流业是我国经济运行的基础,是推动国民经济发展的重要支柱性产业之一。随着国家持续加强和改善宏观调控政策,物流业发展环境和条件不断改善,物流业保持了较快的增长速度。但由于中国物流业起步较晚,存在物流成本较高、管理落后等问题,离一体化、信息化的物流业还有一定差距。中国物流业只有应用现代物流的理念,采用先进的信息技术与运作方式,才能应对拥有技术、资金和管理优势的外国企业的竞争。实现传统物流业向现代物流业的转变,也是物流业自身结构调整和产业升级的需要,是整个国民经济发展的必然要求。我国经济要集约式发展,必然需要推进现代物流。现代物流的根本宗旨是降低物流成本、提高物流效率、满足客户需求,其中信息化是现代物流的核心。随着信息技术的不断更新和物流企业自身的发展,使得新兴的信息业务与传统物流业务之间相互介入,模糊了新兴信息技术及业务与传统物流业务的界限,从而模糊了物流业的产业属性和产业界限,即发生了产业融合现象。产业融合是由于技术进步和放松管制的原因,发生在产业边界和交叉处的技术融合,在经过不同产业或行业之间的业务、组织、管理和市场的资源整合后,改变了原有产业产品和市场需求的特征,导致产业的企业之间竞争合作关系发生改变,从而最终造成产业界限的模糊化甚至重划产业界限。

产业融合促进了传统产业创新,进而推进产业结构优化与产业发展,即产生创新性优化效应。物流信息化的重要性已经引起国内很多学者的重视,并纷纷提出相应的观点和建议。马健(2005)认为物流企业将在建立呼叫中心、应用系统领域和网络计算机领域出现信息化融合的趋势,并提出物流企业应采取的战略。邓小瑜(2011)等从技术融合、产品融合、业务融合、产业衍生4个层面阐述了物流业如何进行信息化建设。物流业与信息业的融合包含通过融合信息技术提高来增强企业竞争力和将信息业务增加到物流服务中形成新的业务2个方面。

视频摄像头在日常生活中非常普遍,但是利用率较低,大部分监控系统都是提供视频数据的线性存储,成为事后证据查找的有效手段。近年来,随着计算机视觉的发展,很多学者开始研究视频理解,尤其是针对视频信息检测与识别技术,建立有效的算法,实现底层图像处理技术与高层视频内容分析之间的关联,从而推动了计算机视觉在物流领域的应用,提高物流企业的竞争力。

1计算机视觉的相关知识

1.1计算机视觉的概念

20世纪80年代初,marr从信息处理的角度,提出了第一个比较完善的计算机系统视觉框架。计算机视觉是指利用计算机模拟人眼的视觉功能,对图片或视频进行采集、加工、处理和识别,从中提取三维景物的形态和运动信息,解决物流、工业、商业等领域产品图像自动检测识别问题,提高检测识别效率和自动化程度。计算机视觉自动识别技术作为一门交叉学科,近年来受到各相关行业的高度重视。计算机视觉的处理流程为:摄像机图像采集图像处理计算机帧存储、图像识别控制逻辑显示器显示。

1.2亮度要求

基于计算机视觉的硬件环境中,亮度是非常重要的因素。在计算机视觉中亮度的作用是突出物体的重要特征或使物体本身可见,而弱化物体其他不需要的特征或物体所处的背景。如果物体太亮或太暗,都会影响对物体的处理。

彩色物体反射光谱的某些部分,吸收其他部分。因此开发人员可以利用这个特点来提高某些物体的可视度。开发人员可以利用颜色之间的对比增强某种颜色或抑制其相反的颜色。例如,如果一个红色的物体在一个绿色背景中则应该加强红色,这时可使用红色照明。这样红色的物体会显得明亮,同时会变暗绿色的对象。

LeD是目前用于计算机视觉的主要照明技术,相比白炽灯、日光灯等使用时间短、亮度逐渐减弱的特点,LeD灯的寿命超过100万小时,而且耗电小,产生热量少。

1.3计算机和摄像机的接口

常用的计算机和摄像机接口包括ieee1394、ethernet、USB2.0andGigabitethernet等。

1.4RGB介绍

RGB颜色空间是实际应用最多的一个颜色空间,在使用计算机进行图像处理时,数字图像一般用RGB空间存储和表示,分3个通道:红(Red)、绿(Green)和蓝(Blue),分别反映了颜色在某个通道的亮度值。3种原色光不同比例混合即使得人得到不同颜色的感知,这就是RGB颜色空间的由来。RGB空间中每种颜色都能用三维空间中的一个点来表示。

2计算机视觉在物流领域的优势

随着物流业的迅速发展,计算机视觉在条形码识别、运动物流跟踪方面逐渐得到应用。与传统方法相比,计算机视觉应用在物流领域的优势为以下方面。

2.1灵活、低成本

物流系统中一般采用传感器来收集相关信息,但是传感器的位置是固定的,如果需要多方位的信息,必须同时需要多个传感器才能完成。利用计算机视觉摄像机和计算机来完成,只需要通过程序的设置和一台摄像机就可实现多方位信息的收集。

2.2高效、准确

在一些人眼难以满足要求的场合,或不适于人工工作的环境下,用计算机视觉来代替人工视觉可以提高生产效率、信息的准确率。

3计算机视觉在流水线中多方位跟踪计数的算法

物流企业在流水线产品的计数方法目前主要采用传感器,而利用摄像机所提供的视频信息可以实现多方位的跟踪。计算机视觉是一个集成系统,图像分析的时间有限,算法必须简单有效。本文采用的物流流水线视频图像如图1所示。图中红色矩形表示流水线中传输的物品,绿色区域为流水线中的物品处理区域。

系统会在视频图像中设计①、②、③、④四个计数区域,在物品进行相关处理前进行计数。计数方法为将每帧图像变为黑白图,图像中的红色变为白色,其余都变为黑色。当每幅图像中的红线部分中的白色像素超过一定阈值时,认为物体撞线,如图2所示,这时确定有需要计数的物品通过,可以开始计数。

3.1主要算法

3.2算法的运行结果

openCV是intel公司开发的开源计算机视觉库。它提供了几百个C/C++函数,实现了计算机视觉领域中大部分最常用的算法。利用intel开发的开源视觉库intelopenCV和VC6.0将上述算法转换为对应的源代码,可实现4个区域的物品计数。

3.3算法的评价

该算法利用计算机视觉技术实现了物流流水线上的多方位计数,提高物流企业的信息化水平,节约了资金。算法简单,运行速度快,完全可以满足物流企业的实际需求。

4结论与建议

本文所提出的算法实现了计算机视觉技术在物流企业的应用,为信息产业和物流业的融合提供了新的思路。但信息产业与物流产业的融合并不意味着引入信息技术后物流业的竞争力一定能提高。Berry(1995)指出了企业可以从6个方面来利用技术手段来提高竞争力,根据Berry的建议和我国物流业的实际情况,本文认为从以下几个方面来考虑如何通过与信息技术的融合提高物流企业的竞争力。

4.1要有一个战略性的全局行动纲领

技术只是一种手段,使用技术的目的是为了企业发展服务,应符合全局发展的需要。因此物流企业高层管理者应该参与技术战略的制定,保证技术战略与全局战略一致,并有Cio(首席信息官)监控具体执行情况。而不应该盲目使用一些新技术或进行信息改革,造成企业不必要的损失。

4.2解决主要问题

物流业作为服务行业其最终目的是为客户服务,使用信息技术的有效性应建立在为客户解决实际问题的基础上。因此信息产业与物流业的融合应体现在为客户提供更多的便利,或提供增值服务的基础上。

4.3使用物流公共信息平台和建立物流信息系统,保证系统有效运转

通过现代物流公共信息平台的建设,企业可以及时获得需求信息,政府可获得物流业相关的调控和管理的宏观信息,实现互联互通。通过企业流程再造,利用含有CRm(客户关系管理)等模块的eRp系统,采用eDi(电子数据交换系统)、GpS、条形码、无线射频技术等先进技术,建立真正适应企业发展的符合现有服务模式的管理信息系统。

4.4创新型物流人才的引进和培养

物流企业在自身提高业务流程和信息化水平的同时,还应注重创新型人才的引进和培养,特别是有国际大型物流企业管理和技术经验的复合型人才。

主要参考文献

[1]LLeonard,Berry.onGreatService:aFrameworkforaction[m].newYorknY:theFreepress,1995.

计算机视觉心得体会篇7

一、应用多媒体计葬机辅助教学的必要性现在学校教学中,学科多,知识点多,粗盖面广.教学方式若仍然停留在教师、课本、板书、挂图等费时多、进度慢的传统教学方法上,是难以完成教学任务的.把多媒体计算机教学引人课堂后,它给传统的教学方法带来了新的生机和活力,对过去课堂上学生模糊不清的概念不多易理解的问题教师只藉用几分钟的时间,通过屏幕上的图形、动画.以寥容数语进行引导和点拨就可达到预期的效果.再结合生动有趣的交互式练习,不但可以大减学生的课业负担,而且可以提高学生的学习兴趣。计算机辅助教学的媛终目的是用电脑去开发学生的智力,把思维调动到最佳状态来提高教学效果.多媒体计算机其生动形象的图文、视频、动画,悦耳的伴音作用于绵竹福市齐学中艾光伟浅谈计算机辅助教学。理教科学践与实研究学生的视觉、听觉,对于伴随着电视机长大的学生来说,用这样的教学手段把间接的知识.抽象的概念和原理转化为感性经验,他们乐于接受这样的学习方式。另外,计算机软件上所携带的大t的超乎寻常的知识信息,极大地丰富了课堂教学内容,让渴望求知的学生在短时间里接受更多的新东西.这是其他教学媒体难以比拟的,它让当代学生对课堂外世界有一定了解、改变了教学的时间和空间概念.二、推广计算机辅助教学,首先教师要养成使用计算机的心理习恤计算机发展到今天,已不再是科学计算的专用工具。随着多媒体计算机的出现,更进一步延伸到社会的各个领域.在学校教育中,计算机辅助教学(Cal)已是培养学生能力,提高教学质盘的重要手段。但是.目前能充分应用它的教师并不多,其主要原因是:一方面,很多教师的教学手段还习惯于一本教材,一只粉笔一块黑板的局面。另一方面,还不会操作计算机,对这种高科技产物有神密感和畏惧感,也就不学,不用。其实.这都是一种保守的心理在障碍计算机的推广应用。教师既是知识的传授者.又是知识的接受者•21世纪是信息的时代.其知识特点是“多、快、密”.随着网络技术的发展,各种各样的信息知识将更多的来自计算机。它是更新观念、接受知识传播的新渠道。教师应该做好这方面的先锋示范。学习和掌握一定的计算机知识是现代教师的一项基本功,这可以通过短期的培训来达到.要把计算机当成得心应手的工具来用,它是教学中形象生动的演示工具.它让教师从年复一年的单调重复备课方式中解脱出来,对教案的内容的改变及整理,要留要增要删,在计算机上完成极容易,省略了很多“机械劳动”的时间.何乐而不为呢?另外,当教师自己要使用或制作声、图、文并茂的课件时,他在教育观念、内容、方式和目标上会有所创新与突破.其业务水平也相应得到提高.一个好的教学软件是软件、教育、心理、教学、艺术等各方面专家智惫的有机融合。是计算机在教学领域中应用的产物,它更新了传统的教学方式.目前很多软件质t高,其科学性、表现手法、演示效果是传统教学无法相比的,应用它可以真正地激发学生学习积极性和主动性.目前许多优秀的计算机辅助教学软件不断涌现,建议各位教师找些相关科目的教学软件上机试一试,你会有一种展憾的感觉.惊叹多媒体技术的伟大,感受以多媒体计算机为代表的现代教育技术的应用.将推动课堂教学的高效率实现,自觉地产生迫切要求掌握计算机使用的强烈愿望.三、让多媒体教学进入课堂更能发挥学生的主体作用目前教学改革的核心内容之一是课堂教学改革.它要求重视课堂教学方法的改革;重视以计算机应用为主的现代教育技术的应用,充分发挥学生主体作用.当学生掌握计算机的基本操作.知道怎样与计算机“对话”以后.就可使用课堂教学件,放手让学生在计算机上自定学习目标,自主选择、控制,通过人机“对话”方式进行学习,而教师在一旁辅导,这种教学方式培养了学生积极主动的学习精神。学生能亲身感受到计算机授课对他们的种种帮助,尝试到现代化教学手段带来乐趣,他们欢迎这种上课方式。计算机是一位温和亲切、耐心而严厉的好老师,跟着计算机学习.心里不感到紧张,也不觉得枯燥乏味,面对屏幕的注意力比在课堂上面对黑板学习的注愈力集中时间长。屏幕上的每一个字符、菜单、图.标都紧紧抓住学生的思维,上课变得轻松且回味无穷.在课堂上可以看到学生为自己能亲手操作计算机并从中学习感到幸运而自豪,他们总是一边操作一边欣赏一边学习,每按下一个键,都表现出由衷的喜悦.表现出极强的求知欲望.这种成功的喜悦不断激发着学生学习的兴趣.形成了爱学习的良好环境。但有的学生因新奇而产生的对计算机的兴趣常常会把上机上课只当作一种’“电子游戏”玩;有的学生对计算机提出的问题不愿多想.急于了解答案.这对教学是不利的.教师要在上课时提出要求.或教师加强督控。引导他们养成踏实求知.互相讨论.勤于思考.认真解题的良好学习风气。

计算机视觉心得体会篇8

关键词:计算机视觉注意机制计算机视觉注意模型

1.引言

随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点Foa(Focusofattention)。treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点Foa的变化具有四个特征,即单焦点性:同一时刻只能存在一个Foa;缩放性:Foa的空间范围可以扩大或者缩小;焦点转移性:Foa能够由一个位置向另一个位置转移;邻近优先性:Foa转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即Foa转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于treisman的特征整合理论和Koch&Ullman的显著性模型,itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。

现有的自下而上的视觉注意计算模型中,itti的显著图模型(简称itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中,由于itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。

实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献:

[1]wolfJm,CaveKR.Deployingvisualattention:theguidedsearchmodel.in:trosciankot,Blakea,eds.aiandtheeye.Chichester,UK:wileypress,1990.

[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).

[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).

[4]Rabakia,GusakovaVi,GolovanaV,etal.amodelofattention-guidedvisionperceptionandrecognition.VisionResearch,1998,38.

计算机视觉心得体会篇9

[关键词]:多媒体教学;多媒体技术;计算机技术;心理学;教育

多媒体教学的发展,与其技术的发展有直接关系。在一些相关论著中,学者们更多的是对多媒体教学技术的论述,强调的是技术,而很少涉及学习者和教育者这样的“人的因素”。虽然对多媒体教学技术的研究是不可缺少的,但是探索多媒体教学的心理机制和教育基础则更为重要,因为人类是以完全不同的方式来加工多媒体教学的。只有这样,才能在多媒体教学中考虑学习者和教育者的主体性。

一、多媒体教学技术及其计算机基础

多媒体与多媒体技术应视为同义词。关于多媒体技术的特点虽然还没有形成共识,但是,也有一些基本的共同之处。多媒体五大特点:1.将不同的媒体数据都表示成统一的结构码流;2.实行新的技术标准体制,以适应系统级集成和规范相关产品的性能指标;3.建设“全球信息高速公路”;4.应用“双向性设计”,统一信息提供者、接受者和控制者的关系;5.赋予信息系统对客观世界信息的自然模拟与处理能力。

(一)多媒体技术的特点

1.整合性。多媒体实时地综合,把文本、图形图像、声音、动画以及视频这些媒体中组成两种或两种以上的结合体,为的是借鉴各种媒体的优势,形成一种在功能上更加完善的体系。

2.集成化。多媒体表示的并不单纯是信息的多样性,而是通过多种媒体表现、多种感官认知、多种仪器设备、多学科汇聚、多领域应用等交互作用,集成信息码流、设备控制、人与客观现实关系的一体化。

3.多维式。多媒体是趋于人性化的多维信息处理系统,目标是要尽可能实现让人类在现实生活的自然环境下,保持信息交流的高保真效果、通信带宽和交互控制能力。

4.数字化。多媒体具备数字化处理系统,其信息是一种数字化的信息,其信息结构是一种超媒体的网状式结构,所以高速宽带网络支持多媒体通讯和资源共享,建造全景化虚拟世界数据库成为现实。

5.分布式。目前,多媒体技术正朝着分布式的方向发展。分布式多媒体是一门综合性技术,它集计算机的交互性、网络的分布性和多媒体信息的综合性于一身,突破了计算机、通信等传统产业间相对各自独立发展的界限,是计算机和通信领域的一次革命;分布式多媒体的发展涉及两个关键性的技术问题,一个是多媒体网络技术,网络的频宽、信息的交换方式及网络的高层协作,这直接决定着网络质量;另一个是数据压缩技术,使信息量巨大的多媒体数据、特别是视频和声频数据得以在网络上传输;分布式多媒体向社会提供全新的信息服务,使用户不但可以选择播放的节目以及内容,而且还可利用此系统得到诸如咨询、交流等信息服务。

(二)多媒体并不是多媒体计算机的代名词。

多媒体计算机只是多媒体的一个特例。它既有计算机的显著特性,又有多媒体的功能,所以学校进行多媒体教学时,通常以多媒体计算机为载体。然而,多媒体计算机仅仅是多媒体系统中的一个分系统,因此,它常常被认为是多媒体中的一个典范,或者说是多媒体的一种狭义的范畴。

二、多媒体教学技术及其心理基础

从媒体技术的基础来分析,多媒体教学技术离不开视觉媒体技术、听觉媒体技术和触觉媒体技术等。多媒体信息是这些媒体信息数字化后整合而成的,如前所述,数字化技术是多媒体技术的基础技术。在数字化的过程中,各种单媒体有各种不同的国际标准,然而,如果重视“感觉通道说”,那么就要在探讨这几个方面的媒体技术问题的同时,必须揭示使用者(尤其是学习者)的感觉、知觉的心理机制,特别是人的视觉和听觉特征。

多媒体教学技术的出现扩展了人们用视觉模式呈现材料的具体途径。视觉材料包括文本信息、图形图像信息、视频信息。这些信息通过视觉媒体技术数字化后整合为多媒体信息。

(一)为了使多媒体教学技术的视觉材料更容易被学习者所接受,就必须要顾及人的视觉心理基础,也就是说,上述视觉媒体技术只有通过视觉心理机制才能实现多媒体教学的目标。这里,我们也要强调四点:

1.多媒体技术要考虑光的物理三属性所引起的视觉的三种心理机制。视觉的刺激是光,光是电磁波,电磁波的范围很广,而人可见的电磁波只占电磁波的一小部分。波长不同,会使我们在视觉上产生色调的差别,从而产生不同的色觉。色觉不仅取决于由波长所引起的色调,还和主观感觉的明度和饱和度有关。明度是对光波强度(振幅)的反应,饱和度则由物体发射或反射的光的纯度来决定。所以,多媒体教学技术在视觉媒体设计上要处理好可见视觉、色调、明度和饱和度这几方面的关系。

2.多媒体教学技术要考虑对感光物质的视觉感受器心理机制。视觉感受器的真正感光器官是视网膜上的一些细胞,其中锥状细胞感觉颜色,棒状细胞感觉明度,这两种细胞中感光物质的化学性质不同,光使这些物质分解,色素被漂白,从而刺激了感受细胞的膜,引起神经冲动。所以,多媒体教学技术在视觉媒体设计上要研究这两种感光物质的化学性质。

3.多媒体教学技术要考虑视觉过程,即眼睛看东西是一个编码过程,视网膜上的不同感受野在视觉中枢有不同的神经细胞,各有其功能,不同的细胞对所刺激信息系统的不同特征分别反应,并像计算机那样编码,这种编码实际是对一些图像的辨认。所以,多媒体教学技术在视觉媒体设计上要利用好视觉感受野与信息的特征。

4.多媒体教学技术要考虑各类视觉现象,特别是决定视力高低的视角、强弱光下的适应、视觉后暂留的后像、不同背景的视觉对比、不同明度下对不同光波长的感受性等等造成视觉的各种差异。所以,多媒体教学技术在视觉媒体设计上要运用各类视觉现象产生的规律。

(二)在多媒体教学技术中,视听是紧紧地联系在一起的。在计算机环境下,眼睛知觉动画图像,耳朵则知觉解说语言;在演讲的情境中,视觉通道加工投影仪上幻灯片的内容,听觉通道则加工演讲者的声音。听觉材料主要是声音,包括语言信息、音乐信息和效果声信息。这些信息通过听觉媒体技术上数字化后整合为多媒体信息。在这一过程中,我们从技术角度作如下三点说明:

1.声音信息尽管是一种一维的模拟信号,它可以通过采样、量化、码字分配实现数字化,但它比文本信息的数据量要大,通常采用呈现声音和声音合成技术。

2.声波是起源于发声体的振动,在弹性媒质中传播的是一种机械波。它在气体或液体媒质中传播的是纵波,在固体媒质中传播的则是纵波、横波或两者的复合。声音信号有时域特征、频域特征和声色与失真特征。

3.声频或音频是人耳可闻的振动频率,频率范围每秒钟约为20-20000次(赫兹),声频信息数字化后其数据速率大、保真度好和动态范围大。当然,对于不同类型的声频信号,其信号带宽是不同的,电话、调幅广播、调频广播和激光唱盘等的声频信号是有较大区别的。随着声频数字化的发展,压缩编码技术是多媒体教学技术的关键之一。(三)要使多媒体教学技术的听觉材料被学习者更容易接受,也必须顾及人的听觉心理基础。这里,我们仅作两点分析:

1.多媒体教学技术要考虑声音的物理三属性所引起的听觉的三个特征。正像光有三种物理属性一样,声音也有三种属性,即振动的频率、振幅的大小、基音与陪音的倍数配合关系,以及所产生的听觉的音调(或因高)、音强(或响度)和音色的三个特征。人对不同音调的感受性是有差别的,尽管声频在20-20000Hz范围,但声频为1000-4000Hz之间音调感受性较好(即阈限较低),这是由于耳膜神经纤维承担的振动频率所决定的。测量音强的方法以分贝(dB)为单位,这是物理学与心理学都认可的,即两个声音之间的强度比率为1∶1.26(1分贝),因为1.26是能清楚辨别出两个声音振幅大小的区别。人的音色是由基音和陪音的不同比例的配合决定的。在音调和音强相同的情况下,人们之所以能够分辨出是哪种琴所演奏的曲子,正是由于不同琴的基本振动(基音)与分段振动(陪音)的比例是不一样的,这种比例成整数倍数为乐音,不成整数倍数则为噪音。所以,多媒体教学技术在听觉媒体设计上要利用好音调、音强和音色的三个特征。

2.多媒体教学技术要考虑听觉的感受野。因为听觉神经细胞是有分工的,研究指出,听觉中枢神经细胞有40%只反应噪音而不反应乐音,另外60%的神经细胞对乐音的反应也有分工。冲动频可以出现在声音的出现时,可以出现在声音消失之后,也可以出现在声音出现和消失的一刹那;可以在声频降低时发生变化,也可以在声频升高时发生变化。

由此可见,我们在分析多媒体教学的相关技术的同时,也要注意学习者的心理基础,因为学习者是以特有的心理活动的方式来加工视觉和听觉等媒体信息的。

三、多媒体教学技术及其教育基础

(一)在教育中应用多媒体技术,首先是多媒体教学软件的开发,此外,创作工具和虚拟现实等技术也在教育中应用。每一种技术既为教育服务,又有其教育的需要和基础。由于教育对象是人,所以在教育中不管怎样去应用多媒体技术,都要体现每一种技术为人服务,并把学习者和教育者的要求作为出发点。

(二)多媒体创作工具是指能够集成处理和统一管理文本、图形、静态图像、视频影像、动画、声音等多媒体信息,使之能够根据用户的需要生成多媒体应用软件的编辑工具。当前,多媒体创作工具的种类归纳起来主要有以下三种类型:

1.交互式流线或图标编辑控制型,编辑人员按照脚本的要求将选定的不同类型的图标根据需要一一放置于流线上进行编辑。

2.描述式页控制型,将多媒体素材根据需要编辑在一幅画面之中形成一页书,再将页与页之间按一定的调用关系联系起来以形成一本书的概念,不同页之间根据需要交互性地呈现即形成多媒体应用软件。

3.时间流程型,这类工具在编辑信息时显示出较强的时间前后顺序,即时间流程(timeLine),主要用来编制一些简报类的程序。

[参考文献]:

[1]吴炜煜.多媒体技术导论[J].多媒体世界,1996(1):11-13.

[2]傅德荣.多媒体技术及其教育应用[m].北京:高等教育出版社,2003:3.

[3]黄孝建.多媒体技术[m].北京:北京邮电大学出版社,2000:2.

[4]林众,冯瑞琴.计算机与智力心理学[m].杭州:浙江人民出版社,1997:289.

计算机视觉心得体会篇10

关键词:盲校;计算机教学;策略

因为盲生存在着视力障碍,无法通过视觉来获取外界信息,所以,在传统的盲校教育教学过程中,老师通常错误地认为没有必要对盲生进行计算机教学。再加上动画、图像及板书等传统的教学方式也非常有限。传统的盲校教育教学主要是通过单纯的教具触摸以及老师简单的语言描述来进行的,导致盲生无法客观、全面地理解问题与外界事物,严重影响了盲生的智力开发。而计算机却可以使这一问题得到有效的解决,因此,在盲校中开展计算机教学具有极其重要的现实意义。

一、在盲校开展计算机教学的重要意义

盲人属于社会中一个弱势群体,据相关研究显示,人主要是通过视觉系统来获知外界信息的,但是由于盲人存在着视力障碍,严重阻碍了其对外部事物的认知。在盲校中开展计算机教学,可以使盲生运用现代化技术的能力得到充分的培育,为其提供一个认知外界事物的有效渠道,借助计算机技术,可以让其更好地、全面地认识到外部世界[1]。盲生在掌握了计算机技术后,可以让其自身的生活变得更加多样化,让他们的世界变得更加生机盎然,这样也可以帮助培养盲生健康、积极向上的生活心态,使盲生的生活质量得到全面的提升。应当将盲校计算机教学当作盲校教学中的一个主要内容来对待,同时,盲校计算机教学应当注重对盲生职业技能的培育,以使盲生在职业场合中能够更好地借助计算机技术来提升自身的职业水准,更好地服务于社会,从而使自身的人生价值得到更好的体现。盲校计算机教学是构成我国教育体系的主要内容之一,在盲校中开展科学规范的计算机教学是我国以人为本的科学发展观的重要表现,这也可以有效的促进盲生以及社会的健康发展。因此,在盲校中开展计算机教学具有至关重要的意义[2]。

二、在盲校开展计算机教学的相关策略

(一)调动盲生学习计算机的兴趣

兴趣可以有效的激发学习的动力,在开展计算机教学的过程中,老师应当积极调动盲生学习计算机的兴趣。因为盲生在视力上有残疾,严重阻碍了其对外界信息的获知,也极大地限制了其对外界事物的想象能力、思维能力以及感知能力等的发挥。传统的电视机、收音机等传播媒介已无法迎合盲生不断增长的信息要求。大部分盲生对于计算机的学习都是非常感兴趣的,只是还需要老师进一步的引导与激发。老师应当充分发挥盲生记忆力强,且比正常人的嗅觉、触觉及听觉都要灵敏的优势,来调动他们学习计算机的兴趣。

计算机理论知识一般都比较抽象,要想让盲生更好地理解那些知识,并对计算机学习产生兴趣,则应当遵从“感知――表象――概念”这一认知发展规律[3]。唯有感知充分,方能产生相应的表象,且感知越深刻,表象才会越精准,才能让盲生更好地掌握那些知识。例如,在学习某些软件操作的过程中,因为盲生视觉系统受损,无法与正常人一样利用鼠标进行操作,只能借助键盘输入指令,而那些指令不仅极易混淆,而且难以记忆,此时,老师应当利用盲生记忆力强且触觉敏感的特点,把各个功能分区的形状具象化,以此来帮助盲生分辨与记忆。通过实践体验教学,让盲生体会到学习计算机的乐趣,从而达到激发盲生学习兴趣的目的。

(二)创新计算机教学方式

首先,老师应当构建全新的师生关系。在盲校教学过程中,老师不仅发挥着指导、促进以及鼓励盲生学习的作用,同时还是盲生学习中必不可少的合作者与协调者。在开展教学的过程中,老师应当充分体现盲生的主体地位,同时对盲生的人格尊严予以充分的尊重,让他们在能够在生动、和谐、民主的学习环境下进行创造性学习;其次,老师还应当鼓励盲生互相协作,让他们在互动中进行创造性学习。在教学过程中,老师可以引导盲生组成小组进行讨论与学习,以实现课堂交流方式从师生单向交流到生生之间多向交流的转变。让盲生在相互协作操作、相互感染情感、相互激荡智力、相互检查评价,给予每个盲生充分展现自我的机会,以此来增强盲生的思维能力及语言表达能力,进而达到提高盲校计算机教学效果的目的。

(三)根据盲生的实际情况,编制科学合理的教学预案

计算机是一门融实践和理论于一体的学科,而盲生不同于正常人,他们存在着视力障碍,因此,在开展盲校计算机教学的过程中,老师应当根据盲生的实际情况,编制科学合理的教学预案,以此来提高盲校计算机教学的效果。如何区分键位、使用快捷键,这是盲生学习计算机的关键所在,因此,在开展计算机教学时的过程中,老师也应当将之作为教学重点。

在开展计算机基础理论教学的过程中,老师应当指导盲生认识并区分键盘格局,唯有掌握好键盘格局,方能更好地应用计算机。在盲校计算机实践教学过程中,老师首先应当对计算机键盘的分布以及每个功能分区的布局进行详细的讲述,通过具象化的语言,手把手操作帮助盲生认识、区分键盘格局。通过反复的练习与纠正来帮助盲生掌握键盘分布。在盲生熟练掌握键盘格局后,老师再重点教盲生如何应用快捷键与组合快捷键,譬如ctrl+V、ctrl+C、ctrl+a以及ctrl+X等常用组合键。在练习使用键盘时,老师应当重点引导盲生某些实用性的操作训练,例如,让每个盲生编写一份个人简介,这就是训练使用键盘的一个过程,再或者让盲生到网络上查寻某种信息,编写一个小说明,这就是训练使用快捷键的一个过程。这样便可以有效地提高盲生使用计算机的能力,从而达到提升盲校计算机教学效果的目的。

三、结语

总而言之,盲校计算机教学是我国教育体系的一个重要内容,同时也是盲校教育教学中必不可少的一个部分。在开展盲校计算机教学的过程中,老师首先应当调动盲生学习计算机的兴趣,其次,还应当对计算机教学方式进行创新,最后,还当根据盲生的实际情况,编制科学合理的教学预案,这样方能有效的提高盲校计算机教学的效果,从而促进盲校的可持续发展。

【参考文献】

[1]吴晓晖.计算机教学中互助模式研究[J].科技致富向导,2013(18).