计算机视觉分析技术十篇

发布时间:2024-04-26 00:50:51

计算机视觉分析技术篇1

关键词:计算机视觉图像精密测量构造几何模型信号源的接收

中图分类号:tp391文献标识码:a文章编号:1009-3044(2013)05-1211-02

新型计算机视觉图像精密测量是一种基于计算机程序设计以及图像显示的高精度的关键技术,它广泛用于测量的领域,对于测量的准确性有很好的保证。这种关键技术是几何了光学的特性,发挥了图像学的显影性,把普通的测量技术瞬间提升到了一个新的高度。在这项关键技术中包含了物理学中光的效应,图像中的传感器以及计算机中的编程软件,这还不完全,还有一些其他科学领域知识的辅助,可以说这项关键技术是一个非常有技术含量的技术,很值得学者进行研究。

1计算机视觉图像精密测量的关键技术的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机视觉图像精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机视觉图像测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

1)计算出观察控制点到计算机视觉图像测量仪器的有效距离;

2)得出观察点到目标控制点之间的三维的运动几何参数;

3)推断出目标控制点在整个平面上的表面特征(大多时候要求形成立体视觉);

4)还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机视觉图像精密测量的关键技术中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机视觉图像系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。

当无法观察到控制点是,计算机视觉图像精密测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。

2计算机视觉图像精密测量的关键技术分析

在计算机视觉图像精密测量的关键技术中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在视觉图像的选择中,无法使用高帧数的图片显示,无法将计算机视觉图像精密测量的关键技术的优点发挥出来。我们就计算机视觉图像精密测量的关键技术中常见的问题进行讨论。

2.1降低失误的概率

在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。

2.2对于权限的控制

权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机视觉图像精密测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机视觉图像精密测量的关键技术。

2.3开启自动建立备份系统

计算机视觉图像精密测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。

3计算机视觉图像精密测量的关键技术遇到的困难和使用前景

计算机视觉图像精密测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了测量单位的广泛青睐。在测量方面的这些可靠性和稳定性也是有目共睹的。在土木和机械测量的行业计算机视觉图像精密测量的关键技术都会有广泛和良好的使用,前景也是十分的广阔。但是不容忽视该技术也有一些弊端。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。

我们都知道,人的眼睛是可以受到吱声的控制,想要完成观测是十分简单的,但是在计算机视觉图像技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

上文中也谈到了,计算机视觉图像精密测量的关键技术中最主要的构建是传感器,一个合理的传感器是体统的“心脏”,我们在仪器的操作中,不能时时刻刻对传感器进行检查,甚至这种高精度的元件在检查上也并不是一件简单的事情,通过不断的研究,将传感器的等级和使用方法上进行一定的创新也是一项科研任务。

4结束语

在测量工程发展的今天,很多的测量技术已经离不了计算机视觉图像技术的辅助,该文中详细的谈到了基于计算机视觉图像精密测量的关键技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案。测量工程中计算机视觉图像精密测量的关键技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题。

将基于计算机视觉图像精密测量的关键技术引入到测量工程中来,也是加强了工程建设的信息化水平。可以预见的是,在未来使用计算机视觉图像技术建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让计算机视觉图像精密测量的关键技术在测量中作用发挥的更好。

参考文献:

[1]汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36.

[2]段发阶,等.拔丝模孔形计算机视觉检测技术[J].光电工程时报,1996,23(13):189-190.

计算机视觉分析技术篇2

[关键词]计算机视觉视觉框架三维表示

中图分类号:tp338.6文献标识码:a文章编号:1009-914X(2015)47-0133-01

1计算机数字视觉技术研究的地位

长期以来,人类持续不断地试图从多个角度去了解生物视觉和神经系统的奥秘,这些努力的阶段性理论研究成果已经在人们的生产生活中发挥了不可估量的作用。计算机视觉(CV)研究的主要内容是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息,进而完成诸如在复杂的环境中识别和导航等任务。计算机视觉研究的重要性是不言而喻的,会产生深远的经济和科学的影响。

20世纪下半叶以来,很多研究者都曾试图通过视觉传感器和计算机软硬件模拟出人类对三维世界图像的采集、处理、分析和学习能力,以便使计算机和机器人系统具有智能化的视觉功能。今天,数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种图像处理与分析的需求和应用也不断促使数字视觉技术的革新。数字视觉技术的应用十分广泛,如数字图像检索管理、医学影像分析、智能安检、人机交互等。

数字视觉技术是人工智能技术的重要组成部分,也是当今计算机科学研究的前沿领域,经过近年的不断发展。已逐步形成一套以数字信号处理技术、计算机图形图像、信息论和语义学相互结合的综合性技术,并具有较强的边缘性和学科交叉性。

2计算机数字视觉技术研究的核心问题

视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。如何攻克图像信息提取过程中的各种难题一直是当今计算机图像学研究的热点问题,而且在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数问题只能采用逆向推导机制,依据已知或假设的关联将视觉系统的输入数字图像和输出语义描述对应起来。基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前领域普遍采用各种统计模型和机器学习算法的本质原因。

物体的三维表示是计算机视觉研究的一个关键问题。八元树(octree)表示法是一种紧凑、简洁的物体三维表示法,近年来这种表示法被广泛地应用到计算机视觉的研究领域。广义八元树表示法的优点是不受视图个数的限制,通过增加观察方向可以计算出更加精确的物体三维表示。主要缺点是需要进行多次坐标变换,在计算机上实现时需要研究相应的离散技术。线性八元树(linearoctree)是较八元树更加简洁的表示形式。

3计算机视觉技术结构及其研究基本框架

计算机视觉技术内在的逆推机制决定了其在系统开发时必须将原始图像数据与其蕴含的知识之间的语义鸿沟加以弥补,在满足特定应用需求的前提下进行合理的图像内容简化和假设,形成目前普遍使用的计算机视觉系统结构:即图像数据层、图像特征描述层及图像知识获取层。由于各种图像特征都有其优点及不足之处目前趋势是结合不同种类的特征对图像内容进行综合表述,以建立较为可靠的图像信息模型,比如利用时空体数据结构对人体行为等视频内容进行描述。

计算机视觉技术的研究主要围绕着四个基本理论框架:以marr视觉计算理论为核心的深度重建框架;以感知特征群集为主线的基于知识的视觉框架;以“感知一动作”为基础的主动视觉理论框架;以综合集成理论为指导的视觉集成框架。其中,视觉集成理论框架是计算机视觉研究中一个较新的理论框架,并越来越多地受到cv研究者的关注。视觉集成理论的研究内容大致可以分为三个方面,第一方面的研究内容是关于视觉信息与其它类型信息的集成。第二方面的研究内容是关于视觉表示和视觉模型的集成。视觉表示方法主要分为三类:图像表示、表面表示、物体表示。视觉模型王要分为图像模型、结构和形状模型、运动和动态模型、不确定性模型。集成的视觉系统应该能够充分利用这些方法的优点。第二方面的研究内容是系统的集成。

4计算机视觉的发展历程及其趋势

一般认为,计算机视觉技术研究始于20世纪50年代中期,当时的努力主要集中在二维景物图像的分析。区别在于,图像处理的目的是通过处理原始图像得到在某一方面更有利的新图像。模式识别关心的则是将一些模式归入预先定义的有限类别中,主要研究的是二维模式。而计算机视觉主要考虑的是对三维世界的描述和理解。

一般来说,比较一致的观点认为,计算机视觉的研究起始于1965年Rboesrt开创性的工作。Rboert对“积木世界”研究取得的成功激起了人们很高的期望。

60年代末70年代初期,计算机视觉研究领域的很多工作是关于低层视觉处理,从图像中提取重要的强度变化信息――边缘检测。然而,人们很快就认识到很多重要的物体属性无法只通过分析图像的灰度变化得出。到了70年代初期,问题更加明朗化,低层视觉处理无法从单幅图像中普遍地获取对景物的有用描述,计算机视觉的研究领域普遍地发生危机。为了摆脱困境,计算机视觉迫切地需要有一个统一的理论框架作指导。70年代中期到80年代初期,计算机视觉的研究领域首次出现了一个理论框架:视觉计算理论框架,将视觉系统从概念上分成几个独立的模块。80年代后期,计算机视觉的研究领域出现了主动视觉(`vtievsiino)的理论框架。

近年的研究结果表明,单一的图像特征描述机制,无论是对底层像素级特征的描述还是顶层语义特征的描述。都仅能在有限范围内对图像的内容进行建模。巧妙融合多种图像特征因此成为近年图像信息描述方面的主要趋势,近年来,计算机视觉的另一个理论框架――视觉的集成方法越来越多地受到重视。一个重要的趋势是用于识别真实世界中较为复杂的图像内容的技术,适合描述真实场景的各种特征不断得到发展。随着目前互联网络技术的不断发展,另一个值得重视的趋势是计算机图像技术与互联网技术、社交媒体技术等其它计算机技术的融合。

6结语

计算机视觉识别技术虽然是一门新兴学科。但应用前景十分广阔,对其技术的有效性、易用性、实时性及稳定性能等方面有着较高的要求。因此。其技术面临着前所未有的机遇和挑战,该领域的发展亦有过激烈的争论和反思。但是,不可否认的是,计算机视觉技术研究在许多应用领域的应用前景都是广阔的、不可估量的。

参考文献

[1]马玉真,陶立英,王新华.计算机视觉技术的应用[J].试验技术与试验机.2006(01)

[2]潘春洪,张彩霞.计算机视觉简述[J].自动化博览.2005(05)

[3]孙瑾,顾宏斌.计算机视觉系统框架结构研究[J].计算机工程与应用.2004(12)

[4]王天珍.计算机视觉研究进展[J].武汉汽车工业大学学报.1998(01)

计算机视觉分析技术篇3

【关键词】计算机设计图形图像视觉侦查分析研究

应用计算机实现的图形图像设计与视觉侦查,在实际生产与生活中出现的时间都相对比较早,其中计算机视觉侦查应用实现的时间更是早于计算机图像图像设计,与一般的平面设计技术相比,通过计算机实现的图形图像设计在实际设计应用中不仅内容更加丰富,并且图形图像中所包含的元素也相对较多,因此所能够传达和表示内容含义也就更为全面。此外,应用计算机实现的图形图像设计不仅能够更进一步的传递出现代图形设计的目的,在设计过程中还能够借助计算机相关技术实现数据信息的分析处理,从而使图形图像设计者的想法愿望能够更好的呈现出来,具有突出的作用优势和意义。

1计算机图形图像设计与视觉侦查的相关概念概述

在图形与图形设计领域中,计算机图形图像设计的出现应用相对比较早,最早可以追溯到20世纪80年代,我国的计算机图形图像设计是在引进外国设计经验与理论基础上实现应用的。对于图形图像设计含义的理解,首先应从图形图像的含义理解开始,它是指通过图形图像或者是视觉形象实现设计者思想观点的表现和阐述,其本身具有较为突出的创造性特征,因此,图形图像设计是指设计者通过使用相关媒体实现特定信息的视觉形象的传递,它是一种特殊的语言形式,在设计领域比较受欢迎。视觉侦查则是在图形图像设计过程中借助视觉传达的相关技术手段实现图像图像视觉效果的分析判断,视觉侦查的概念比图形图像设计概念出现的时间要早,它是指人们通过信息符号的运用实现相互之间的交流和沟通,是一种实现人与人之间沟通交流的工具。计算机图形图像设计与视觉侦查之间有着密切的联系,其中计算机图形图像设计是通过计算机技术对于视觉信息中的图形图像相关信息进行再次创作实现的一个过程,借助视觉侦查能够实现计算机图形图像的更好设计。

2计算机图形图像设计与视觉侦查的特征关系分析

(1)计算机图形图像设计的特征分析。在设计领域中,图形图像设计和艺术设计之间有着很大的联系,根据上述对于图形图像设计概念含义的概述,结合实际设计应用情况可以将图形图像设计的特征概括总结如下。首先,在实际设计应用图形图像设计所实现的任何设计都需要相应的经济基础作为支撑,以商业性广告的设计为例,其设计就是把实现最大利益作为目标而进行的,而那些不具有商业性质的公益设计类型,也具有相关的社会关怀、文化氛围营造等不同目的,因此,实际设计应用中为了更好的实现设计的目的,就需要在经济基础的支撑下结合设计受众的心理喜好,以达到更好的设计目的。其次,在实现图形图像设计过程中需要设计者对于设计内容的基本思路以及设计核心内容、目标等进行明确,以实现图形图像设计主题思想的确定,达到设计目的与要求。再次,进行图形图像设计中还需要认识到图形图像设计与一般的美术画画之间有着根本的区别,其中美术画画对于所画事物之间的一致性要求比较高,而图形图像设计则是选取容易被人们所接受、喜爱的事物作为载体的,与日常生活联系比较密切。此外,在设计领域中,计算机所实现的图形图像设计自身属于一种定量式的设计,每个设计之间是相互独立的,其设计目的也更为明确,设计速度比较快,设计过程中的定位与配色等都比较精准,所实现的设计带给人们的视觉冲击性也比较强,再加上计算机技术的应用,不仅促进了图形图像设计中的设计绘制软件工具的革新,而且很大程度上也拓宽了图形图像设计的视觉传达效果,能够促使设计者的设计创意与设计表现实现更高层次的突破提升。如图所示,即为应用计算机图像设计软件实现的设计效果示意图。

(2)计算机图形图像设计与视觉侦查之间的关系区别分析。结合计算机图形图像设计的实际情况及其设计的视觉传达效果,在实际设计中图形图像设计和视觉传达设计之间的设计相同点比较突出,其中,以设计内容和设计目的为例,其中就存在着很大的共通性,在实际设计中对于设计者都具有较高的专业知识和软件应用要求。此外,在对于计算机软件技术的应用上,图形图像设计和视觉侦查之间所需要的软件都是一样的,像比较常见的photoshop等,并且完成设计都需要设计者具备相关的审美与对设计元素的灵活应用,在完成设计作品的再创造基础上,实现设计质量效果与水平的提升。其次,图形图像设计与视觉侦查之间也存在有较大的区别,其中图形图像设计更加重视对于图形和图像的设计处理,而且视觉侦查则是通过视觉的设计构造,体现出更特别、更新颖的观念思想,因此视觉侦查更加重视设计者的创意和创新,由于图形图像设计与视觉侦查之间的这种根本性的区别,就导致了视觉侦查与图形图像设计在设计手法与设计原则上也存在有一定的区别,这也是图形图像设计与视觉侦查之间的最大不同处。

3计算机图形图像设计与视觉侦查的应用分析

根据上述对于计算机图形图像设计与视觉侦查特征与关系区别的分析,就可以看出在实际设计应用中,视觉侦查与图形图像设计之间具有很大的关联性,它们通过相互之间的作用影响,共同实现设计者思想与观念的展示表现。通常情况下,计算机图形图像设计与视觉侦查在文字设计以及广告设计、绘画设计、包装设计和功能界面设计中的应用体现比较多,以文字设计为例,其中有关的文字大小以及字体颜色、位置、效果等,都是借助计算机图形图像处理软件完成实现,并且借助这种设计手段,最终都是为了对受众产生相对突出的视觉冲击。

结语

总之,计算机图形图像设计与视觉侦查作为计算机设计领域重要内容,对于计算机技术的提升以及艺术设计的发展进步都有着积极的影响和意义,进行计算机图形图像与视觉侦查的分析,有利于促进计算机技术与艺术设计的发展提升。

参考文献

计算机视觉分析技术篇4

关键词:机器视觉技术;大米;品质检测

中图分类号:tp391.4文献标识码:a文章编号:0439-8114(2012)05-0873-04

applicationprogressofmachineVisiontechnologyintheQualityinspectionofRice

wanpeng,LonGChang-jiang,RenYi-lin

(Collegeofengineering,HuazhongagriculturalUniversity,wuhan430070,China)

abstract:theresearchdynamicofmachinevisiontechnologywasreviewedfromtheaspectsofricevarieties,germ,crack,yellowgrainrice,andsoon;andtheshortcomingsofthemachinevisiontechnologyinricequalityinspectionwereproposedforitsfurtherapplication.

Keywords:machinevisiontechnology;rice;qualityinspection

我国是世界上最大的稻米生产国,稻米年产量常年保持在1.8亿t左右,占世界稻米总产量的1/3,居世界第一位[1]。我国也是大米消费大国,有近2/3的人口以大米为主食,全国大米年消费总量保持在1.35亿t左右[2]。我国的水稻研究在世界上处于领先地位,但是在国内外贸易、加工和消费等领域中仍然存在诸多问题[3,4]。

我国曾经是世界三大稻米输出国之一,但是由于我国大米的品质不高,再加上大米的生产标准、质量技术标准、检验检疫技术等与发达国家存在较大差距,在相当程度上影响了我国大米在国际市场上的竞争优势,大米的年出口量已退居六七位。2008年以来,随着世界稻米产量的下降,各国对大米出口配额进行调整,导致国际大米的价格出现了疯涨,而我国出口的大米因品种不稳定、品质较差,在国际市场上竞争力较低,市场份额逐渐减小。

为了提高大米的品质,不但需要选育优质的稻米品种,还需要加强大米品质的检测。但是,由于我国对大米品质的检测研究起步较晚,同时也缺乏方便简单的检测方法和快捷准确的检测仪器,在对大米品质进行检测的过程中,主要依靠人工识别、感官评定等方法进行检测,这些方法主观性较强,准确度较低,可重复性较差,工作效率也较低,因此在实施过程中的有效性受到了质疑[5]。

机器视觉(machinevision)又称计算机视觉,是指利用计算机实现人的视觉功能,是研究采用计算机模拟生物外显或宏观视觉功能的科学和技术,是一门涉及数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域的交叉学科[6]。机器视觉技术在农业上的应用研究始于20世纪70年代末期,主要进行的是植物种类的鉴别、农产品品质检测和分级等。随着计算机软硬件技术、图像处理技术的迅速发展,它在农业上的应用研究有了较大的进展[7,8]。

目前,大部分的大米品质检测指标根据国家标准采用人工进行检测,容易产生许多问题。随着机器视觉技术的发展和在农产品无损检测领域的广泛应用,采用机器视觉技术对大米的品质进行检测,不仅能够提高大米品质的检测效率,而且能够克服主观因素的影响,降低检测误差,使得大米品质的检测变得更加快速和准确[9]。

1基于机器视觉技术的大米品质检测装置

基于机器视觉技术的大米品质检测系统由检测箱、检测台、光源、CCD图像传感器、镜头、图像采集卡和计算机系统等几个部分组成[10,11](图1)。

大米品质检测系统是一个内空的箱体,箱子的底部是检测台,顶部为光源和摄像头;检测箱内表面粘贴有背景纸,使光在箱体内形成均匀的漫反射,避免样品在检测时形成镜面反射。光源提供样品检测照相时所需的亮度,为了提供充足的光线,同时尽量消除光源照射样品时在背景上产生的阴影,通常选用环形荧光灯管作为光源[12]。CCD图像传感器是获取数字米粒样品图像的关键部件之一,它将大米图像由光信号转换为表示R、G、B颜色值的模拟电信号,并输入图像处理设备进行后续处理[13]。计算机软件系统用于对采集到的数字图像进行分析、处理和识别,实现对特定目标的检测、评价等[14]。

2基于机器视觉技术的大米粒形检测

大米的粒形是实现大米分级和质量检测的最基本参数。根据《GB1345-1986大米》中的规定,评价大米质量的检测指标主要有加工精度、不完善粒、杂质、碎米等,这些检测指标与大米的粒形直接或间接相关。由于人工评价是通过肉眼观察对大米粒形进行评价,因此受检测环境、视觉生理、视觉心理等诸多因素以及评价人员对大米标准理解程度不同的影响,即便是同一份大米样品,很难保证大米粒形检测结果的稳定,而采用计算机视觉技术进行检测则可以有效避免主观因素的影响,保证大米粒形检测结果的准确性[9,15]。

中国农业大学孙明等[16]借助于matLaB图像处理工具箱对大米粒形进行测定。首先定义单粒大米子粒的粒长(a)与粒宽(B)的比值为粒形,检测时先求出大米粒的椭圆离心率R,通过公式:

■=sqrt■

将大米子粒的椭圆离心率转变为长宽比a/B,即求出大米子粒的粒形。试验结果表明,该方法具有操作简单、检测速度快、重复性好的优点。

武汉工业学院张聪等[17]提出了一种基于计算机图像分析识别大米破碎粒的方法,即先采用数码相机获取大米图片,再对大米图片进行分析处理。识别时先将大米图像的边缘曲线变换为极坐标形式,再结合大米粒形的一般形状,用椭圆模板定位米粒,获得一组与米粒平移、旋转和尺度无关的形状描述数据,再运用小波变换提取奇异点及特征参数。试验结果表明,该方法简单有效,用于米粒定位与识别时的可信度高。同时,刘光蓉等[18]也研究了通过扫描仪获取大米的图像,再采用计算机图像处理技术将彩色图像转化成灰度图像并进行进一步的处理,最后获得大米子粒的二值图像,然后利用八邻域分析法提取大米图像的轮廓。试验结果表明,这种方法的检测效果良好。

此外,袁佐云等[19]还提出了采用最小外接矩形计算大米粒形的方法。包晓敏等[20]分析了采用Roberts算子、Sobel算子、prewitt算子、模板匹配法和快速模糊边缘检测法对大米粒形进行边缘检测,并通过对大米图像的分割试验验证了快速模糊边缘检测法最为有效。

3基于机器视觉技术的大米加工精度检测

大米加工精度是指大米背沟和粒面留皮程度,即糙米皮层被碾去的程度。大米的加工精度是决定大米外观质量的主要因素,加工精度越高,米粒表面残留糠皮量就越少,胚乳表面光洁度、口感、外观品质也就越好。我国国家标准规定各类大米按加工精度分等级[9]。因此,大米加工精度的检测具有十分重要的意义。传统大米加工精度的测定有多种方法,国标中规定大米加工精度的判定采用试剂染色法[21],通过染色剂使米粒胚乳和胚乳表面残留糠皮呈现不同的颜色差异便于肉眼观测,该方法受到光照条件、视力、情绪等诸多因素以及各种染色参数的影响,操作繁琐、效率低、误差大,不能满足快速、客观检测的需要。

河南工业大学张浩等[22]研究了机器视觉技术结合数字图像处理技术检测大米加工精度的方法,首先获取大米的图像,利用米粒区域和背景区域的亮度差异将大米图像转化为灰度图像,再利用边缘检测函数求出分割阈值,将米粒从背景中分割出来,并计算米粒区域的面积;然后利用米粒区域中糠皮部分和胚乳部分R-B特征值差异,将大米图像分解为R、G、B分量图,以R-B矩阵代替大米图像,再将R-B矩阵转化为灰度图,用边缘检测函数求出分割阈值把糠皮部分分割出来,计算糠皮部分面积。最后测得大米留皮率为米粒糠皮部分面积与米粒区域面积之比。

江苏理工大学许俐等[23]将计算机图像处理技术与色度学理论相结合研究了大米加工精度的自动检测方法。检测时先将大米染色,然后采用机器视觉系统获取大米图像,再根据染色后大米的胚乳、皮层以及胚芽所呈现的不同颜色特征,采用不同的区分方法获取米粒不同部位的面积即像素的个数,然后根据胚乳面积与大米图像总面积的百分比计算大米的加工精度。

此外,无锡轻工大学田庆国[24]根据色度学原理,采用图像处理技术对染色后的大米进行检测,识别大米的加工精度,并建立了大米染色后的颜色值与加工精度之间的数据库。西华大学的刘建伟与日本岐阜大学的三轮精博[25]合作研究大米加工精度与碾白程度之间的关系时,采用改良后的大米精度鉴定nmG溶液,按照品红石碳酸溶液染色法(GB5502-85)对大米进行染色获得米粒表皮呈绿色、糊粉层呈蓝色、胚乳呈蓝红色的大米样品,米粒干燥后采用测差计检测样品的颜色计算大米的加工精度。

4基于机器视觉技术的大米垩白检测

垩白是指稻米粒胚乳中不透明的部分。垩白之所以不透明是因为稻米子粒中淀粉粒排列疏松,颗粒间充气引起光线折射所致。按其发生部位可将垩白区分为腹白、心白和背白等类型。通常用垩白粒率、垩白大小和垩白度等概念描述稻米的垩白状况。垩白是衡量稻米品质的重要性状之一,不仅直接影响稻米的外观品质和商品品质,而且还影响稻米的加工品质和蒸煮食味品质[9,26]。

黑龙江农业工程职业学院于润伟等[27]研究了采用机器视觉技术和图像处理技术检测稻米垩白的方法。先用机器视觉装置获取大米的原始图像,再采用图像处理方法对大米图像进行预处理,然后应用大津算法自动选取分割阈值对稻米图像进行两次分割,分别得到大米子粒的二值图像和垩白区域的二值图像,再根据区域内部像素点的联通性,将不同区域分别进行标记,计算出子粒数和垩白粒数,同时计算出二者对应的面积(像素点个数)。研究结果表明,该算法的自动检测结果与人工检测相关性大于90%。

中国农业大学侯彩云、日本东京大学Seiichi等[28]采用微切片三维图像处理系统对大米的品质特性进行探索性研究,结果表明借助于三维可视化技术分析大米的微切片,不仅可以观察大米垩白部分内部的组织结构以及在蒸煮过程中的变化,还可以利用灰度直方图定量计算出垩白米粒中各部分垩白的面积和体积。同时,侯彩云等[29]还利用自行研制开发的机器视觉图像处理系统对大米的垩白度及垩白粒率进行检测,试验结果表明所研制的装置具有客观、准确、快速和重现性好等特点,在大米的快速分等定级中具有良好的应用前景。

江苏大学黄星奕等[30]研究了采用遗传神经网络计算大米垩白度的方法。先采用机器视觉系统提取垩白米的图片,然后采用数字图像处理技术提取米粒的垩白区域与胚乳非垩白区域的交界区域内的像素,再采用遗传算法建立一个人工神经网络识别系统对这部分交界区域内的像素进行识别。试验结果表明,采用机器视觉系统的检测结果与人工检测结果的误差小于0.05。

此外,凌云等[31]提出了一种基于分形维数的垩白米检测算法。孙明等[32]采用了matLaB软件开发平台构造了基于计算机视觉的大米垩白检测算法,完成了对大米垩白参数、垩白度以及垩白粒率的测定。吴建国等[33]从实际应用出发,采用计算机和扫描仪结合开发了机器视觉系统的垩白测定软件。而曾大力等[34]利用视频显微镜对大米粒进行扫描,结合计算机图形分析,直接计算大米的垩白大小和透明度,初步探讨了视频显微扫描技术在大米垩白分析中的应用。湖南农业大学萧浪涛等[35]开发了基于微软windows98平台的大米垩白度测定软件Chalkiness1.0,该软件与计算机和图像扫描仪相结合能够组成一套高效的大米垩白度测定系统。

5基于机器视觉技术的整精米率检测

整精米是指糙米碾磨成国家标准一级大米时米粒产生破碎,其中的完整米粒以及长度达到完整精米粒平均长度4/5以上(含4/5)的米粒。整精米率是指整精米占净稻谷试样质量的百分率,它是稻米加工品质优劣的指标,是稻米贸易中商家最关注的内容,与碾米厂的经济效益密切相关。正确识别整精米是检测整精米率的关键。目前整精米率主要采用人工方法进行检测,该方法难以满足对稻米品质快速、准确的检测要求[9,36]。

中国农业大学尚艳芬等[37]开发了一套基于机器视觉技术的整精米检测系统用于识别整精米和碎米。该方法通过提取并分析稻米的粒长、粒形等特征参数,提出了同一品种并在同一生长条件下生长的大米粒形具有相似性的前提假设,据此求得标准米,再通过偏差计算、粒长、粒形分析等对整精米和碎米进行识别。采用该方法开发的整精米识别系统对整精米和碎米识别的准确率与人工检测结果的相关系数可到达0.99。

于润伟等[38]首先通过图像识别系统采集大米的原始图像,再采取动态阈值分割等图像处理方法把米粒图像变成二值图像,然后根据区域内部像素的连通性计算出单个米粒的像素个数;再根据先期计算的整精米长度/面积比换算出米粒长度,最后根据米粒长度判断整精米和碎米。研究结果表明,该算法的自动检测与人工检测的相关性大于99%,可用于整精米的自动检测。

6问题和展望

机器视觉技术在农产品的品质检测方面具有广泛的应用,国内外的学者在此领域进行过广泛研究。但机器视觉技术在大米品质检测领域的应用尚处于起步阶段,仍有许多等待解决的技术问题,需要进一步深入研究。

1)目前的大米品质检测装置多为静态检测装置,即将大米放于检测箱中通过机器视觉系统获取图片或通过扫描仪获取图片,大米相对于摄像头静止不动;获取图像之后再采用计算机软件系统对图像进行分析处理。这种检测方法效率低下,因此,动态地获取大米图像并进行分析检测是下一个要解决的难题。

2)采用机器视觉系统检测大米品质时,多采用的是串行化算法,即先获取大米图像,然后采用某种算法对大米图像进行处理,再检测大米的某项品质指标;之后再采用某种算法对大米图像处理大米的另一项品质指标,这种检测方法在处理群体米粒图像时极大地影响了检测速度,因此开发并行处理算法对大米图像进行分析检测可以有效提高机器视觉系统的工作效率。

3)目前对大米品质指标进行检测分析时缺少统一的检测装置,有的研究者采用CCD摄像头获取大米的图像进行分析检测,而有的研究者采用扫描仪获取图像进行分析检测,检测装置不同、检测条件不一致难以达到相同的检测结果,因此有必要研制具有实用价值的大米品质检测装置,使基于机器视觉技术的大米品质检测能够具有统一的标准。

总之,伴随着计算机科学技术的迅速发展,机器视觉技术在大米品质检测中的应用将越来越广泛。

参考文献:

[1]庞乾林.稻米知识纵览[J].中国稻米,2004(3):44-47.

[2]刘月好.陈米产生的原因与处理方法[J].粮食加工,2004(1):30-31.

[3]庄丽娟,刁慕容.中国谷物外贸格局与发展趋向分析[J].中国农垦经济,2004(8):25-26.

[4]山世英,彭玉珊.我国农产品出口遭遇技术性贸易壁垒的原因及对策[J].山东农业大学学报,2004,6(2):41-43.

[5]李里特.粮油产品规格化、标准化是农业现代化的迫切任务[J].中国粮油学报,2001,16(5):1-5.

[6]刘传才.图像处理与计算机视觉[m].厦门:厦门大学出版社,2002.

[7]赵晓霞.计算机视觉技术在农业中的应用[J].科技情报开发与经济,2004,14(4):124-126.

[8]熊利荣,陈红,丁幼春.机器视觉技术在农产品破损检测上的应用[J].农机化研究,2005(5):204-205.

[9]李天真,周柏清.基于计算机视觉技术的稻米检测研究[J].粮食与食品工业,2005,12(4):50-53,55.

[10]凌云,王一鸣,孙明,等.基于机器视觉的大米外观品质检测装置[J].农业机械学报,2005,36(9):89-92.

[11]张巧杰,王一鸣,凌云,等.稻谷品质检测技术与装置研制[J].现代科学仪器,2006(1):128-130.

[12]赵志强,熊元姣.计算机视觉检测系统的设计方案[J].工业控制计算机,2005,18(10):1-2.

[13]唐向阳,张勇,李江有,等.机器视觉关键技术的现状及应用展望[J].昆明理工大学学报(理工版),2004,29(2):36-39.

[14]张纪明.基于pC的机器视觉系统研究[J].可编程控制器与工厂自动化,2006(11):107-110.

[15]任宪忠,马小愚.农产品粒形识别研究进展及其在工程中应用现状[J].农业工程学报,2004,20(3):276-280.

[16]孙明,石庆兰,孙红,等.基于计算机视觉的大米外观品质检测[J].沈阳农业大学学报,2005,36(6):659-662.

[17]张聪,管庶安.基于图像分析的大米形状识别[J].粮食与饲料工业,2006(6):5-7.

[18]刘光蓉,周红,管庶安.基于图像处理技术的大米轮廓检测[J].粮食与饲料工业,2004(6):14-15.

[19]袁佐云,牛兴和,刘传云.基于最小外接矩形的稻米粒型检测方法[J].粮食与饲料工业,2006(9):7-8.

[20]包晓敏,汪亚明,黄振.计算机视觉技术在大米轮廓检测上的应用[J].浙江工程学院学报,2003,20(2):104-107.

[21]吕季璋,陈效贵,范慕蕙,等.GB/t18105-2000米类加工精度异色相差分染色检验法[S].北京:国家质量技术监督局,2000.

[22]张浩,孟永成,周展明,等.基于图像处理技术大米加工精度的检测研究[J].中国粮油学报,2006,21(4):135-137.

[23]许俐,钱敏娟,方如明,等.大米加工精度的图象识别方法[J].农业工程学报,1996,12(3):172-175.

[24]田庆国.图像处理技术在大米碾白精度测定中的应用[J].粮食与饲料工业,1997(10):10-11.

[25]刘建伟,徐润琪,三轮精博,等.大米加工精度与碾白程度检测的研究[J].中国粮油学报,2004,19(3):5-8,61.

[26]周新桥,邹冬生.稻米垩白研究综述[J].作物研究,2001(3):52-58.

[27]于润伟,朱晓慧.基于图像处理的稻米垩白自动检测研究[J].中国粮油学报,2007,22(1):122-125.

[28]侯彩云,SeiiCHio,YaSUHiSaS,等.三维图像处理系统在稻米品质检测中的应用研究[J].农业工程学报,2001,17(3):92-95.

[29]侯彩云,王一鸣,凌云,等.垩白米粒的计算机图像识别[J].农业工程学报,2002,18(5):165-168.

[30]黄星奕,吴守一,方如明,等.遗传神经网络在稻米垩白度检测中的应用研究[J].农业工程学报,2003,19(3):137-139.

[31]凌云,王一鸣,孙明,等.基于分形维数的垩白米图像检测方法[J].农业机械学报,2005,36(7):92-95,91.

[32]孙明,凌云,王一鸣.在matLaB环境中基于计算机视觉技术的大米垩白检测[J].农业工程学报,2002,18(4):146-149.

[33]吴建国,刘长东,杨国花,等.基于计算机视觉的稻米垩白指标快速测定方法研究[J].作物学报,2005,31(5):670-672.

[34]曾大力,藤胜,钱前,等.视频显微扫描技术在稻米垩白研究中的应用[J].中国农业科学,2001,34(4):451-453.

[35]萧浪涛,李东晖,蔺万煌,等.一种测定稻米垩白性状的客观方法[J].中国水稻科学,2001,15(3):206-208.

[36]郭英群.对国家标准中整精米率定义及检测方法的探讨[J].粮油仓储科技通讯,2005(6):52-53.

计算机视觉分析技术篇5

关键词:图像测量;图像处理位移;变形测量有限元分析

引言

近年来,图像测量成为测量领域新兴的性能较高的测量技术,主要应用在图像匹配、机器视觉、模式识别和图像的检测中。将光学、计算机技术、电子技术、几何测量和信号与信息处理技术许多现代技术集合在一起,根据图像处理技术,组成综合性的测量系统。把测量对象当成信息和检测的中间介质,并对其图像进行精确的测量,这个过程称之为图像的测量。其在进行定位和识别上非常有效。

1国内外图像测量的研究情况

随着国内外计算机行业的迅猛发展,精密光机电以及图像处理技术等高科技技术也发展起来了。这些高科技技术被应用于精密测量学中,形成的学科为图像测量技术。这个技术是传递和检测信息的手段,就是被测对象的图像,在图像中寻找有用信号来获取待测数据。

该技术发展很快,在国内外均已应用广泛,例如航空遥感测量、几何量的尺寸测量、医学图像观测辅助诊断、复杂精密零件的外观检测和尺寸测量以及光波形成的衍射图等很多方面。图像测量技术日益崛起,不但因为计算机技术的完美应用和数字图像处理技术的不断完善,而且还得益于应用范围的不断扩大。进一步刺激着这一技术领域成长为价格低微处理器支持的并行的处理技术;应用于低成本、大容量储存阵列的新储存技术;应用于图像数字化的低成本的图像卡和高分辨率、低成本的彩色显示系统等等。

2图像测量系统的组成

被测试的目标影像信息是通过图像传感器来记录的,这一技术包括了采样过程,使用计算机对其进行数字处理,使最终得到的数据符合计算机视觉检验的机理,进而实现人类对计算机视觉研究的规划和目的。测量视觉传感器的框架结构如图1所示,该系统是利用图像传感器进行图像的表面采集工作,利用采集卡收集图像发出的发出的视频信号并且把视频信号转换为数字信号利用接口电路传入计算机,完成图像处理并且算出计算结果。将最终的数据显示在计算机的屏幕上。通常,传统的视觉系统主要是关于图像处理以及采集,i/o和通信部分及传入传出和执行的机构等。其中采集图像的原理和目的是将已经测量好的可视化图像转化为可视的数据,即计算机能够处理的数据。计算机视觉系统突出强调准确度和速度,所以采集图像应该准确、按时地提供清晰的图像。

3图像处理

数字图像处理的目的是提高图像的质量,利用大规模的成型数字计算机,对转化来的数字信号进行进一步处理,以满足人们的感官要求,得到的图像更加清晰准确。20世纪60年代开始,计算机行业就猛然崛起,被应用于各个行业中,同时图像处理技术也跟着迅速发展起来。但是现在的问题是虽然图像处理技术发展很快,但是运算处理的速度还不是很快,相比光学法,该技术是按照顺序进行处理的,因此速度不如光学方法的快。图像处理技术将来会以崭新的方式出现,伴随着计算机技术的飞速发展。

3.1构成图像数字化系统

图2所示的就是一个基本的图像数字化设备系统的构成元素。其中每一个模块都划分成特定的部分,分别是通信、采集、处理和分析、显示、存储。通讯可采用综合业务网(iSDn)、普通的电话网((pStn)和计算机的局域网((Lan)等。采集可选用配备视象管的视频摄像机和扫描仪、电荷式耦合器件(CCD)照相机等。图像分析和处理主要涉及到的就是运算,采用的工具主要是计算机,当有特殊需要时还必须借助专门的硬件设备。图像的显示可选用电视显示器(tV)。随机读取各种打印机和阴极射线管(CRt)等。图像可以存储在硬盘,U盘或者磁带中。

3.2采样

采样就是将图像在空间上离散化。用空间上的灰度值来代表图像,把这些个点称为采样点。因为图像所表示的是二维分布的信息,因此在进行采样操作时,需要先将二维信息转化为一维信息,之后对一维信息进行采样。具体做法如下所示,首先沿着垂直的方向,按照一定的空隙,从上向下以水平的角度来对图像进行直线扫描,分出各水平线上灰度值一样的一维扫描。然后对一维扫描线信号按一定间隙进行采样,就可以得到离散信号。

采集运动的图像,需要在时间轴上进行操作,再顺着垂直的方向进行采样,最终顺着水平方向采样。对一幅图像进行采样,如果横向(即每行)像素是m个,纵向(即每列)像素是n个,那么图像大小为m×n个像素。

3.3图像的预处理

当计算机接收到图像的时候,因为输入转换器件的差别和旁边环境的影响等,就会失真和发出各种各样的噪声在图像上。只有把噪声消除,校正失真,把图像转变成标准形状,才能够平稳地进行特征提取等的处理。这部分工作被称之为图像的预处理过程,图像的预处理技术主要包括图像大小的正规化,图像位置的标准化。比如,图像色度要保障灰度平衡。计算灰度平衡的方法是图像的点运算。图像的复原是对图像失真的校正,将模糊不清的部分删掉,使得到的图像恢复原来的面貌。图像的几何校正是根据具体的要求将图像放大或缩小,旋转或转移等。图像的增强效果是运用技术使图像变成计算机可以识别的清晰的图像。图像增强技术是一类基本的图像处理方法,其目的是运用技术对图像进行加工,以便得到的图像视觉效果更加“有用”更“好”。所谓“好”与“有用”的意义也不一样,而且所采用的实际的增强技术手段也大不一样。从根本上来讲,人就是评价图像好与坏的评价者,因此不存在图像增强的通用标准。

具体的说就是将图像增强,其目的是将图像中有兴趣的特征有选择地突出,使不需要的特征衰减,却不考虑图像降质的原因,因此修改后的图像不需要去与原图像相似。比如消除各种噪声,强调目标物的轮廓,将黑白图像转换为伪彩色的图像等。

3.4数学形态学的处理

数学形态学是一个利用模式识别和图像处理领域的新手段,提取和度量图像中的对应形状应用具有一定形状的结构元素来使对图像识别和分析的目的达到就是数学形态学的基本思想。集合论是用来表示二值形态学的名称,运用集合论可以有效的用统一的方法解决图像处理中遇到的问题和困难,使结构单元可以随意组合或者分解,发挥到数学形态学上面的运算当中。这样应用形态学来转化问题,就达到了对图像处理分析的目的。从这点看,数学形态学占一些明显地优势在对比其它频域或空域分析方法和图像处理上面。

4结束语

文章对图像测量技术进行了简单的介绍,并分析其原理及使用的方法。对图像测量技术在实际中的应用进行了分析探讨,以便于测量技术在今后应用的范围更加广泛、便捷及精准。

参考文献

计算机视觉分析技术篇6

(东北石油大学,黑龙江大庆163318)

摘要:以排球运动轨迹为研究对象,将计算机视觉、视频分析处理技术相结合,研究了基于视频的排球轨迹获取关键技术,通过视频帧处理、运动目标检测、识别跟踪、轨迹提取等一系列步骤从视频中精准提取排球运动轨迹信息,采用intelopenCV及matlab设计并实现一套排球智能分析系统,为排球比赛分析及球队战术训练等提供决策支持.

关键词:视频;目标检测;识别跟踪;轨迹提取

中图分类号:G842文献标识码:a文章编号:1673-260X(2015)02-0182-02

随着计算机视觉技术和图像处理技术的飞速发展,基于视频的运动目标检测及跟踪技术在排球等体育项目中应用越来越广泛.针对排球比赛技术分析和指导的应用需求,本文以排球的检测跟踪及运动轨迹为研究对象,将计算机视觉技术、图像处理技术相结合,提出基于视频的排球检测、跟踪、轨迹获取整体解决方案,采用intelopenCV及matlab开发一套排球智能分析系统.系统采用双摄像机同步读取两个摄像头实时捕获的视频,获取不同方位的排球运动图像信息.通过标定两台摄像机的内外参数获得排球的三维坐标.从系统实时性和鲁棒性要求出发,使用背景差分法实现对排球的快速检测.同时结合排球的形状、颜色、亮度等特性实现对排球的识别与空间定位.利用排球的运动特性,建立并修正其运动轨迹方程.通过两个摄像头同步获得的轨迹曲线实现排球三维运动轨迹的曲线合成.该曲线不仅可以记录每一时刻球体的位置信息,而且包含球体的运动方向、运动速度、轮廓参数等信息.最后,分析球体轨迹曲线特征,并将轨迹模型包含的信息作为智能分析系统的输入,用于战略战术分析、队员动作分析等,为排球运动研究提供准确依据和决策支持,进而提高了比赛研究人员的工作效率.

1关键技术分析实现

基于视频的排球智能分析系统的设计与实现主要涉及视频帧处理、运动目标检测识别、运动轨迹提取等几方面技术.整个系统的工作流程如下:

(1)进行摄像机标定和场地标定,获得摄像机内外参数以及场地边界数据,同时将图像的像素坐标映射成实际场地坐标.

(2)接收由摄像机和图像采集卡等视频设备获取的数字信号,并将采集到的每帧数据保存为静态图像.

(3)比赛开始后启动系统,利用运动目标检测算法检测是否有运动目标.

(4)通过特定的运动目标跟踪识别算法从图像中分割并提取出运动目标.

(5)根据双目摄像机所获取的目标质心坐标得到排球的三维坐标值,记录其运动轨迹数据和轨迹特征,建立运动轨迹方程.

(6)将轨迹曲线特征作为智能分析系统的输入,用于比赛训练等的裁判决策和智能分析.

1.1视频信息的获取

本系统要根据采集到的视频信息获得排球的运动轨迹曲线图,因此要通过摄像机标定实现从视频设备中获得的二维图像到运动目标三维坐标信息的对应转换[1].系统首先采用线性标定或张正友标定等传统标定法对摄像机进行标定,获取摄像机的内外参数以及双目摄像机的位姿关系[2].完成摄像机和场地的标定后,接收由视频设备获取的数字信号,按一定的采样间隔进行采样,得到时变序列图像集,并将采集到的每帧数据保存为静态图像.系统通过双目摄相机可同时从不同角度获取两幅图像,然后基于视差原理恢复运动目标的三维几何信息[3].视频在生成以及传输过程中,会因外界环境的影响产生一些噪声,预处理阶段可采用图像滤波方法等对图像帧进行去噪处理,提高视频帧的质量,便于后期的分析处理.

1.2运动目标检测

由于摄像机和运动场地背景处于相对静止状态,而当前在静止背景下常用的运动目标检测方法有背景差分法、帧间差分法、光流法和运动能量法等[4].背景差分法是基于图像序列和参考背景模型相减实现运动目标检测的,是当前最常用的运动目标检测方法之一.它首先抓取图像作为背景图像,之后利用当前图像与背景图像差分从而检测出运动物体.该方法能够较完整地提取出运动目标,位置精确,实时性好,因此本系统设计中采用了背景差分法来提取排球运动模型,使用intel公司提供的计算机视觉函数库openCV进行图像处理和计算机视觉方面的算法.首先采集图像,然后统计特征点,检测当前系统状态下是否有运动目标.若有,则采集视频数据,并保存成序列图像.若无运动目标则保存背景继续检测判断.得到背景图像和含有目标的一帧图像后,利用图像减运算可得到背景差分图像.之后进行噪音去除、连通区域标记、基于排球亮度形状颜色等的特征匹配,对连续图像中的排球目标进行检测,通过分析排球对象在比赛视频中的面积、形态等属性范围目标区域边缘提取等筛选出候选排球对象,最终将目标识别出来.

1.3运动目标跟踪识别

国内外相关研究人员已经在球体的检测与识别方面做了相应的研究.刘斐等人提出一种混合颜色空间查找表的颜色分类方法,用于对图像进行颜色分割,并建立颜色查找表,依据颜色信息实现在线快速分类,识别球体.也有依据形状进行边缘信息提取来识别球体的.常用的边缘提取方法有prewitt算子、Sobel算子、Laplacian算子和Canny算子等,其中Canny算子能很好地提取出图像的单边缘信息,具有较快的速度.赛场上常用的“鹰眼”技术已经发展得比较成熟,主要用于体育赛事的即时回放,但回放时间的长度有限,且需要多个高速摄像机,价格比较昂贵.Lipton等使用空间差减法在真实的视频流中检测并跟踪运动目标.此外,有一种改进方法是使用三帧差分代替两帧差分.该算法计算非常快,在图像序列中检测运动对象非常有效.

1.4轨迹曲线提取

近年来,在众多学者的努力下,多种轨迹提取方法得以诞生.清华大学刘晓东等人成功研制了一种基于计算机系统的运动目标检测、目标跟踪及目标分类的智能监控系统.湖南大学万琴等人提出一种针对固定监控场景的运动检测与目标跟踪方法,利用运动预测技术实现目标匹配,但该方法在复杂环境下对多个目标进行跟踪时算法精确度大幅度降低[5].北航郝久月等人研究了监控场景中运动目标轨迹聚类算法.浙江大学的肖俊等人利用单个摄像机对人体未被遮挡部位的动作进行跟踪.熊荣炎等人通过分析视频序列图像的灰度特征,结合背景差分减法,提出一种静止摄像机条件下,基于特征值快速检测与跟踪目标的方法.

本文着重研究排球比赛视频中球体检测与轨迹提取的精确性、鲁棒性以及实时性等方面的问题.系统针对实际需要建立了基于球体运动方向、运动速度、轮廓参数等信息的多元组轨迹模型.分析并总结了经典的轨迹提取算法的优缺点,有针对性地研究如何利用候选球体的X、Y坐标值分布建立排球轨迹方程,并利用轨迹方程辅助、矫正排球的检测和跟踪,将识别出的球体的运动轨迹提取出来,提升算法运行速度,实现运动轨迹鲁棒提取,并将跟踪结果及运动轨迹以视频帧的形式展示出来.

1.5智能分析模块

智能分析模块可依据对排球运动轨迹变化情况的分析,研究排球比赛中运动员击球行为的检测、击球动作的分类、识别与分析技术等.

2基于视频的排球智能分析系统

2.1系统软硬件架构

基于视频的排球智能分析系统的硬件组成主要是由两个摄像机和计算机组成的双目视觉系统.两台智能摄像机与上位机组成一个局域网,其中pC机作为服务器,两台智能相机作为客户端,系统主要的运算任务如视频图像的采集处理等都在两台摄像机中并行完成,极大地分担了上位机的运算负荷,起到了平衡负载的作用,解决了常规两目视觉中的运算瓶颈问题.本系统中上位机不进行图像处理,只进行简单的运算如三维坐标计算、曲线拟合等.

软件部分使用intel公司支持的开源计算机视觉库openCV提供的函数进行计算机视觉算法方面的开发,采用VC++编程实现运动目标的检测跟踪算法,完成了摄像机及场地的标定、图像序列的获取、排球目标的检测、排球运动轨迹的提取、轨迹特征信息的分析等.

2.2系统实现

系统深入研究双摄像头下排球的识别检测跟踪与轨迹提取方法,为裁判辅助智能分析系统提供有效的数据输入和决策支持,同时满足系统的精确性、鲁棒性、实时性等方面的问题.

本系统采用张氏标定法对摄像机进行标定,分别获取两个摄像机的内外参数,进而用于排球三维坐标的获取.排球视频的采集采用高性能视频采集卡,采集方式有多种,常用的是采用VFw(VideoForwindows)硬件驱动开发包提供的接口或源代码开发.VFw使用简单方便,但可控性差.因此,系统采用基于源码的DirectX完成视频采集,它是微软开发的基于windows的一组api,通过DirectShow对象创建视频端口,可以灵活方便地操作硬件并获得各种所需的视频数据,实现视频流的压缩传输.系统使用intel公司支持的开源计算机视觉库openCV提供的函数进行计算机视觉算法方面的开发[6],排球检测与跟踪模块采用VC++编程实现,运行于windows操作系统上.背景差分法的实现过程中结合了排球的形状颜色等特征信息,及时更新背景图像,提高了排球的检测精度.运用形态学滤波去除噪音,并进行高斯滤波平滑图像,实现了排球的检测识别.最后通过卡尔曼预测原理对排球运动轨迹进行跟踪预测,得到排球运动轨迹曲线方程,并将轨迹曲线作为特征信息输入智能分析系统.整个智能分析系统的人机交互界面中可以设定摄像机的帧速率、场地信息等参数.摄像机控制区可控制两个双目摄像机的启动、关闭、捕获和载入视频等.同时,运用matlab在人机交互界面还可以显示通过双目摄像机得到的排球运动轨迹曲线图[7].

3小结

由于排球比赛视频背景复杂,镜头切换频繁,排球运动过程中其颜色、大小等特征信息会经常变化,且运动目标提取容易受到背景、光线变化、阴影、运动速度等因素影响,因此很难以单个球为对象建立一个有效的模型来检测运动球体.且许多运动对象或者某些区域在外形上与排球很相似,当球与球员和球场线接触或被球员遮挡时,会给球的检测造成很大的困难.因此,为了提高排球跟踪算法的精确性和鲁棒性,降低算法复杂性,必须提出新的目标识别检测跟踪算法,并保证系统的实时、准确、稳定等.此外,由于排球运动中存在自旋以及外界不确定因素的干扰,难以建立准确的运动学方程.因此,如何对一些经典的滤波算法进行改进,提出鲁棒性更高的轨迹获取方法,根据视频帧信息获得排球每时每刻的位置坐标和瞬时速度值等生成排球运动轨迹,也是系统的一个技术关键难题.结合排球轨迹信息,对视频进行更高层的语义分析是下一步需要研究的内容.

参考文献:

〔1〕张虎.机器视觉中二维图像的三维重建[D].北京:北方工业大学,2006.

计算机视觉分析技术篇7

一、计算机视觉检测技术含义

计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。

二、计算机视觉检测的基本原理

要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computervision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。

作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。

三、亚像素检测技术

随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。

边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。

四、计算机视觉检测技术在机加工零件检测中的应用要素与过程

(一)曲阵CCD相机

面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。

(二)工业定焦镜头

在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。

(三)数字图像采集卡

随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。

(四)标定板

为提高测量精度,需要进行摄像机标定。标定过程中,采用nano公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。

(五)背光源

背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。

五、结语

随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。

【参考文献】

计算机视觉分析技术篇8

关键词:openCV;计算机视觉技术;三维模拟技术

中图分类号:tp391文献标识码:a文章编号:1009-3044(2015)30-0137-02

21世纪是国际计算机技术高度发展的时代,人们生活中的每个角落都可以看到计算机技术的身影,尤其是现代计算机视觉技术和图像处理功能发展更加迅猛,各技术分支也逐渐趋于成熟。计算机视觉技术主要指的就是利用智能计算机系统来代替人类的眼睛对现实三维世界进行辨识和理解,整个过程均是计算机自我学习的过程,而随着这项技术研究的不断深入,其不再仅仅包含计算机技术科学,同时还涉猎了包括生理学、神经学、物理学、应用数学等多门学科,为人类科技的进步提供了有效的动力。

1计算机对视频中运动物体检测的原理概述

在现代计算机技术基础下,对视频当中的运动物体检测原理主要包括两种,分别是从微观和宏观的角度出发。其中宏观检测技术指的是当计算机截取了视频中的某一个图像,其以整幅图像为对象进行检测;微观检测技术是指在截取图像后,根据实际需求对某一区域内的图像内容进行检测。在计算机视觉技术实际应用时,其第一步就是对图像的采集,第二步是对已经采集的图像进行预分析处理,如果采用宏观检测技术则对图像整体进行分析;如果采用微观检测技术则首先将图像进行分割,然后对分割后各图像内容中出现的运动物体影像进行分析。在图像数据获取过程中应用的是背景差分法,这一技术主要是将背景和运动物体进行分离提取,以获取没有背景图像的运动物体影像数据。还可以利用帧间差分法,这种方法主要是对一个视频图像的逐帧画面进行差别比较,从而获得各帧图像上的差值,而将这些差值帧图结合起来就是一个物体在计算机视觉下的运动轨迹。现代研究者更倾向于将背景和帧间差分法进行结合运用,这样可以获得无背景下的运动物体轨迹,进而提升计算机视觉系统捕捉数据的准确性。

2openCV的应用概述

openCV是现代计算机视觉技术当中具有开源性的视觉库,其最早是由俄罗斯intel分公司所研发,不仅高效,而且具有兼容的优势。同时与传统ipL图像处理系统相比,openCV所处理的图像数据等级更高,例如在对运动物体进行特征跟踪、目标分割、运动轨迹分析以及三维模型重建等方面都有着巨大的优势。

openCV本身编辑的源代码是开放式的,编写过程简洁且方便,并且程序中大多数函数已经通过了汇编的最优化,使其能够更加高效地被应用。在使用openCV的摄像机标定模块已经为用户设计了实用性较强的接口,并且能够支持windows界面的操作平台,使得这一技术的操作更加简便。这一技术本身操作简便,对于编程人员和检验人员个人技能素质要求并不高,视觉技术系统研发人员可以利用简便的操作来检验其设想是否能够实现,这就使得现代计算机视觉技术开发团队能够形成更好的协作研发关系,进一步提升技术研究效率。目前已知openCV编程系统在航空航天定位、卫星地图绘制、工厂大规模生产视觉检测等方面得到了广泛的应用,同时对于无人飞行器的视觉捕捉技术也有极大的帮助。最为重要的是openCV编程语言的兼容性较强,编程人员可以根据自己的意愿对源代码进行披露,并且国内也已经形成了规模较大的交流社区,给更多同行业者提供答疑解惑的场所,进一步扩大了openCV的应用范围。

3基于openCV的计算机视觉技术

3.1基于openCV下的运动物体检测技术

在常规运动物体检测技术下,均是直接通过图像背景和运动物体的区分来实现运动物体的捕捉。而基于openCV下的运动物体检测技术则不仅能够针对于图像背景的分离实现运动物体的观察,还可通过物体本身特定的信息来进行检测,主要包括形状、轮廓以及颜色等。这样就能够实现在复杂的背景当中将特定的运动物体完整抽离出来。其基本流程包括:首先,对影像数据当中某一时间点的图像进行捕捉,然后对这一视频图像的格式进行转化;其次,对转化格式后的视频图像进行早期处理,并将运动物体和复杂的背景区分开,降低周围各环境因素对运动物体主体图像的影响;第三,根据完成提取后的运动物体图像进行辨识,然后再从视频当中捕捉拥有相同特征的物体,并对该物体进行跟踪识别。而这一过程的实质则在于先利用图像捕捉技术对画面进行截取,然后同时利用背景差分法和帧间差分法对图像进行分割,逐帧地将运动物体完成提取出来,以供计算机进行视觉跟踪处理。

3.2基于openCV的图像预处理技术

一般情况下,计算机视觉处理技术应用的环境情况较为复杂,大多数应用环境当中均有光照的变化,并且部分计算机视觉处理设备还需要在露天环境下进行工作,此时周围环境中的风、温度、光照、气候以及运动物体数量等对视频图像的采集均有着极大的影响。环境因素会使图像采集的质量大幅度降低,同时图像当中的噪点问题也难以避免,而噪点是视觉捕捉和图像处理当中最大的影响因素。因此,在基于openCV下的计算机视觉技术在捕捉视频图像之后先对其进行预处理,然后再由系统对运动物体进行分离、检测和跟踪。一般的预处理过程主要包括平滑度滤波、图像填充、背景实时更新等。

1)图像的平滑度滤波预处理技术

由于在实际计算机视觉捕捉过程中图像噪点是难以避免的问题,以此在对图像中运动物体进行检测前,应该相对这些噪点进行预处理,降低环境噪声对图像的影响。图像的平滑度滤波处理共分为两种方式,分别为线性和非线性。其中线性处理方式就是通过计算机处理设备的简单运算,对图像当中的噪点进行直接清除,但这一技术使用后会造成截获图像模糊不清的情况,因此仅对噪点较少的图像采用该处理方式;非线性滤波处理则是利用复杂的图像处理运算,将截获图像当中的噪点无限缩小,使其不对图像整体造成影响,并且可以有效保证图像的局部调整,但这种处理方式在运算时速度没有线性滤波处理快,因此需应用在噪点较多,图像信息较复杂的处理当中。

2)图像的填充预处理技术

这一处理技术在使用过程中运算速度较慢,主要是由于其需要对逐帧的图像均进行处理,也包括两种处理方式,分别为边缘填充和腐蚀膨胀处理。其中边缘填充处理主要指的是在确定运动物体之后,利用计算机系统自身的边缘检测处理技术,对物体的轮廓进行辨识,并利用形态学上的漫水填充方式对运动物体周围的噪点进行颜色填充,减小其对画面整体元素的影响。而腐蚀膨胀处理与边缘填充处理原理相类似,但这种处理技术主要是针对于噪点进行腐蚀和膨胀,使其在画面当中所占比例扩大,但对运动物体本身不造成影响,这使运动物体和噪点之间的差异就会更加明显,就可以将噪点的影响降到最低,但这种处理方法的效果和摄像机本身的性能、质量等有着密切的关联。

3)背景的实时更新预处理技术

在进行运动物体和背景分离过程中,计算机系统需要对图像上的背景元素进行辨识,并对其开展初始化处理,这样就能够为后期实时背景图像的差异进行凸显,以增加前景图像的效果,降低噪点对图像的影响。在运用这一技术时,首先要先对第一帧的图像进行确定,并将第一帧图像当中的背景图像元素进行辨识,然后在后期图像更新和运动物体检测过程中对背景进行实时更新处理。在更新的过程中其流程主要包括:首先,系统要对所读取的画面进行有效的判断,了解该图像是否为第一帧;其次,将opencv处理的图像转变为单通道灰度值;第三,对转变后的图像进行高斯平滑度滤波处理,将图像当中的噪点进行去除;第四,采用形态学噪点填充技术对图像当中的噪点进行二次处理,以获得所需要更新的背景图像。

3.3前景运动物体的提取技术

在计算机视觉技术进行运动物体的检测时,只有有效保障检测流程的准确度,才能够有效保障对前景运动物体的跟踪效果。其主要分为两大步骤,其一是对二值化后的图像数据进行分割处理;其二是在图像分析前对其进行充分的填充处理,保证前景图数据的完整性。同时,在前景图像提取的过程中也分为多个步骤,其包括:首先,对所提出的前景图像和背景图像进行差分处理;其次,将差分处理后的图像二值化处理;第三,对背景当中前景物体的轮廓或边缘进行辨识,根据前景图像的轮廓对其进行填充。由于在实际操作过程中,摄像头所处环境的变化较大,并且会在不同场所内的不同角度捕捉画面,因此就需要在前景图像提取时有效提高背景图像实时更新的效果。

利用阀值二值化的分割方式能够有效将前景图像和背景图像分离开,从而使目标运动物体能够呈现独立化,并且阀值分割方式开展前要相对每个像素点进行确定,判断其是否位于灰度值的范围内。而将该图像的像素灰度和阀值进行对比后会出现两种结果,分别是灰度值低于或高于阀值。在实际应用过程中,有效确定图像的分割阀值t,就能够降低环境当中光照因素对图像质量的影响。

4计算机视觉技术当中的三维重建技术

1)三维重建的视觉系统

计算机视觉技术在对图像进行捕捉时可以视为是对大量的图像信息进行处理,从摄像机的视觉角度出发,其所输入的图像一般为二维属性,但输出的信息确是三维数据,而这种三维空间数据能够提升对运动物体所处空间位置、距离等描述的准确性。在三维重建视觉系统工作过程中,其相对基本的图像数据框架进行确定,然后利用一个坐标点建立2.5D图像数据,即以此点为视角能够观察到的图像数据,再将2.5D图像数据进行整合从而建立三维图像。

2)双目视觉系统

当人体利用双眼在不同角度、同一时间内观察同一个物体时,就可以利用算法来测量该物体和人体之间的距离,而这种方法也被称为双目立体感,其应用的原理主要是人体视觉差所带来的影响。同时利用两台摄像机对同一图像从不同角度进行观察,就能够获得人体双目观察后的效果,因此这一三维重建技术也被称为“双目视觉系统”。两台不同的摄像机即可代表人体双眼,其对图像进行逐帧捕获,但由于角度不同和环境影响因素的差异,因此造成了图像差异,必须对其捕捉的图像进行预处理。

3)三维重构算法

在计算机视觉技术中对于视频流的采集主要依靠的是彩色摄像机、红外摄像机、红外接收摄像头等设备。还可以利用微软所提供的Kinect设备,在进行运动物体检测前能够对nUi进行初始化处理,将系统内函数的参数设定为用户信息深度图、彩图、骨骼追踪图等数据。在使用Kinect设备对视频流进行打开时,其可以遵循三个步骤,其一是彩色和深度数据的处理;其二是根据数据的索引添加颜色信息,并将其引入到深度图数据当中;其三是骨骼追踪数据。

5结束语

计算机视觉捕捉技术是现代计算机应用当中较为先进的内容,其应用范围较广,对于运动物体的捕捉准确度较高,能够有效推进现代计算机模拟技术的发展。

参考文献:

[1]张海科.基于opencv的人手识别与跟踪定位技术研究与实现[D].昆明:云南大学,2013.

计算机视觉分析技术篇9

关键词:数字图像处理;测距;聚焦;频域

中图分类号:tp391.41文献标识码:a文章编号:2095-1302(2012)09-0016-03

imagesrangingmethodbasedonfrequencydomainanalysis

ZHUXue-yi

(SchoolofmicroelectronicsandSolid-Stateelectronics,UniversityofelectronicScienceandtechnology,Chengdu610054,China)

abstract:Usingdigitalimageprocessingtheoriesandmethods,thedigitalimagepre-processingmode,thetargetgraphicdetectionandtherangingmodelconstructionarestudiedandanalyzed.Combinedwitharangingschemeofsinglecamera,afocusingrangingtechniquebasedonfrequencydomainanalysisisgiventoprocessimagescapturedbythemonocularcameraandcalculatethedistancefromtargetdetectionimagetothecamerabasedonfrequencydomainimagesignals.thetechniquesaveslotsofcomplexhardwareandreducesthedemandsofdigitalimageprocessing,whichhastheadvantagesofhighrangingprecisionandfastprocessingspeed.

Keywords:digitalimageprocessing;ranging;focusing;frequencydomain

0引言

视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80%的信息是由视觉获取的。计算机视觉就是人类利用计算机实现人的视觉功能,从而对客观世界三维场景进行感知、识别和理解。计算机视觉是一个相当新而且发展迅速的研究领域。

在对生物视觉系统的研究中,人们早就注意到,几乎所有具有视觉功能的生物都有两只眼睛。用两只眼睛同时观察物体,会有深度或远近的感觉,我们称之为视差。因此,在计算机视觉系统中,也常用两台或多台摄像机从两个或多个视点去观察同一场景,从而获得在不同视角下的一组图像,然后通过同一场景点在不同图像中的视差,推断出场景中目标物体的空间几何形状和位置,这种方法称为立体视觉。它是计算机视觉的一个重要分支,也是计算机视觉的核心研究内容之一。

视频和图像是对物质世界客观事物的形象而生动的描述,是最直接且具体的信息表达形式之一,是人类最重要的信息载体。随着科技的日益发展,人们需要一种更加先进快捷的工作方式,另外,人们对工作环境和工作条件也提出了更新、更高的要求,视频测距系统便在这种背景下应运而生。

视觉测距技术的发展对于距离测量有重要的意义。在基于数字图像处理技术的视觉测距系统中,使用单个CCD(ChargeCoupleDevice)摄像机的系统称为单目摄像系统,而同时使用两台摄像机对同一景物进行摄像,并运用计算机分析两幅图像来确定物体的三维状况的系统称为双目摄像系统。双目摄像系统测量精度高,但计算速度较慢,成本较高。而单目摄像系统方法则比较简洁、快速,因此,本文对采用单目摄像系统检测目标物的测距方法进行研究。

1测距技术在国内外的研究现状

目前,国内外对视觉测距技术的研究仍在不断的进行之中,还并没有形成国际统一的标准模式,各种数字图像处理技术和算法之间孰优孰劣仍在不断的探讨和比较中。当前,国内外的研究机构主要研究的测距技术包括超声波测距技术、微波雷达测距技术、激光雷达测距技术和视觉测距技术。

1.1激光雷达测距

激光雷达测距具有测量时间短、量程长、精度高等特点,但激光雷达在恶劣天气环境下或逆光状态下的测距准确性降低,另外,其造价、耗能、对人眼安全等因素也对其进一步应用有一定影响。

1.2超声波测距

超声波是指振动频率在20kHz以上的机械波,具有声波传输的基本物理特性。超声波测距是根据超声波反射时间来计算与前方车辆之间的距离。超声波测距原理比较简单,成本低,但超声波的传输速度受天气影响较大,不同天气条件下的传输速度不同。

计算机视觉分析技术篇10

关键词:视觉识别技术;电气自动化;机器视觉系统

视觉识别技术在工业电气自动化控制中的运用由机器视觉系统实现,根据工业生产需求,应用机器视觉系统替代生产人员,在非接触的情况下完成测量,非常适用于生产环境危险性较高的钢铁工业领域。钢铁企业应从自身生产流程入手,在合适环节引进机器视觉系统,发挥视觉识别技术优势,创造更高收益。

1.视觉识别技术特点

1.1视觉识别技术的原理

视觉识别技术,是通过计算机技术模拟人的视觉,采集观察对象的信息,实现观察对象的准确识别与判断,再根据识别判断结果实施智能控制操作。机器视觉系统以光学检测原理为基础,通过相机采集观察对象的图像,将图像信息以2D或3D图像信号形式传输至图像处理系统,图像处理系统从图像的像素、亮度、颜色等因素入手,抽取观察对象的图像特征;再利用系统配置的算法与观察对象的工艺生产流程、标准参数,如检测观察对象偏移量、弯曲度,计量观察对象的个数,评估观察对象是否合格等;最后由控制系统根据视觉识别结果与传感器检测结果,发出控制指令,使生产设备表现出相应动作,完成观察对象的智能控制。

1.2视觉识别技术的优势

在工业电气自动化控制领域,基于视觉识别技术的机器视觉系统具有如下优势:①机器视觉系统可在不接触的情况下完成各项识别与检测工作,延长检测设备使用寿命,降低生产成本;②机器视觉系统的运用,可省略人为检测环节,减轻工作人员负担,规避恶劣生产环境下的安全风险,还可规避人为因素对生产的影响,提高识别与检测质量,降低人工成本;同时,设备使用寿命长;③视觉识别技术的框架固定通过计算机系统程序和算法实现自动化控制,具备移植性,可在不同生产领域推广普及;④视觉识别技术的应用可有效提升工业电气自动化控制的智能化水平,使企业获得更高的实质性收益,有助于企业高质量发展。

2.视觉识别技术在工业电气自动化控制中的运用方式

视觉识别技术在工业电气自动化控制中的运用体现在生产识别与生产检测两个领域。本文结合钢铁集团企业的生产实践,总结视觉识别技术的实践运用方式,为企业落实视觉识别技术、发挥视觉识别技术优势提供有益探索。

2.1用于生产识别领域

在生产领域,需识别控制的内容涉及生产全过程,技术人员应根据钢铁企业生产特点,分析生产识别需求,配置相关的视觉识别设备,实现智能化视觉识别,为工业电气自动化控制提供便利。在钢铁集团企业的生产准备环节,需进行原材料识别;在生产过程中,需进行设备识别;在产品生产后,需进行缺陷识别,精准控制产品生产全过程,以提高工业电气自动化控制效果。2.1.1识别原材料用量视觉识别技术可通过图像分析,统计原材料的数量,分析其是否满足生产要求,实现原材料供给环节的电气自动化控制。以钢铁集团企业生产的轧钢加热炉生产为例,该设备负责加热钢坯,将钢坯的温度提升至轧制要求,并使钢坯内部温度分布符合生产要求。在轧钢加热炉生产时,配置专用加热炉上料装置实施钢坯运输,该装置包括上料台架、挡钢钩、拨钢叉、输送辊道等构建,具体上料流程如下:控制吊车逐一吊放钢坯,要求钢坯在上料台架上排列有序;再利用步进驱动装置与加热炉上料装置的挡钢钩,逐一将钢坯转移至拨钢叉区域,要求转移频率与加热炉生产节奏保持一致;拨钢叉负责将接收的钢坯运输至输送辊道上方;最后由辊道将钢坯转移到加热炉内,实现加热处理。在传统识别工作中,通常在输送辊道两侧配置金属检测元件,检测钢坯在输送辊道上的运输状态,控制钢坯自动从输送辊道转移至加热炉内。但在输送辊道前的运输环节,均由工作人员用人眼识别钢坯的位置、分析拨钢叉的运行状态,并通过工作人员的手动操作,控制上料台架驱动装置。如果运输的钢坯温度较高,需工作人员实施挤坯操作,确保相邻钢坯间规范有序排列,避免钢坯出现变形。人工视觉识别过程枯燥,操作单一,易使工作人员产生视觉疲劳和操作疲劳,出现识别偏差或操作误差,影响生产质量。针对人工识别问题,钢铁集团企业基于视觉识别技术和定位技术,开发专用机器视觉系统,与工业电气自动化控制系统配合应用,共同构建智能加热炉上料系统。在实际运用中,技术人员应在上料台架部位安装高清摄像机,从多角度采集钢坯的图像,通过视觉识别技术了解钢坯状态,结合定位技术确定钢坯具置,并在工业电气自动化控制系统中引进人工智能技术,通过机器学习,模拟工作人员的上料台架驱动装置控制操作,准确控制拨钢叉等设备,提高钢坯运输控制的智能化水平,发挥视觉识别技术作用。在钢铁企业生产中,基于视觉识别技术的加热炉上料系统,适用于推钢式、台架式等多种类型的加热炉,可在生产中推广普及。2.1.2识别设备位置在钢铁企业生产中,部分环节需转移设备构件,设备构件位置的准确性直接影响生产效益。以加热炉加热钢坯环节为例,在钢坯上料过程中,需使用吊车运输钢坯材料,要求台架在吊车上料时暂停步进,避免吊车运行冲击台架。为保护台架,需进行吊车位置的识别操作,传统生产工艺中由操作人员目视吊车的位置,手动操作台架步进,易出现目视偏差、操作失误的问题。基于视觉识别技术的机器视觉系统,可采集吊车生产运行时的图像,利用机器视觉系统内置算法,准确定位吊车的具置,在吊具靠近台架时,向控制系统发送指令,再由控制系统控制台架停止步进,实现台架的智能化控制,既可简化生产操作,也可提高生产效率,延长设备使用寿命。2.1.3识别损坏产品在钢铁企业生产中,损坏原材料和损坏成品的识别是工作重点。传统生产中,由生产人员目视观察原材料和成品是否存在明显缺陷,极易出现检测偏差。虽然部分企业引进智能检测设备,通过传感器检测原材料及成品结构,但还存在检测遗漏的问题。技术人员可引进视觉识别技术,将图像分析结果与机器学习配合应用,精准定位原材料或产品缺陷,保障生产质量。例如,在某钢铁企业的钢坯缺陷识别中,技术人员将视觉识别技术与大数据深度学习算法配合应用,利用图像分析结果,准确计算钢坯的弯曲率,并将计算结果与标准数值对比,分析弯曲率不合格的钢坯,实现智能化、自动化生产控制。

2.2用于生产检测领域

在钢铁企业生产中,检测内容包括材料质量、产品质量、设备运行状况等,产品质量检测可由缺陷识别环节完成,设备运行状况的检测通过检测设备参数来实现。在钢铁集团企业中,技术人员可利用视觉识别技术进行材料质量检测与设备参数检测,再根据检测结果实现材料与设备的自动化控制。2.2.1材料质量检测在钢铁企业生产中,部分原材料需在使用前进行表面质量检测,为解决人工检测的缺陷,技术人员可通过视觉识别技术实施材料表面质量的在线检测,并根据在线检测结果,为电气自动化控制提供参考,控制生产设备的操作,避免不合格材料用于生产实践。例如,针对带钢检测需求,技术人员通过高速相机拍摄处于运动状态的带钢表面图像,再通过动态阈值分割算法分析带钢表面图像,提取图像特征,通过特征提取算法分析带钢是否存在缺陷,并将带钢缺陷图像进行整合,构建带钢缺陷分类库。在带钢缺陷分类库的信息达到一定层级后,实施卷积神经网络训练,对带钢缺陷进行分级。在实际生产中,机器视觉系统可在检测带钢缺陷的同时,对存在缺陷的带钢进行分类,实现材料质量的科学管控。2.2.2设备参数检测在钢铁企业生产中,设备参数是安全可靠生产的关键要素,设备参数检测方法相对多样,视觉识别技术是设备参数检测的新方法,适用于液位检测等可用肉眼观察的参数检测。例如,在电渣连铸工艺中,技术人员可用视觉识别技术进行结晶器液位检测,与工业电气自动化控制系统配合应用,确保液位处于标准范围,保障电渣锭生产质量。考虑到液面分解的可测性、测量误差及干扰因素等影响,技术人员在采集液面图像的基础上,通过滤光片对结晶器液位图像进行滤光处理,分析滤光处理后的图像灰度值、像素等参数,准确定位结晶器液位;为保障测量精度,选择500万像素的相机,其测量液位范围为0~290mm,并在检测前通过标定分析液位和图像高度的关系,避免测量误差的出现;为避免钢铁企业高温高压生产环境的影响,技术人员在距离结晶器1.5m的位置实施检测,确保相机在此温度环境下能够正常运行,并为相机配置密封机箱,避免湿度或灰尘影响图像采集效果,必要时可在结晶器口设置抽气装置,避免生产产生的烟雾影响图像清晰度。在实际生产中,视觉识别技术可精准获取结晶器液位,在液位超标时报警,由工业电气自动化控制系统进行处理,实现智能化生产。

3.结语