首页范文大全图像识别技术的基本原理十篇图像识别技术的基本原理十篇

图像识别技术的基本原理十篇

发布时间:2024-04-25 20:16:33

图像识别技术的基本原理篇1

随着科技和信息技术的不断发展,人们对自动化信息采集和智能化管理的需求越来越高。货车作为港口物流的主要载体,流量大、人工管理成本高。为解决这一问题,文中提出了一种基于图像识别与RFiD技术的货车进出管理系统。该系统采用图像识别技术和RFiD技术,能够自动识别货车车牌并判断其进出方向及权限,并可自动保存车辆进入、离开识别区域的图片或视频。

关键词:

图像识别;射频识别;进出判断;鉴权

0引言

随着物联网技术的不断发展,使用电子车牌来管理机动车的RFiD技术逐渐成熟,其最典型同时也是最广的应用场景是小区和停车场的车辆进出管理,给每一辆进入小区或停车场的车发放一张RFiD标签作为车辆的唯一标识,用以完成身份识别和计费等自动化管理。最近几年,图像识别技术获得了实质性的突破,集成了图像识别模块的高清摄像机可以独立完成车辆的车牌识别。但RFiD技术和图像识别技术都有各自的缺点,RFiD技术在车辆进出管理时无法解决跟车问题,而图像识别在光线极差或车牌有污泥等障碍物遮挡时无法获取车牌[1]。本文提出的基于图像识别与RFiD技术的货车进出管理系统将图像识别技术和RFiD技术结合起来,取长补短,相互补充,提高了系统的识别率和准确率。

1图像识别技术与RFiD技术的工作原理

图像识别技术主要利用计算机对视频或图片中的信息进行特征分析,货车的车牌自动识别主要采用视频处理、模式识别及人工智能技术。通过红外光栅或地感线圈触发,实现单个货车车牌的准确识别。近些年,随着技术的进一步发展,无需外部触发装置的车牌识别系统即可对区域内一个或多个车辆的车牌进行实时识别。RFiD技术作为物联网技术的一种,分为无源RFiD技术、有源RFiD技术和半有源RFiD技术[2]。无源RFiD技术的工作频段为900mHz左右,优点是标签成本低,且标签不需要维护,缺点是设备成本高,读卡距离近。有源RFiD技术的工作频段为433mHz左右或2.4GHz左右,其优点是通信距离远,缺点是标签使用寿命约为3年,且读卡距离不容易控制。半有源RFiD技术将低频125kHz左右与高频2.4GHz左右相结合,低频唤醒,高频通信,优点是低频边沿控制,标签低功耗指标好,缺点是标签成本高。本系统中的RFiD技术采用有源RFiD技术配合定向天线,读卡距离控制良好。

2货车进出管理系统设计

基于图像识别与RFiD技术的货车进出管理系统包括高清图像抓拍机、红外对射光栅、有源RFiD定向阅读器和有源电子标签。标签放置到货车上,作为货车的唯一标识,与车辆的车牌有唯一关联。阅读器和摄像头被分别架设在安全岛的进出方向,通过调整阅读器的读卡范围和摄像头的图像识别区,保证阅读器的读卡和摄像头的图像识别联动,配合特殊的关联算法,以进行车辆的车牌识别、进出判断及权限管理。红外对射光栅作为辅助触发摄像头图像识别的设备,在光线不足或存在其他因素导致摄像头不能独立触发图像识别时,辅助、触发摄像头进行图像识别[3]。当安装有源电子标签的车辆进入或离开码头时,有源电子标签被有源阅读器读取,车辆进入图像识别区域后,车辆车牌被摄像头识别,后台的阅读器和摄像头关联算法会自动关联车牌与电子标签关系,并判断车辆的进入或离开权限,记录车辆进入或离开的图片或视频,根据权限判定结果选择放行或告警。

3图像预处理及RFiD关联算法

图像识别率受外界环境,如光照强度,角度等因素影响,为提高识别率需要进行图像预处理和图像边缘检测。所谓图像预处理即采用图像灰度转换、图像增强、倾斜矫正等技术,对所采集的图片进行系统预处理操作,降低图像识别算法的复杂度,提高识别的准确率。所谓边缘是指图像周围像素灰度有阶跃变化或屋顶变化的像素集合[4],这是图像识别最基础的部分。由于光线相对弱、目标是动态物体、抓拍机角度有倾斜等原因导致摄像头抓拍到的图像信息相对模糊,因此需要进行图像预处理[5]。RFiD关联算法的核心是预先知道摄像头图像识别区和RFiD读卡控制区以及触发或自动识别的起始点。文中的RFiD读卡区域比图像识别区稍大,即车辆上的电子标签先被读取,阅读器上报标签iD到服务器平台作为缓存,图像识别完成后关联对应的电子标签,最后进行车辆是否准许进入或离开的鉴权。

4结语

本文提出了基于图像识别与RFiD技术的货车进出管理系统,介绍了图像识别技术与RFiD技术的工作原理,讲解了货车进出管理系统设计,阐明了图像预处理及RFiD关联算法。基于图像识别与RFiD技术的货车进出管理系统投入使用后,大大提高了车辆的管理效率和方便性,车辆的历史运行轨迹和视频可查,方便追溯,达到了安全管理、科学管理的目的。

作者:朱虹杨登辉单位:中国电子科技集团第五十二研究所物联网事业部

参考文献

[1]周治国,李文印,李同,等.基于RFiD的新型机动车号牌及自动识别系统[J].吉林大学学报(信息科学版),2008,26(4):374-379.

[2]祁超.RFiD射频识别技术及频段划分[J].电信快报:网络与通信,2010(3):14-16.

[3]刘雪飞,贾勤,胡东明.一种基于RFiD技术的货运车辆管理系统[J].物联网技术,2014,4(5):22-23.

图像识别技术的基本原理篇2

注:下表中各项可加页。

一、课题来源

源于学校实际需求。

二、研究目的和意义

2.1

研究目的

在大多的验证身份的生物技术当中,指纹验证应该是最简单、方便、可靠的一种技术手段。而如何有效地使用指纹验证系统,把它引入到高校考勤当中,改革以往传统的考勤方式中的漏洞已经成为一个非常重要的问题。结合指纹验证的特点,研究并提出一种指纹考勤的有效方案。在此基础上,设计和开发一个指纹学生考勤原型系统,并以我校作为其应用背景。

2.2

研究意义

随着学校的改革发展,加强教学和学生工作管理过程中,考勤是一项重要的内容。目前教师对于上课考勤以及考试的身份认证主要采用人工纸笔登记的方法。相关部门对全校的考勤统计不但工作量大,容易出错,而且不能及时公布学生当天的考勤情况。同时也不便于对教师在岗情况进行考查。随着数字技术、计算机网络与通信技术的飞速发展,在校园网已基本建成的前提下,开发基于校园网的网络考勤系统是一种比较好的方案。相对于其他的生理特征,指纹的唯一、不易丢失和终身不变特点使指纹识别在国家安全、门禁系统、考勤制度、身份管理等领域起着鉴定和记录身份的作用。

近年来,越来越多地吸引研究者从事指纹验证方向的研究,并且已经有不同的指纹考勤系统在不同领域得到应用。但在高校的考勤中还有待更多地实践和关注,特别是如何结合学校的具体情况进行合理的设计实际具有极其重要的理论意义和应用价值。

三、国内外现状和发展趋势

3.1现状

3.1.1指纹识别技术

指纹是人手指末端正面皮肤上凸凹不平产生的纹线,纹线有规律的排列形成不同的纹型。这些皮肤的纹路在图案、断点和交叉点上各不相同,在信息处理中称为指纹的特征点。每个人指纹的纹路在图案、断点和叉点上各不相同,是唯一的、终身不变的,依靠指纹特征的唯一和稳定性,可以把一个人同他的指纹对应起来,通过提取他的指纹与预先保存的指纹模板进行比较,就可以验证身份,这种依靠指纹特征来进行身份验证的技术称为指纹识别技术。由大量关联了标识号或姓名的指纹特征模板所构成的数据库称为指纹特征模板数据库,而由指纹原始图像与标识号或姓名关联的数据库则被称为指纹原始图像数据库。通常登录和采集建立指纹特征模板数据库的同时,必须同时保存指纹的原始图像数据,建立备份的指纹原始图像数据库。典型的自动指纹识别系统处理流程由以下步骤构成:首先对指纹图像采集,再进行图像预处理,再对细节点提取细化,最后指纹匹配。

在对图像进一步预处理,经过自动图像预处理可得到较干净的点线图,图像预处理步骤一般分为图像的归一化、方向场的计算、图像的滤波增强、二值化和细化。使用指纹图像进行图像增强的方法,提高指纹图像质量,可采用的方法有:方向加权中值滤波、各项异性滤波、基于规则的图像增强、基于模糊逻辑图像增强、Ga-bor图像增强。其中,Ga-bor图像增强是比较常用的一种。

3.1.2指纹图像采集

指纹识别的应用,要求指纹纹理以数字形式进行运算。指纹图像采集,主要就是将人体的指纹信息转换为可使用计算机进行处理的数字数据。常用的指纹采集设备有光学式、硅芯片式、超声波式等三种,其中光学指纹采集器是最早的指纹采集器,也是使用最为普遍的。

3.1.3指纹识别系统的设计

在整个指纹识别系统中,指纹识别子系统是最重要的组成部分。该子系统的主要功能,是实现了在客户端指纹图像采集,指纹模板生成和存储,指纹图像匹配等。在应用系统的设计上主要考虑模块的设计、数据库设计。

3.1.4指纹应用系统

目前,指纹识别技术的应用系统主要有

2种:嵌入式系统和连接

pC的桌面应用系统。嵌入式系统是一个相对独立的完整系统,

它不需要连接其他设备或计算机就可以独立完成其设计的功能,而连接

pC

的桌面应用系统具有灵活的系统构,并且可以多个系统共享指纹识别设备,可以建立大型的数据库应用。

3.2

发展趋势

指纹识别由于其技术的成熟和成本降低,开始彻底走向民用。在经历了近10年缓慢的自然增长后,指纹识别技术即将迎来一个跳跃性发展的黄金时期。指纹识别技术的巨大市场前景,将对国际、国内安防产业产生巨大的影响。目前,指纹识别主要应用在考勤等领域。相信,随着指纹识别技术的完善,不仅仅应用到各类考勤系统中,还可以拓展到联网、远程监控中。指纹作为一个非常有效的识别手段,在以后的发展中即有着它不可替代的作用,又孕育着巨大的商机。我们相信会有越来越对的人士投入到其产业化的进程中来。

参考文献:

[1]谢健阳,李铁才,唐降龙,佟喜峰

指纹识别系统的设计与实现.微计算机信息(嵌入式与SoC)

[2]张 帆

,

杨凌云

高校网络指纹考勤系统的设计与实现.信息技术

[3]周广杰,范钦满,赵志国指纹点名系统在高校教学管理中的应用.教育长廊

[4]吴宝阳,甘志刚,张彤,肖南峰,韩坚华,用于互联网用户身份认证的指纹识别系统设计与实现.装备制造技术

[5]朱剑民.指纹识别技术在罪犯指纹点名管理系统中的应用[D].成都:电子科技大学,2005.

[6]段少雄,田捷,李恒华.高效指纹考勤系统的研究与设计[J].计算机工程,2003,29(9):37~38.

[7]奚建荣.基于局域网的指纹考勤系统的设计实现[J].现代电子技术

[8]刘记.

无线指纹考勤系统的设计与实现[D]

.

河北工程大学硕士论文,2007.

[9]宋宇.

基于FpGa

的指纹采集卡的研究[D]

.

辽宁工程技术大学硕士论文,2007.

[10]杨文忠,章兢.

基于串口服务器的指纹网络考勤系统[J

]

.

嵌入式网络技术与应用,2006

(5)

:12

-

16.

[11]郭国伟,刘大茂

指纹图像质量评估的研究与应用.计算机与数字工程2009年第12期

[12]马文科,王玲,何浩

基于以太网的指纹门禁控制器设计与实现.微计算机信息(嵌入式与SoC)

[13]尹雅莎,尹浩,冀强

基于指纹识别算法的识别技术研究与应用.现代电子技术2008年第24期

[14]

李翠华,苏秀英,詹金兰,韩天

指纹识别在新型学籍管理系统中的应用

厦门大学学报(自然科学版)

[15]李文藻,邹兴平

指纹信号的识别特征提取和处理技术

西南民族大学学报

[16]林国清,

李见为,

王崇文

指纹图像的预处理[J].

计算机工程,

2002,

28(9):

179-180.

[17]孙晖,赵菁

一种基于指纹识别的通用型网络考勤系统

计算机工程2002年12月

[18]王芳,沈林武

一种指纹模块在考勤终端中应用与研究

[19]孙彩云,赵远东,高超等

基于internet的远程数据采集系统设计与实现[J].微计算机信息,2007,23.

[20]李波,王祥凤,史江萍,胡俊宇

基于指纹识别技术的考生身份认证系统.电脑开发与应用

[21]苏文新,郑东

一种基于一次性口令和指纹识别的身份认证方案.计算机工程

[22]彭曙蓉,王耀南

一种基于指纹识别的网络考勤系统.长沙电力学院学报(自然科学版)第21卷第2期

[23]彭曙蓉,

彭楚武,

杨文忠

指纹iC卡在考试身份认证系统中的应用[J]

.计算机与现代化,

2003,

10

:

85-87.

[24]李鑫,

惠晓威,

张全贵

基于智能卡和指纹识别的校园综合系统[J]

.

微计算机信息,

2004,

20

(

9)

:

110-111

[25]魏发建,游敏娟,王保帅,赵传华,王世刚

浅谈指纹识别的基本原理.

中国科技信息2009年第10期

[26]尹立强,苏新红

智能指纹识别系统的设计[J].科技创新导报.2008,27:20-21.

[27]张海春,回文博,林立忠

指纹识别技术研究进展.

石家庄学院学报

第7卷第3期

四、主要研究内容、途径及技术路线

4.1

主要研究内容

(1)系统技术研究

指纹识别技术是用于学生考勤中检测其信息的一种非常有效的技术。在考勤过程中,对识别技术所要求的普遍性、唯一性、可采集性、可行性、可接受性、防伪性,该方法都可以达到。拟将结合面向对象语言和microsoft

SQL

Server2000数据库,开发采用指纹考勤机,以遵循

tCp/

ip协议的以太网为传输媒介,包括上层管理系统和指纹考勤终端。

(2)指纹识别高校考勤系统的设计与实现

在指纹识别技术的基础上,设计和开发一个高校考勤系统原型。拟采用学校学生考勤作为其应用背景。

4.2

研究途径及技术路线

(1)系统技术研究过程

基于指纹的学生考勤系统是一个集成了多种高新技术的复杂系统。技术的选择也应以实用、可靠、稳定为主。

①由于在采集过程中会涉及到比较多的人数,所以要求在采集时每个人都应注意手指的清洁和干净度,尽量防止人为因素影响图像质量。

②在指纹识别算法上,我们利用自动指纹识别系统进行指纹识别。

③在考勤过程中,建立学生的考勤指纹库由专门的数据服务器保存,在所有教室配备指纹考勤终端,包括实训基地和农业大棚实训基地,支持后台服务器验证比对,通过连接计算机网络,完成自动上传考勤记录功能,同时,学校的教师办公室以及教务处、院长办公室等,都可通过本机查看实时考勤情况,并可在不同情况下,对每个教室信息,使考勤结果更加准确。在考勤过程中,同时也可以考核老师到勤情况,所以该系统也能对老师的上课情况进行考核。由于我们采用的是普通课堂考勤和实习基地考勤两种方式,所以在功能上会采用两大功能区分其考查的方式,并利用现有学校局域网络系统,采用tCp/ip、internet、web页面技术和网络管理技术,实现指纹在不同地点的远距离传输。以下是网络架构图:

(2)指纹识别高校学生考勤系统的设计与实现

采用软件工程的生命周期法的思想和原理、面向对象的分析和设计方法来进行原型系统的设计和开发。

原型系统将大致包括几大模块:采集模块、系统管理模块、学生考勤管理模块、基本信息模块、查询模块,各模块间使用以遵循

tCp

/

i

p协议的以太网为传输媒介联接。

五、研究工作的主要阶段、进度和技术指标

六、最终目标及完成时间

6.1

最终目标

研究并提出一种在高校中利用指纹识别考勤的新系统架构方案。

完成原型系统。

通过分析整理,总结应用成果,完成毕业论文。

6.2

完成时间

七、现有条件及必须采取的措施

八、协作单位及要解决的主要问题

九、导师意见

签名:

十、考核小组意见

组长签名:

图像识别技术的基本原理篇3

关键词人脸识别近红外人脸成像人脸检测直方图均衡化adaboost算法

当下,计算机及网络技术发展迅速,如何保证信息安全以及准确鉴定身份信息变得异常重要。随着社会的发展,也有越来越多的场合需要对个人身份进行识别。传统的通过身份证、工作证、密码、钥匙等方式识别身份也变得越来越不安全,利用指纹、人脸、虹膜、声音等人的固有特征进行的身份识别技术以其稳定性和可靠性越来越受到人们的关注。在对这些生物特征的识别之中,对人脸特征的识别更加直接、直观,而且使用方便、容易被接受,受到了更多的关注与青睐。人脸识别技术应用广泛,可作为刑侦鉴定的重要手段在国家安全、公共安全、智能视频监控中发挥重要作用;在企业中用于智能门禁、考勤以维护企业安全和方便企业管理;未来在自助式网络交易、金融服务、信息安全等方面也有很大的应用前景。

1人脸识别技术产品的现状及发展趋势

之前国内外的人脸识别系统很多是基于可见光谱的,后来又有基于对热红外图像的人脸识别方法,不过因为设备昂贵,且在存储和计算方面复杂度大,难以满足实际应用需要,而且基于热红外或者远红外图像的识别方法,容易受到环境温度的影响,人的健康状态和情绪对人脸识别也有很大影响,使得采集到的人脸图像产生较大变化,因而,为了解决环境光的变化对人脸识别产生的影响,近年来近红外图像的人脸识别方法进入研究范围,成为人脸识别技术领域的一个研究热点。在人脸识别过程中,人脸图像的采集因为受环境光照变化影响较大,成为一大难题。而近红外人脸成像能够很好地克服环境光线改变带来的影响,使其在不同的光照环境下都能很好地采集人脸图像。近年来,嵌入式系统发展迅速,由于嵌入式产品携带和操作方便,且成本低、功耗小、交互性强,使基于嵌入式的产品十分畅销,从而嵌入式近红外人脸识别产品成为一种发展的趋势。

2嵌入式近红外人脸识别

2.1引言

人脸识别技术是以计算机为辅助手段,利用统计学原理从动态或静态的图像中捕捉人脸进行识别。一般说来,人脸识别的研究可以分为三个部分:从复杂的场景中检测并抽取人脸的所在区域;抽取人脸的特征;最后进行相关的匹配与识别。嵌入式系统作为产品中的集成信息处理单元,保持了设备或系统对实时性、可靠性及效率的要求,嵌入式近红外人脸识别系统主要涉及近红外技术、人脸检测技术、人脸识别技术、嵌入式微处理化技术和算法优化等,通过计算机和生物学统计学原理等,利用人脸固有的生理特征进行身份识别。其主要工作过程为:由摄像头采集近红外图像,通过微处理器进行人脸检测与识别,进行特征分析与数据库人脸特征比对,最终确定被检测者身份。

2.2近红外人脸识别中光源的选取

在过去多年对人脸识别的研究中,人们已经提出了很多方法来解决在图像采集过程中可见光影响图像采集的问题,但在实际应用中各种环境因素会影响识别的性能,如面部表情、光照的变化、人脸的遮挡等。红外成像独立于可见光源,具有抗干扰性强、防伪装等优点,因为人脸皮肤的热辐射系数区别于周围景物的热辐射系数,所以红外成像容易使人脸与周围景物区别开来,可以在很大程度上弥补可见光人脸识别技术的不足。在降低环境光对成像影响的同时,我们还应考虑到人的舒适度和适应性,而且选取光源时要求主动光源的强度高于环境光,所以,主动光源最好位于不可见波段,例如:红外、紫外等。但是若长期照射紫外光,会对人的皮肤和眼睛造成永久性的伤害,而中远红外波段成像会损失物体表面的大多数信息,一般不用于人像的采集,因此近红外波段成为最好的选择,如:780nm。

2.3主动近红外人脸成像

主动近红外人脸成像设备的目的在于为人脸识别提供不受环境光影响的、高质量的人脸图像,高质量的图像要求亮度合适、均匀、对比度合适、不存在过曝光等。一般主动近红外人脸成像设备包括如下几个单元:(1)主动近红外光源。要求在相应波段强度高于环境光,且主动光源与摄像头置于同一位置。(2)摄像头。要求能够接收近红外光。(3)窄带滤光片,置于摄像头镜头外,允许近红外光通过的同时过滤环境光。由于主动光源会随着距离的增大而衰减,因此人与光源之间的距离一般为50―100厘米。

2.4人脸检测与识别的相关方法

采集图像后,我们需要对人脸进行检测和特征提取,前者是人脸识别系统中十分重要的一步,人脸的检测直接影响到后面的特征提取,人脸检测要求从不同场景中检测出人脸,受到人脸方向、面部表情、部分遮挡以及外部饰(下转第145页)(上接第140页)物等干扰,所以这是一个相当困难的工作。目前,关于人脸检测与识别方法主要有以下几种:(1)基于几何特征的方法;(2)基于统计的检测方法;(3)基于相关匹配的方法;(4)基于特征空间的方法;(5)基于神经网络的方法;(6)基于adaBoost的人脸检测方法。

2.5人脸检测中adaBoost算法的应用

adaboost算法可以说是一种分类算法,在人脸检测过程中,采用积分图的方式计算出大量的简单特征,之后从这些特征中多次选取一小部分形成一个个分类器,而后通过级联的方式进行组合,排除背景区域后就可以专注于人脸区域的检测。此算法具有计算速度快、易于计算机实现等优点。

3图像灰度预处理

在采用近红外人脸成像解决环境光影响后,我们可以得到可供分析使用的图像,之后需要对此图像进行进一步的处理与分析,提高图像的对比度,使之更加清晰。在此,我们采用直方图均衡化的方法进行处理。灰度图像是由介于黑、白不同深度的灰色显示的图像,每种灰度为一个灰度级。每个像素点具有一个灰度级,灰度直方图反映出不同灰度级出现的频率,描述了图像各个灰度级的统计特性。直方图均衡化通过某种映射关系将原图像转换为每一灰度级有近似相同的像素点数目的图像,增强图像的对比度,便于人脸特征的提取。此部分内容可通过matLaB实现,下面通过一简单示例进行效果展示,matLaB程序:

i=imread('123.jpg');%读入一个图片名为“123.jpg”原图像

i=rgb2gray(i);%将原图片转换为灰度图像

i=im2double(i);%转换数据类型为double

i1=i+55/255;%简单线性变换增加亮度

subplot(2,2,1);%绘制2*2网格图,绘制图像

imshow(i1);title('原图像');

subplot(2,2,2);

imhist(i1,64);

title('灰度直方图');

subplot(2,2,3);

imshow(histeq(i1));

title('均衡化图像');

subplot(2,2,4);

图像识别技术的基本原理篇4

会计原始凭证的基本要求就是真实。在手工会计条件下,会计人员根据原始凭证编制记账凭证,根据记账凭证登记明细账和总账,期未根据账簿编制会计报表。审计人员通过调阅纸面信息,加上自己的经验判断,审计线索十分清楚。然而,在会计信息化工作方式下,纸面信息变成了磁性介质上的代码。在网络经营条件下,企业内部业务的审计线索也发生了质的变化。不仅记录业务的内部原始单据,如领料单、入库单、验收单等原始凭证将变为电磁化的信息,而且计算机信息系统根据确认的经济业务自动编制记账凭证、登记账薄、编制报表,实现财会核算自动化。这个转变过程中潜伏的一大问题就是绝大多数的会计核算软件并没有解决对会计事项,即记账凭证所根据的原始数据是否真实这一至关重要的问题。一旦凭证转化成电子数据输入计算机,后续所有工作都建立在这样一个假设下。但当前的会计电算化并不能有效地防止做假账和会计信息失真的问题。电算化会计账表审计的前提是:必须保证电子数据的“原始性”,即电子数据是真实、可靠的,可以作为有效数据来进行审计。否则,信息化会计账表审计就失去意义。在财务信息化过程中,原始凭证真实性问题会严重影响到财务报表质量。因此,本文试图将图像检索技术应用于识别虚假原始凭证,在财务处理软件中增加新的应用解决原始凭证真实性识别问题,并给出构建该应用的技术难点与实现框架,以期达到提高审计质量,将会计信息失真程度控制到最低。

二、图像检索技术识别虚假原始凭证的可行性分析

财务人员虽然在长期的实践中积累了大量的识别凭证真伪的经验,这些经验的积累需要较长时间的实践,且难以精确、客观描述,不利于在行业人员中开展培训、推广及使用,风险较高。而图像检索技术是近年来随着多媒体信息爆炸式增长,为了满足人们快速准确找到自己所需图像的一种技术,也是当前计算机领域的研究热点之一。它利用图像的物理属性,如颜色、形状、纹理、区域等在图像数据库中寻找与目标图像相关或者相似的图像,称为基于内容的图像检索(Content-BasedimageRetrievalCBiR),是目前图像检索的有效方法之一。原始凭证被扫描进电脑,以图像格式存储。根据审计人员经验,把伪造特征转化成数字图像特征描述,如文字色差、数字位置、对模糊重影、印章和票据用纸由于用稀释剂泡过而明显变浅的,字体大小或字形异样的,复写印迹背后深浅度异样等特征,作为目标图像。待识别票据或者凭证的特征可与之进行匹配,按照相似度做出真伪识别是完全可行的。加入该项应用后,在利用财务软件进行审计时,使用人员可以直接调出某笔业务的原始凭证图像,由系统进行识别,从而提高了工作效率。

三、图像检索技术识别虚假原始凭证的技术难点

虽然运用图像检索技术可有效识别虚假原始凭证,但其也存在技术难点,主要有:一是票面污损、破损、折叠、纸质磨损等问题会直接影响扫描进计算机中的图像质量,给后续识别带来难度,需要综合运用图像降噪、增强、恢复等技术,消除影响,提高识别率;二是票面不同区域的智能分割。识别真假票据的前提是提取其中的有效信息,如时间、科目、金额、印章等。这些信息存在于票面的不同区域,由于发票尺寸、形状的不同,需要一种智能识别技术,能够动态、自适应地分割不同区域,为进一步提取有效信息做准备;三是oCR与现有系统的融合。oCR已经在实践中获得了广泛的应用,为避免重复开发,提高开发效率,可以直接将该技术应用于票据内文字以及阿拉伯数字的识别,如何将其集成到现有系统中,构造合适的应用接口至关重要;四是如何结合审计人员实践经验,利用图像检索技术提取相应票据特征,尤其是容易被涂改、造假的部位的细部特征,进行真假识别。

图像识别技术的基本原理篇5

Discussionandpracticeon"imageprocessingtechnology"

ZhangYongmei,maLi,HeLi

(Schoolofinformationengineering,northChinaUniversityoftechnology,Beijing100144,China)

abstract:thedisadvantages,thecharacteristicsandthecontentofthecurrentteachingfor"imageprocessingtechnology"areanalyzed.Fourteachingproceduresincludingtheselectionoftextbooksandexpansionmaterialsforinitiativelearning,applicationofmodernteachingmodelsandmethods,strengtheningteachingpracticeandreformingappraisalmethodshavebeendiscussedandpracticed.theresultshowsthatithasobtainedbetterteachingeffects,improvedthestudents'interestinlearningandmotivationtoparticipateinscientificresearch,aswellastheabilitytosolvepracticalproblems.

Keywords:teachingcontent;teachingmethod;assessmentway;teachingpractice

0引言

图像信息是获取信息的重要来源,图像处理研究对于科学理论研究和工程应用有重要影响。研究图像处理和通信是导向智能计算机、智能机器人或多媒体通信系统的必由之路。现有的图像处理技术在很多方面给人们生活、学习、工作带来极大的便利,如:视频广播、遥感图像、医学图像(计算机X射线断层扫描技术Ct,以及核磁共振成像mRi)等,计算机的发展使处理更复杂的图像成为可能。

图像处理是计算机应用领域中的一个重要方面,是模式识别、计算机视觉、图像通讯、多媒体技术等学科的基础,是一门涉及多领域的交叉学科。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让不同层次的学生能够理解和掌握图像处理在其应用领域的最新发展,故传统的常规教学已经不能满足课程的发展要求。目前的教学不足之处主要体现在:传统的图像处理技术教学大多数偏重于理论,缺乏图像处理技术与实践相结合的环节。本文结合计算机学科的特点和多年的教学经验,对图像处理技术课程的教学模式与实践进行了探讨。

1课程特点和教学内容分析

人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。图像处理是利用计算机处理所获取视觉信息的技术[1]。图像处理技术的理论基础涉及了众多学科,包括数学、物理、信号处理和计算机科学等多个学科的知识,其内容广泛,理论抽象,不易理解。图像处理技术还有很强的实用性,因此理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。

图像处理技术已经成为众多高校的一门重要课程,该课程主要介绍图像的数学描述、图像的数字化、图像变换、图像增强、图像恢复、图像编码、图像重建、图像分割与边缘提取、图像的分析和识别等基本的图像处理方法,使学生能熟练地掌握图像处理的基本过程,并能应用这些基本方法开发图像处理系统。通过这样的内容设置,使学生能够真正掌握图像处理技术的基本思想和技术,为深入学习打下坚实基础[2]。

2教学环节的探讨和实践

2.1教材的选用和自主学习扩充性资料的选用

图像处理技术发展日新月异,虽然该课程已经有很多可选教材,但大部分教材内容比较陈旧,许多新的算法,新的思想都没有提到,学生无法从这些教材中获取图像处理最新的技术和发展趋势,因此我们选择了章毓晋编著、清华大学出版社的《图像工程》系列教材。该教材全面介绍了图像工程的第一层次――图像处理,图像工程的第二层次――图像分析,图像工程的第三层次――图像理解的基本概念、基本原理、典型方法、实用技术以及国际上相关研究的最新成果。同时我们要求学生将国外的经典图像处理的书籍作为参考书目,如:RafaelCGonzalez主编的《Digitalimageprocessing》,并建议学生关注图像处理的一些重要期刊和国际会议,如:ieeetransactionsonmedicalimaging、ieeetransactionsonpatternanalysisandmachineintelligence、ieeeinternationalConferenceonimageprocessing、电子学报、Ct理论与应用研究、模式识别与人工智能等。这样学生能熟悉一些专业术语,了解最新的前沿动态,并具备一定的英文文献阅读能力,为今后的科研和工作打下了坚实基础。

要求学生自主学习一些最新方法和技术,例如,深入分析中华人民共和国设计制造的玉兔号月球车的结构,给出玉兔号月球车如何通过全景相机、测月雷达、粒子激发X射线谱仪、红外光谱仪等仪器,对月表进行三维光学成像、红外光谱分析,开展月壤厚度和结构科学探测,对月表物质主要元素进行现场分析等探测的原理和方法。又例如,探讨将遥感图像应用于5.12汶川大地震的方法,2008年5月14日上午,中国科学院的两架高性能遥感飞机飞赴汶川,对地震灾区开展遥感监测和灾情评估工作,这两架飞机可分别提供高分辨率光学和雷达图像,具有全天候快速获取大面积灾情数据的能力,探讨如何根据汶川地震前、后图像,给出建筑物、河流、山体等关键区域的变化检测结果,为国务院和相关部门的抗震救灾工作提供咨询服务和决策依据。

2.2采用现代化教学模式与方法

为了使复杂的算法和抽象的知识更加形象化,便于学生理解和提高学习兴趣,我们充分运用现代电子技术、工具和方法,采用多媒体形式进行课堂教学,利用VC、matLaB编写一些典型的图像处理程序,并在课堂上演示这些程序,增加了课堂的信息量,提高了学生的学习兴趣,激发了学生自主学习,同时也为实验环节的开展奠定了一定的编程基础[3]。

此外,我们深入分析mooCs、SpoCs以及“翻转课堂”教学模式等国际流行教育新概念,尝试开展图像处理技术的mooCs,包括从课堂教学、学生学习进程、学生的学习体验、师生互动过程等教与学过程的完整系统在线实现。mooCs是一个改变学习方式的时代产物,受到全球各地的重视。国内教育部三个教指委(计算机类专业、软件工程专业、计算机课程)2013年底专门召开会议研讨mooCs。我们建立了校内mooCs平台并对学生开放,将其作为课堂外学习的有效补充,这样可以方便学生随时随地学习,或者进行预习和复习。我们尝试了结合图像处理技术的mooCs,探索创新教学模式与方法,稳步提高教学质量。

2.3加强实践教学

图像处理技术可以广泛应用于数字电视、视频通话、宇宙探测、自然灾害预测、环境污染的监测、气象云图等应用领域,而教材一般只涉及到理论知识和算法,或者是对应用的简单介绍,对其设计实现介绍得很少,所以必须加强实践教学,将理论与实践结合起来,使理论指导实践,实践加强理论[4-5]。要求学生利用VC或者matLaB进行实际程序设计,培养学生分析问题、解决问题的能力,具备图像处理系统的开发能力。

根据课程的教学要求设置了四个课外实验。①图像变换实验。要求对输入的图像,分别采用傅里叶变换、离散余弦变换、小波变换进行图像变换,分别给出变换前后的图像,并分析图像变换前后的视觉效果。②图像增强实验。将给定的图像进行增强处理,要求至少使用线性变换增强、对数变换增强、指数变换增强以及伪彩色增强处理,分析增强后的视觉效果。③图像编码实验。将给定的图像进行压缩处理,要求采用Huffman编码方法,并计算压缩比。分析图像压缩后的视觉效果,并对图像压缩效果进行客观评价。④图像分割与边缘提取实验。分别利用边缘检测法、阈值分割法进行图像分割;分析图像分割后的视觉效果。学生完成所有实验后,我们安排了实验指导课,解决学生在实验中遇到的问题,进一步提高学生的算法设计能力和编程能力。

在课程教学中,我们还安排了三次专题讨论课,由教师指定具体题目,学生通过查阅相关文献,深入分析基本原理和方法,设计相应的算法,编程实现,并给出实验结果及分析,充分调动学生学习的积极性,提高学生利用理论知识解决实际问题的能力。三次专题讨论课分别是:

⑴数字图像表示及其处理专题讨论课。题目为:用VC或者matlab实现常见图像文件格式的显示;常见的图像文件格式,以及用VC或者matlab实现图像格式转换;给出国内外先进的图像处理系统软、硬件,名称、作用,以及先进性的体现。

⑵图像变换专题讨论课。题目为:给出小波变换常用的小波基的基本原理、具体应用,以及用VC或者matlab的具体实现;给出小波变换、脊波变换、子波变换的基本原理、具体应用,用VC或者matlab的具体实现;给出小波变换以及小波变换在图像处理中的具体应用,以及用VC或者matlab的具体实现;给出快速傅里叶变换算法的具体内容,以及时间复杂度或者运行时间的分析。

⑶图像编码专题讨论课。题目为:给出小波变换图像编码的基本思想与特点,编码中需要解决的问题,实验结果及分析;给出基于感兴趣区域的小波图像编码方法的基本思想,具体步骤,实验结果及分析;给出几种图像编码质量评价方法,具体实现,实验结果及分析;给出基于子波变换的图像编码基本思想与特点,具体步骤,实验结果及分析。

此外,鼓励学生积极参与本校教师主持的科研项目,如国家自然科学基金、863项目、科技支撑计划,以及北京市自然科学基金等项目。这些项目涉及到视音频检索、视音频理解、视音频处理、网络信息分析、文字处理、信息检索、网络行为分析、图像识别等研究方向。通过参与项目,系统地锻炼了学生的科研能力和思维创新能力,也为今后的科研工作打下了坚实基础。

2.4改革考核评价方式

考核是对学生学习成果的检验,考核目标不仅要检验学生对课堂教学内容的掌握程度,而且要对提高学生发现问题、思考问题、解决问题的能力起到作用。为了避免出现平时不努力,考前突击的情况,我们对传统的考核方式进行了改革。本课程的考核由两部分组成:平时成绩(占30%)和期末考试成绩(70%)。将平时的上课出勤、作业、实验和专题讨论成绩列入平时成绩。在整个教学过程中,严格要求学生,使学生重视教学的各个环节。

图像识别技术的基本原理篇6

关键词:计算机智能化;图像识别技术;理论性探究

中图分类号:tp391

计算机智能化图像识别主要是利用计算机系统对输入的图像进行处理和分析从而识别出多种不同模式的对象。计算机技术和信息技术的不断发展使得计算机智能化图像识别技术得到了越来越广泛的应用。信息时代的今天,人们在生产实践的活动过程中已经不再凭借身体的各个器官来接受信息和感知世界的,计算机智能化图像识别技术可以快速地获得所需要的信息从而帮助人们更好地思考和决策[1]。虽然计算机智能化图像识别技术在我国已经获得了相当程度的发展,但是要想赶上时代的步伐应对变化莫测的国际市场就必须对计算机智能化图像识别技术进行理论上的突破。本文在此将重点讨论计算机智能化图像识别技术的相关发展和创新。

1计算机智能化图像识别系统概述

计算机智能化图像识别系统一般分为五个部分,即对所要识别的图像通过一定的方式将其输入到计算机内,经过计算机预处理和特征提出再对识别的图像进行匹配和分类。作为计算机智能化图像识别的第一步,图像输入主要是将已经采集到的图像输入到计算机内进行处理。计算机预处理过程主要是对将要识别的图像进行图像区和背景区的分离并且将图像进行细化增强图像的二值化,提高计算机智能化图像识别的后期处理的速度和效率。为了能够尽量地还原图像的真实性和减少其虚假特征可以将图像的特有特征用数值的形式表示出来。在计算机智能化图像识别系统中如果需要将输入的图像与已有的图像进行匹配就必须用一种精确的方法将其分配到不同的图像库中减少计算机对图像的搜索时间。在计算机智能化图像识别系统中为了准确地判断出所输入的图像的性质就必须把当前输入的测试图像和之前已经保存的图像进行对比和分析。具体如下图所示:

图1计算机智能化图像识别系统

一般来说,计算机智能化的图像识别技术常用的方法包括统计识别法、句法识别法与神经网络识别法等三种方法。

(1)统计识别法。由于在实际图像中背景与目标的线性是不可分割的,所以统计识别法是具有最小分类误差的一种方法。其原理主要以数学中有关决策理论的知识为基础,建立统计学的识别模型,并通过此类模型对图像作出分析与统计,寻找图像中认识的规律性,最终利用图像特点中本质特征的提出来实现识别。

(2)句法识别法。此类方法是统计识别法的一种补充,其对图像特性的描述主要依靠的是符号。由于句法识别法学习了语言学内句法层次的结构排列,所以它能够通过分层表述的方式将复杂的图像简化为简单的多层子图像或单层图像,能够有效突出被识别图像结构的信息。

(3)神经网络识别法。所谓神经网络识别法,主要是指利用神经网络中计算的方法对目标图像作出识别的一种方式。由于神经网络存在着能够实现分布式处理与存储、能够大规模实现并行、具有自适应与自组织能力,所以此类方式在处理需要同时对模糊与不精确的许多条件与因素作出考虑的图像进行处理时尤为有效。

2计算机智能化图像识别技术的研究现状

在对图像进行识别和处理的领域中图像的识别和分割是一个也重要的问题。虽然在相关专家和工作人员的共同努力下取得了相关的发展,但是还是有许多的问题需要解决。传统的图像识别主要经历了文字识别和数字处理以及物体识别三个阶段。在20是50年代的时候文字识别的对象主要是字母和数字以及符号,许多的专用设备都开始广泛地运用了这一技术。在20世纪60年代中期数字图像开始运用于对图像的处理和识别的研究领域,数字化图像处理更加具有存储量大和方便传输和压缩等优势,为图像识别技术的发展提供了非常广泛的发展空间。数字图像处理主要是表现在对物体的识别中的三维数据和图片的感知和认识。物体识别主要是在前两个阶段的基础上借助了人工智能化的特点将其研究和探索的成果广泛地运用到各种行业领域中。

计算机智能化图像识别技术在目前需要提高其对图像的识别能力,在图像的传输过程中充分地运用不同类别空间的映射[2]。作为一种成熟的图像识别和处理技术,计算机智能化图像处理技术在不断地研究和发展,对各种图像的类别和特征进行有效地对比和匹配,提高图像处理后的清晰度和识别度。

3计算机智能化图像识别技术的特点和优点

3.1计算机智能化图像识别技术的主要特点

(1)信息量大。计算机对图像信息的处理主要是采用二维信息的方式,因此对计算机的配置和计算机的运行系统的速度以及计算机的存储量都有非常严格的要求。图像信息与语言信息相比所需要的频带较宽,无论是在计算机的成像过程中还是在图像的传输中以及图像信息的存储和处理的过程中都需要一定的科学技术。

(2)相关性大。计算机系统中对图像的各个像素都是具有一定的关联性,所以在计算机智能化图像的识别过程中需要对输入的各种图像信息进行有效地压缩才能够对不同的图像信息进行分类和匹配。尤其是对三维景物的选取上,输入的图像本身是没有再现三维景物的几何信息能力,因此对三维景物的背后所需要反映的部分信息必须进行适当地假设和重新的测量[3]。计算机在对图像进行智能识别的过程中需要对三维景物进行适当地引导以便于解决在计算机智能化图像识别过程中所产生的问题。

(3)人为因素大。计算机智能化图像识别在对图像进行后期处理之后总是由人来进行评价的,因而计算机在对图像进行智能化识别的时候受人的因素影响较大。然而,人的眼睛总是会受到周围环境的影响以及情绪和知识兴趣爱好的影响。因此,为了提高计算机对图像进行智能化识别的质量应该尽量地让计算机模仿人的视觉,充分地模拟人们在对图像进行观察和评价时候的状态。

3.2计算机智能化图像识别技术的优点

(1)精确度高。因为现在的科学技术水平的限制只能将一幅模拟的图像进行数字化处理转换为一种二维数组,基本的扫描仪都能够对图像的像素转化为32位。因此计算机智能化图像识别能够将任何的图像的精确度满足用户的任一要求。

(2)表现型强。计算机智能化图像处理可以准确地处理影响图像处理的相关因素,例如图像的存储状况和图像的输入过程中出现的问题和故障。计算机智能化图像识别系统能够在任何的情况下对图像进行还原和再现从而保证了图像在经过计算机识别和处理的时候的像素。

(3)灵活性好。计算机智能化图像识别系统在对图像进行识别和处理的时候,可以根据图像的客观情况来将其放大。由于图像的信息总是来自于各个方面,无论是来自生物显微镜下的细胞图像还是对于宇宙中位于天文望远镜下的庞然大物都能够在计算机智能化图像识别系统中进行识别和处理,通过线性运算和非线性处理实现图像的识别功能[4]。在对各种不同的图像信息进行正确地编码之后用二维数据将图像的灰度进行组合在计算机上可以清晰地显示出图像的质量。

4计算机智能化图像识别技术的理论性突破

4.1计算机智能化图像识别技术朝着高速化和标准化的方向发展

无论是在生活领域还是科学领域计算机的运行速度都会对生活和工作产生重要的影响。尤其是对图像进行智能识别对计算机具有特别的要求,而现在的计算机在科学技术水平的促进下不断地提高其自身的硬件水平。不仅如此,在计算机的内部配置方面也比以前有了相当大的进步,计算机在进行图像的采集和处理的过程中分辨率都大大地提高了,同时对图像的存储设备的性质也在日益地更新。图像作为一种二维度信息,计算机将其进行识别的过程中将更多的三维信息赋予图像中并且通过各种计算和技术的处理而得到相应地改进[5]。

同时,计算机在对图像所显示的数据进行整理和压缩的时候开始以多媒体的形式对其进行信息化转换,使得计算机智能化图像识别尽量能够按照人的思维和意识来进行从而提高计算机的智能化水平和对图像识别的工作效率。

4.2计算机智能化图像识别技术朝着多维方向和高科技方向发展

计算机在对图像进行识别的过程中开始从二维角度向三维角度和多维角度发展,因此对各种图像的数据信息处理的更加精确。目前由于硬件水平的逐渐提高,计算机的中央处理器的功能也在不断地提高,因此计算机智能化图像识别的领域越来越广泛。随着新的技术理论和新的科学计算方法的诞生,计算机在对图像的识别和处理过程中更加侧重对其详细的信息进行分类和整理,经过系统的转化后形成高清晰度的图片。

5计算机智能化图像识别技术的运用

计算机智能化的图像识别技术尽管面临着许多困难与问题,但此类技术依旧得到了较好与较快的发展。就近些年其变化与发展而言,在今后的发展过程中,计算机智能化的图像识别技术将会出现飞速的发展阶段,人工智能与立体视觉同时也将成为计算机智能化的图像识别技术未来发展的方向。由于短时间内图像识别技术实现计算机通用性较大的全自动系统的可能性较小,所以在未来的发展历程中,计算机智能化的图像识别系统需要和不同类型的应用进行结合开发。

5.1医学生物工程

计算机智能化图像识别技术可以对诸如红细胞和各种染色体进行识别,从而有利于医生更好地了解患者的病情和更好的医学研究。在医院的很多部门例如心电图的分析以及彩超和超声波图像处理都广泛地运用了计算机智能化图像识别技术。

5.2工程建设方面

计算机智能化图像识别技术在工程项目的建设过程中得到了广泛的应用,尤其是对相关零部件的检测和分类以及对输电线路故障的分析和排查方面都借助计算机的智能化工程得到了有效地解决。在工业生产过程中,施工人员对工程的焊接和装配的过程中都充分地运用计算机对图像进行智能化识别从而减少了施工误差的发生,保障了整个工程项目建设的质量。

5.3文学艺术方面

文学艺术方面对计算机智能化图像识别技术的使用非常普遍。在广播电视领域,电视要想播出高清晰度、高质量的画面就必须借助计算机对所拍摄的画面进行处理和识别。计算机能够对动态图像进行相应地采集加工合成从而形成电视画面。为了避免图像在播出的时候出现失贞的情况,计算机可以对输入的画面进行智能化处理,尤其是一些人为的失误都能够通过计算机进行自动地调整。在美术方面,计算机智能化图像识别技术可以对每一幅作品的像素和色彩方面进行相关地调整,使其输出后能够更好地反映现实生活的。除此之外,计算机智能化图像识别技术在服装设计与制作和动画制作以及发型设计等方面均发挥了重要的作用。

5.4商务业务方面

计算机智能化图像识别技术在电子商务和酒店商务方面具有重要的影响,其可以在很多的方面代替人工操作从而节省大量的人力资源。比如,员工每天在进行上下班的时候都可以在经过大门通道的时候进行电子身份签到和认证。同时对于一些重要的商业资料也可以通过计算机智能化图像识别技术进行防伪说明等等。

除此之外,计算机智能化图像识别技术还经常运用于航空航天事业和通信工程事业以及科学研究等领域方面,为我国的经济发展带来了重大的影响。

6结束语

文中通过对计算机智能化图像识别技术的特点和概念以及其优点等方面进行了简要地分析和阐述,同时对其在理论上的创新和突破进行了讨论。计算机智能化图像识别技术在科学技术的发展下还有很长的路要走,我们必须对其进行高度地重视。随着社会的发展,对图像进行智能化地处理越来越重要。计算机智能化图像识别技术在工业和农业以及科学研究等各个方面将发挥关键的作用。同时,计算机智能化图像识别技术在不断地运用和发展过程中将会越来越成熟。

参考文献:

[1]杨小冬,宁新宝.自动图像识别系统图像分割算法的研究[J].南京大学学报,2009,40(4):424-431.

[2]李建华,马小妹.基于方向图的动态阈值指纹图像二值化方法[J].大连理工大学学报,2008,42(5):626-628.

[3]康剑莉,陈罡,毛金明.基于Cabor小波特征的磨粒图像识别新方法[J].激光与红外,2010,3,35(3).

[4]柳稼航,杨建峰,单新建,尹京苑.一种基于优先搜索方向的边界跟踪算法[J].遥感术与应用,2011,19(3):209-213.

[5]成金勇,范延滨,宋洁.基于小波分析与Snake模型的图像边缘检测方法[J].青岛大学学报:自然科学版,2012,3:78-81.

图像识别技术的基本原理篇7

关键词:非接触式测量;Canny算子;边缘检测;二值化;阈值检测

中图分类号:tp751文献标识码:a文章编号:1009-3044(2013)04-0849-03

non-contactmeasurementofworkpieceBasedonCannyoperator

YoUXiao-long,LiUSong-lin

(Schoolofelectronic&informationengineering,nanjingUniversityofinformationScience&technology,nanjing210044,China)

abstract:inordertomeasurethesizeofhightemperatureorotheruntouchableworkpieces,amethodbasedonCannyoperatorisproposed.thismethodtaketheoriginaldeviceimageandthenprocessingtwovalues,extractingthecontouroftheworkpiece,thentakesthresholddetectionandreturnsthecontourcoordinatestodeterminetheworkpieceparameters.Comparedwiththetraditionalcontactmeasurementmethods,thismethodcanmeasurethehightemperatureworkpiecesandhasthecharacteristicsofhighermeasurementaccuracy.theoryandcomputersimulationshowthatthismethodiseffective,andithasagoodapplicationprospects.

Keywords:noncontactmeasurement;cannyoperator;edgedetection;twovalues;thresholddetection

工业产品形状及尺寸的测量是现代化工业生产的重要环节,测量结果的准确性与时效性直接影响着产品生产的质量与效率[1]。随着现代化工业迅速发展的需要以及测量技术的进步,越来越多的测量手段不断涌现,其中借助于计算机实现的对高温等不宜直接接触零部件的测量方法是现代化测量技术之一。基于图像处理的机械零件检测方法是现代化检测技术的发展趋势之一,其对微小、复杂的工件形状及尺寸的测量有突出的优点[2]。

图像测量技术在工业测量领域的实际应用可以追溯至20世纪90年代,图像测量技术的核心是图像处理技术[2]。该文提出的测量原理与方法:首先通过扫描仪器获取被测工件的扫描图像,然后由matlab程序对工件扫描图像进行以下处理和检测:1)对图像进行中值滤波;2)对图像进行二值化处理;3)图像的轮廓边缘提取;4)对图形矩阵进行阈值检测,并返回轮廓坐标;5)根据返回的坐标计算工件的相关参数。

2.1基本原理

本文所测工件为圆形,如图1所示。

2.2中值滤波原理

中值滤波器是一种常用的非线性平滑滤波器[3]。扫描仪器在扫描工件时不可避免地引入干扰,从而在扫描图像上出现干扰噪声,因此,对扫描图像进行去噪处理、增强图像质量就显得尤为重要,中值滤波器的应用是去噪处理技术的关键步骤之一[4]。中值滤波器的原理是将原始图像像素值用其领域的图像灰度中值代替,其先将滤波器的模板所对应的灰度值[a1,a2,...,an]排列顺序,若n为偶数,则所取中值为滤波器模板处于中间位置所对应两个数值的平均值;若n为奇数,则所取中值为滤波器模板处于中间位置所对应的数值[4]。中值的个数及窗口的形状与大小的选择均取决于领域的大小,其中窗口的形状选择较多,可以是圆形、矩形等,窗口的选择对中值滤波器滤波后的效果有较大的影响[5]。在本文中,对图1的图像进行中值滤波后图像如图2所示。

由图2可见,在原图像(图1)中噪声干扰很小,所以滤波前后图像变化不明显。

2.3Canny边缘检测算子

首先将图2作二值化处理,如图3所示。若用“1”表示白色,“0”表示黑色,则整个图像是由值“0”和“1”构成的二维矩阵,即称为二值图像[5]。在图像的边缘集中存在大部分图像信息,其灰度值在一个较小的区域范围内变化迅速,可从一个很小的值急速变化到一个很大的值,即其剖面的灰度值可以看成是一个阶跃[6]。由于图像边缘所蕴含的信息量较大,因此,图像边缘的识别与检测对于整幅图像的识别与检测有重要意义[7]。对于传统的测量方式,视觉边缘检测的准确性与时效性直接影响着整幅图像信息检测的精度与识别能力。在原图像的基础上,对整幅图像的各个像素所在的领域内灰度值变化的检测即阶跃变化的检测是经典的边缘检测方法,其原理是根据对边缘领域的导数(一阶或二阶)变化规律来检测和识别图像的边缘。常用的边缘检测算子较多,有:Sobel算子、prewitt算子、Roberts算子、Laplace算子、Canny算子等[8]。该文采用的是Canny算子,该算子的优点在于:具有检测准确、定位精度高、不易受噪声影响、实际应用广泛等,同时,其采用两种不同的阈值分别检测强边缘和弱边缘,并且仅当弱边缘和强边缘相连时,才将弱边缘包含在输出图像中[9]。因此,这种方法对于图像的弱边缘有更强的检测能力,能够较好地平衡对边缘与噪声的识别。Canny算子的方向性质使得它的检测边缘与定位具有更好的边缘强度估计,能产生梯度方向和强度两个信息,方便了后续处理。

对阶跃边缘,Canny推导出的最优二维算子的形状与Gaussian函数的一阶导数相近[10],取Gaussian函数为:

[G(x,y)=12πσ2ex2+y22σ2](1)

在某一方向n上,[G(x,y)]的一阶方向导数为:[Gn(x,y)=?G(x,y)?n=n?G(x,y)](2)

式中,[n=cosθsinθ],[?G(x,y)=?G(x,y)?x?G(x,y)?y](3)

因此,对应于[Gn*f(x,y)]变化最强的方向导数为:[n=?G(x,y)*f(x,y)?G(x,y)*f(x,y)](4)

在该方向上[Gn*f(x,y)]有最大的输出响应:

[Gn*f(x,y)=cosθ?G(x,y)?x*f(x,y)+sinθ?G(x,y)?y*f(x,y)=?G(x,y)*f(x,y)](5)

经Canny算子进行边缘检测后,结果如图4。将图像取作[2048×2048]的矩阵,再对图形矩阵进行阈值检测,把相应的灰度选出[11,12],并返回坐标如图5、图6所示,其中,图5为圆的上半部分,图6为圆的下半部分。

2.4确定圆心坐标及半径

根据图5或图6中返回的坐标,确定圆上三个点,从而确定圆心的坐标及圆的半径,取其中三个点分别为:[(960.6,230.1)];[(195.3,704.2)];[(1844.0,821.6)],经计算可得,圆心坐标为[(998.13,1129.28)],半径为:[900.01]。将相关图像的实际尺寸作相应变换即可得到实际工件的大小。

3结论

本文针对在工程实际中存在不宜直接接触式测量的工件,提出了基于Canny算子的工件非接触式测量的方法。在matLaB图像处理的基础上,结合图像的中值滤波、二值化、轮廓提取、阈值检测等操作,最后得到图像中工件的轮廓部分点的坐标,运用二维平面图形知识计算出圆形工件的圆形坐标和半径。理论及计算机仿真结果表明了该方法的有效性和精确性。

参考文献:

[1]刘霞.论非接触测量技术应用在机械检测上的必要性[J].包钢科技,2012,38(5):60-62.

[2]孙凤杰,楚征,范杰清.高压输电线图像边缘检测方法研究[J].电力系统通信,2010,31(210):36-39.

[3]郝文化,田蕾,董秀芳,等.matLaB图形图像处理应用教程[m].北京:中国水利水电出版社,2003.

[4]谢道平.二维数字图像边缘检测方法研究[J].大众科技,2010(8):34-36.

[5]姜彬,施志刚.图像分割技术分析与展望[J].电脑知识与技术,2009,5(35):66-68.

[6]张进猛,张进秋.基于openCV的图像采集和处理[J].软件导刊,2010,9(1):164-165.(下转第854页)

(上接第851页)

[7]郭文强,侯俊勇.数字图像处理[m].西安:西安电子科技大学出版社,2009.

[8]周志峰.一种正六边形检测方法的研究[J].应用光学.2012,33(1):129-133.

[9]张思俊,王乐乐,陆振宇.基于Canny算子边缘检测的车牌图像增强方法[J].重庆交通大学学报:自然科学版,2012,31(3):439-442.

[10]殷红,孟建军,蒋兆远.图像处理对影像检测改进算法的研究[J].兰州交通大学学报2008,27(3):107-110.

图像识别技术的基本原理篇8

生物特征识别技术是指通过计算机科学技术与人体固有物理和行为特征来进行身份验证的一门科学,属于模式识别类问题。主要包括两类问题[1]:一类是基于物理特征的生物识别技术,包括人脸图像识别、虹膜识别、指纹识别、Dna识别技术等;另一类是基于行为特征的生物识别技术,包括语音识别、签名、步态识别技术等。人脸图像识别就是将待识别的人脸与已知人脸进行比较,得出相似程度的相关信息。我们常说的人脸识别还可以分为确认和辩认两种情况。确认是一对一进行图像比较的过程,辨认是一对多进行图像匹配比对的过程[2]。

二、开发背景与需求分析

1.项目开发背景。近年来,随着国家经济体制结构不断变化,社会用工需求对于具有高级技术资格的高技能人才需求越来越大。职业技能培训与职业技能资格的考核与鉴定工作需求量与社会认可程度也大大增加了。职业技能培训与职业资格鉴定工作量与日俱增,得到了社会普遍认可。随着职业技能鉴定工作需求量的增加,职业技能鉴定考试中验证考生身份问题呈现出日益严重化且监考教师验证考生身份工作量不断增加的现象。在现有职业资格考试系统的基础上研发人脸图像识别系统模块,用以帮助监考教师验证考生身份,同时将职业技能鉴定工作全面推进信息化。

2.功能需求分析。在职业资格鉴定系统中应用生物特征识别技术,研制“人脸图像识别”系统模块。该系统模块可以通过人脸识别技术进行身份验证:考生进入考场后,系统首先需要通过摄像头获取到考生考试当天的人脸图像,并对采集到的人脸图像进行一系列图像处理工作,这个处理过程也称图像预处理。再同图像数据库中的图像进行比照,如果考生身份得到正确的确认,即可进入注册信息审核确认页面;否则,拒绝进入。实现智能化验证考生身份的功能,以达到辅助监考老师验证考生身份、降低监考老师监考工作量和提高职业资格考试严肃性与严谨性的目的。

3.开发环境需求分析。硬件资源:CpU要求pentiumⅣ及以上;内存要求2G及以上;视频采集卡、USB2.0接口摄像头。软件资源:开放式标准操作系统,如win-dows2000,windowsXp,windows7等。程序设计语言处理软件。如:VisualC++、JaVa、matLaB、SQLServer等。熟悉VC++、C++、JaVa、matLaB、SQLServer等高级程序设计语言。

三、系统设计

1.总体设计。本课题研究属于人脸图像的确认识别。其研究内容包括四个主要部分:一是人脸检测技术,二是人脸定位技术,三是人脸表征技术,四是人脸鉴别技术。人脸图像识别模块的工作过程是:(1)获取人脸图像:通过采集设备获取输入图像,并生成其面纹编码。(2)建立人脸图像档案:通过采集人脸图像或获取照片文件上的人脸图像进行信息处理,生成特征向量。(3)人脸特征的检索与对比:将待比对的人脸图像特征向量与人脸图像档案中的人脸图像特征向量进行检索与对比。(4)输出识别结果:进行身份的确认或是身份的选择。人脸图像识别系统的工作原理为:考生首先需要在考试报名现场进行第一次照片采集,照片采集成功后,系统会自动对采集到的照片进行图像预处理操作、提取面部特征,并将提取到的特征数据存入数据库;考试当天,考生进入考场后,需要进行第二次照片采集,识别系统会将采集到的照片进行图像预处理操作、提取面部特征,得到考生考试当日采集照片的人脸面部特征值后,人脸识别系统会将两次采集到的人脸图像特征值进行对比识别。即将考试当天提取到的面部特征值与数据库中的人脸面部特征值进行对比与识别,最终得出识别结果。实现考生身份的验证与识别。

2.采集模块功能设计。人脸图像采集模块功能:负责获取人脸图像,图像可能来自与计算机连接的摄像头也可能来自人脸图像存储的数据库。将采集到的人脸图像转换为可处理的数字图像格式,进行图像信息存取。

3.图像预处理模块功能设计。图像预处理操作包括对图像进行多种图像处理操作,以使图像本身具有的特征能够更加明显地在图像中表现出来。目的是为后面的人脸特征提取模块提供基础操作处理。本项目中,需在图像预处理模块中进行的图像处理操作有:灰度均衡化、图像二值化和边缘检测等技术操作。

4.人脸特征提取模块功能设计。该模块的工作原理是对获取到的人脸图像进行特征提取,主要包括人脸检测及定位、图像标准化、特征提取三个子功能。

5.人脸图像判定模块功能设计。该模块工作原理是通过模式识别中的分类决策把识别对象归为一类。即确定某一个差别规则,进行检测对比,最后输出识别的结果。本系统中的具体操作即需要将数据库中人脸图像与对应考生现场采集到的人脸图像特征信息进行对比,并得出对比值。再进一步对该对比结果值进一步分析,如果其范围在我们所确认的范围内,我们就认为现场采集图像的考生与注册日人像图像的采集人为同一人,即身份确认通过。否则,则拒绝考生进入答题系统。

四、系统功能实现

人脸图像识别系统功能实现共分为人脸图像采集模块、图像预处理模块、人脸特征提取模块、人脸图像识别模块四个子模块的功能实现。人脸特征提取的效果的好坏对识别准确率效果有重大的影响。本系统采用的特征提取方法是pCa特征提取方法。本系统中人脸图像识别功能的分类决策问题可以分解为两大核心任务问题:SVm分类器识别过程与最近邻分类器识别过程。

1.pCa经典主成分分析。主成分分析算法是一种经典的统计方法,这种线性变化被广泛地应用在数据和分析中,是用来描述和表征细微差异的有力工具。在语音和图像信号处理时,经常会遇到高维的向量空间的数据处理问题,而这些高维数据往往存在较大程度的相关冗余,所以希望从高维空间的数据中找出具有代表性的低维子空间,从而对数据更容易地进行分析和处理。本系统功能实现方法为:首先把待检图像转换成特征脸,作为最初训练图像集的基本组件。利用pCa方法进入处理:在通过操作得到特征脸空间后将待检测图像的线性变换特征投影到该子空间中,最后是将得到的结果与投影后的训练图像相比较,最终得出识别结果。

2.特征脸法。该方法将人脸看作一个二维的灰度变化的模板,这样就可以将人脸图像看成只是一个高维图像空间中很小的一部分。然后利用人脸图像由高维空间通过低维空间进行表征这一工作原理得到一个经过优化的人脸图像坐标系统。

3.SVm分类器识别。假设识别样本有x类,记为S1,S2,…,Sx。则首先需要设计正样本训练器,如本操作中根据题意需设计x个SVm分类器;然后进行负样本训练器的设计,本操作根据题意设为其所有样本Sj(j<>1)个。接下来将每个测试样本输入到x个分类器中,计算样本与这p个分类器所代表的各个训练样本之间的距离。在输出结果中,如果只有值为正1,我们就可判定出该样本的类别了。如果有多于一个的分类器输出结果为正1,那么后面就需要用最近邻分类技术了。

图像识别技术的基本原理篇9

关键词:数字图像;车牌识别;公安应用

中图分类号:tp391.41

1数字图像处理技术简介

随着计算机技术和信息技术的迅猛发展,相关的数字图像处理技术也在不断地更新进步着,数字图像处理技术在公安领域和其他与国计民生休戚相关的各个领域中发挥越来越重要的作用。

1.1数字图像处理技术优点

(1)易存储,安全性强。图像可以存储在U盘、光盘等大容量的介质中以及利用云存储技术进行存储,占用空间小,做好备份不会造成任何损坏和丢失,且不容易被盗失,安全性强。

(2)再现性好,灵活性强。数字图像处理技术可避免图像质量因一系列操作变换而退化,确保处理图像的再现性。此外数字图像可以通过将图像文件分类、分批存档建立一套数据库,对其进行检索来实现快速查找的目的,还可以随时制作若干份拷贝数字图像文件,并利用网络和电子邮件瞬间将其传送到目的地,大大提高工作效率。

(3)适用面广,适用性强。处理图像来源广泛,经不同信息源获取的图像在数字编码后均可以进行数字图像处理。数字图像处理技术具备复制、增强、减弱、翻转、旋转、缩放、均衡、清晰、分色等丰富的特效手段,通过各式数字图像处理软件可以方便快捷的进行相关技术手段操作。

1.2数字图像处理技术常用方法

(1)图像数字化。图像数字化即将模拟图像转换为数字图像的过程。图像数字化是以图像的电子化作为基础,先把模拟图像转变成电子信号,随后再将其转换成数字图像信号。利用计算机进行数字图像处理操作,必须先把真实的图像通过数字化转变成计算机能够接受的显示和存储格式,然后再用计算机进行分析处理。

(2)图像压缩编码。在满足一定保真度的要求下,对图像压缩编码目的是去除多余数据减少表示数字图像时需要的数据量,以便于图像的存储和传输。图像压缩编码可分为两类:一类压缩是可逆的,即从压缩后的数据可以完全恢复原来的图像,信息没有损失,称为无损压缩编码;另一类压缩是不可逆的,即从压缩后的数据无法完全恢复原来的图像,信息有一定损失,称为有损压缩编码。

(3)图像增强。即增强图像中的有用信息,目的是要改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些携有重要信息的图像特征,明确识别出图像中不同事物特征之间的差别,改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。

(4)图像复原。图象复原是利用退化现象的某种先验知识,建立退化现象的数学模型,再根据模型进行反向的推演运算,以恢复原来的景物图象。因而,图象复原可以理解为图象降质过程的反向过程。

(5)图像分割。图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阀值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。

(6)图像分析。图像分析一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构,从而提取具有一定智能性的信息。图像分析同图像处理、计算机图形学等研究内容密切相关,而且相互交叉重叠。

2数字图像处理技术识别车牌在公安领域的应用

2.1识别车牌图像的过程

(1)对车牌图像进行预处理。在进行车牌定位之前要进行车牌图像的预处理,这是因为在进行数字图像处理时,图像质量往往由于图像传送和转换过程而降低,同时车牌图从图像中搜索出具有车牌特征的区域,根据车牌的不同特征,可以采用不同的定位方法,其中最常见的定位方法有:基于车牌颜色特征的方法,基于纹理分析的方法,基于灰度特征的投影方法,基于神经网络的方法等。

(2)对车牌区域进行校正处理。车牌定位提取出车牌区域后,由于摄像机的拍摄角度、车辆行驶状况等其他因素影响,提取出的车牌区域存在一定的倾斜角度,所以通常都要对车牌字符图像区域进行水平倾斜校正处理。目前大部分的倾斜校正方法是根据车牌图像存在边框的确定,通过检测边框直线的倾斜角度,从而得到车牌图像的倾斜角度,进而利用检测到的倾斜角度对车牌进行校正。

(3)对车牌区域进行定位。车牌定位的方法是利用车牌区域的特征来判断车牌图像,以避免对后续的车牌字符分割和识别操作产生影响,这是车牌识别的重要环节。从数字图像处理技术的性质来看,车牌定位主要分为基于灰度图像的车牌定位和基于彩色图像的车牌定位,两种不同图像的车牌定位各有利弊。

(4)对车牌字符进行分割处理。相比于车牌定位只需要给出车牌在车辆图像中的大概位置,车牌分割处理需要从车牌图像中分割出精确的字符图像,字符分割处理的好坏直接影响到车牌识别效果。字符分割常采用垂直投影法实现,是先将不同角度的的车牌图片进行水平投影性处理,然后去除图像的水平边框,再进行垂直方向的投影,利用垂直投影法对断裂字符进行分割的效果较好,能够达到精确识别车牌号码的目的,可适用于复杂环境下拍摄的汽车图像。

2.2数字图像处理技术识别车牌在公安实际工作应用中遇到的问题

在公安日常实际办案工作中,存在部分驾驶人为了逃避公安机关对违法行为的打击查处,采用假牌、套牌或故意遮挡号牌等恶劣行为,另外还存在驾驶人对车牌疏于保养,致使车牌附着大量污垢而肮脏不堪或者车牌出现不同程度的磨损现象,这些往往导致摄取的车牌图像信息很难识别甚至无法被识别,给公安交通管理机关和侦查机关对于非现场执法工作带来极大的挑战。恶劣的道路交通气候条件也是数字图像处理技术识别车牌在公安领域应用中遇到的普遍问题,通常由于雨雪、大雾、雾霾和雷电等天气因素的影响,一方面导致长期处于室外的如道路监控摄像头等车牌车辆信息摄取设备的工作寿命减短、设备性能减弱,另一方面也直接导致在恶劣气候条件下所摄取的车牌图像信息效果降低,使得车牌识别出现一定难度。

3数字图像技术识别车牌在公安领域的重要性

目前针对道路交通等非现场执法的困境是,现有的交通视频监控、电子警察等执法装备对无法精确识别车辆身份,且识别率易受环境、驾驶车辆状况等众多客观因素影响。因此,为了提升公安交通管理和打击违法犯罪执法能力,有必要进一步引入先进技术手段。数字图像处理技术在当今世界公安领域的应用已非常普遍,应用手段越来越丰富,功能也越来越强大,成为世界各国现代公安工作的必备工具。目前,数字图像处理技术识别车牌的使用已经成熟,体现出小工作量,高工作效率,低差错率,投入产出比高,方便易用等优势,对公安日常执法管理工作的促进作用明显。

参考文献:

[1]刘云琦.论数字图像处理技术在车牌识别中的应用[J].中国科技投资,2012(33).

[2]杨英仓.数字图像处理技术在公安领域中的应用及发展前景[J].贵州教育学院学报,2007(02).

图像识别技术的基本原理篇10

abstract:Duetotheapplicationofvisualnavigationtechnologyisbecomingmoreandmorepopular,andtherefore,itisnecessarytostudyvisualnavigationkeytechnologiesandapplications.inthispaper,digitalimageprocessingtechniquesandlocationandtrackingtechnologiesarestudiedindetails,andcorrespondingly,therelevantapplicationisintroduced.

关键词:视觉导航;图像分割;定位跟踪

Keywords:visualnavigation;imagesegmentation;positiontracking

中图分类号:tp39文献标识码:a文章编号:1006-4311(2010)25-0171-01

0引言

伴随着电子技术、计算机技术工业控制技术等的发展,机器智能移动技术也得到了很大的发展。机器智能移动技术的关键部分就是视觉导航技术。视觉导航技术是在机器视觉的基础上发展起来的。但是与机器视觉又有区别,主要表现为在机器视觉的基础上增加了定位跟踪技术,于是就产生了视觉导航技术。通常一个视觉导航系统由视觉信息采集部分、视觉信息处理部分及导航跟踪部分三大部分构成[1-2]。三部分有机结合,完成视觉导航,具体的工作原理如图1所示。其中视觉信息采集部分主要是完成对机器将要经过路线上的图像的采集,这个过程主要由摄像机(CCD)完成;视觉信息处理主要是对采集到的图像进行增强、边缘提取和分割等;利用一定的跟踪算法,实现机器的智能跟踪,即完成机器的导航。

1视觉导航的主要关键技术

构成视觉导航系统的四个部分中,其中的视觉信息处理部分和智能定位与跟踪部分是系统的核心,这两个部分用到的技术是视觉导航系统的关键技术。这些关键技术主要包括两大方面,即图像处理技术和智能定位与跟踪技术。

1.1像处理技术在图像采集时,图像噪声的大小,摄像角度上的光线,非理想话图像处理等都会使图像质量变差[3]。再加上道路两旁及道路本省背景的复杂性,要把有用的图像信息提取出来难度很大。因此,为了更好的提取出对导航有用的图像信息,需要对图像进行处理。图像处理主要是对图像进行分割,把机器能经过的道路与路障分开来。图像分割主要包括边缘提取和阈值分割。

边缘提取。边缘主要是指图像局部变化最明显的部分,边缘是划分目标与目标、目标与背景、区域与区域的标志。图像边缘的检测主要就是利用图像像素点灰度值的不连续性,将目标和背景等不同的区域分开来。常用的边缘提取方法是模板法。模板也称为边缘检测算子,模板的数学基础的图像像素点的梯度变化。

阈值分割。阈值分割的基本原理图像中不同像素点的值不同,通过选取合适的阈值,就可以将图像划分为不同的部分。阈值分割中最典型的就是图像的二值化。图像二值化的方法很多,主要有整体阈值法、局部阈值法和动态阈值法。

不论是图像边缘的提取,还是图像的二值化。其对图像处理的效果,关系到后续的机器智能定位与跟踪。视觉导航能否实现,图像处理是关键因素之一。因此,在图像处理时一定要选择合适的图像处理算法,为后续视觉导航的实现服务。

1.2智能定位与跟踪视觉导航技术中的另一关键技术――智能定位与跟踪。智能定位与跟踪主要是完成对安装了视觉导航系统的机器移动路径及路径上的障碍物的识别,使机器能够实现智能移动。常用的路径与障碍物识别方法有基于道路模型的路径识别方法、基于Hough变换的路径识别、基于LVQ神经网络的路径识别方法。

2视觉导航技术的应用

由于视觉导航技术的发展越来越成熟,其使用也越来越广泛。在工农业生产等各个不同的领域都有所应用。视觉导航技术的应用,给这些领域的生产工作带来了极大的便利,大大提高了机器的工作效率。

2.1视觉导航技术在农业生产中的应用。视觉导航技术在农业生产中的应用,主要表现为农业机械的导航。视觉导航技术用于农业机械的导航,主要是帮助农业机械把目标物与周围的背景区分开来。07年,伦冠德[11]利用图像增强技术与Hough变换相结合,对传统的导航模型存在的不足进行了改进研究,研究结果表明,新方法对导航路径的识别由于传统的模型导航;09年,杨为民等将动态窗口处理技术与Hough变换相结合,对农业机械中的视觉导航系统进行了改进,并取得了较好的导航效果等。

2.2视觉导航技术在机器人领域的应用目前世界上许多危险环境下的作业,都是由机器人完成的。比如机器人用于深海探测。机器人要自动到达既定的探测,而不因为碰到障碍物损坏,这就要求机器人必须要有视觉导航功能。05年,周庆瑞等对视觉导航技术在机器人中的应用进行的研究。利用图像的深度信心,再结合相应的校正算法与跟踪技术,实现了机器人的智能移动。

2.3视觉导航在移动车辆中的应用。具有智能导航功能的移动车辆是当今车辆研究领域的前沿。智能车辆的导航主要是完成环境感知、规划决策和辅助驾驶等功能,这些功能的实现需要计算机视觉技术、控制技术和电子技术等的支撑。其中最重要的还是视觉导航技术。如09年,钱云等研制的基于视觉导航的智能车货物搬运系统,充分利用的图像的边缘提取技术,对智能车要经过的路径进行识别,并且取得了较好的效果。

从上面三个方面的分析研究表明,视觉导航技术在各个领域中的具体应用不同,但所使用的关键技术基本是相同的。主要都是对图像信息的处理和对运动路径的定位于跟踪。

3小结

随着机器视觉产品与我们的生产和生活越来越近,很有必要对视觉导航技术进行必要的研究及应用分析,以便人们能够更好的理解视觉导航产片的工作原理与功能。

参考文献:

[1]吴琳.计算机视觉导航综述[J].人工智能及识别技术.