首页范文计算机视觉开发十篇计算机视觉开发十篇

计算机视觉开发十篇

发布时间:2024-04-25 17:09:50

计算机视觉开发篇1

以下为报告详细内容:

2017年计算机视觉技术在更多的领域有所落地应用,自动驾驶领域、高考、政务等领域更多的场景开始应用计算机视觉技术。艾媒咨询分析师认为,计算机视觉行业技术是核心基础,随着技术成熟度提高,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多新的应用领域,提高商业落地应用。

2017年人脸识别技术在智能手机终端应用开始普及。9月苹果新品会上,iphoneX宣布引入FaceiD高精度人脸识别技术,引来人们高度关注。而除了iphoneX,华为、小米、oppo、vivo等手机厂商都推出了带人脸识别功能的智能手机。艾媒咨询分析师认为,计算机视觉领域内人脸识别功能可应用场景广泛,商业化落地能力强,除了计算机视觉创业企业,互联网巨头和硬件巨头企业也纷纷关注布局人脸识别领域。但目前人脸识别技术仍然存在一定缺陷,艾媒大数据舆情管控系统数据显示,“手机人脸识别”热词言值数据为48.5,整体舆情偏负向。现阶段人脸识别技术在智能手机终端上的应用仍处于起步发展阶段,技术和安全性仍有待提高,未来随着各计算机视觉企业加强技术研发,人脸识别技术有望进一步改善,成为智能手机标配。

iimediaResearch(艾媒咨询)数据显示,2017年中国计算机视觉市场规模为68亿元,预计2020年市场规模达到780亿元,年均复合增长率达125.5%。艾媒咨询分析师认为,人们安全和效率需求不断提升,计算机视觉技术在各行业应用能有效满足人们需求,市场发展空间巨大。国家政策对人工智能行业的支持也为计算机视觉的发展提供了有利的环境。随着计算机视觉技术日渐成熟,企业商业化落地能力不断提高,未来计算机视觉市场规模将迎来突破性发展。

iimediaResearch(艾媒咨询)数据显示,商汤科技以24.3%的企业知名度排名各计算机视觉企业首位,旷视科技与云从科技则分别以23.1%以及21.7%的知名度分列二三位。艾媒咨询分析师认为,商汤科技计算机视觉技术及算法能力在行业内较为出色,同时在安防、金融、商业、手机端等多个领域均有商业落地应用,在企业认知和品牌推广方面具有优势。

iimediaResearch(艾媒咨询)显示,61.7%的受访网民通过手机app应用接触计算机视觉应用,另外有50.9%的受访网民接触途径为通过智能手机终端。艾媒咨询分析师认为,计算机视觉企业主要服务B端用户及政府机构,相比于其他途径,移动端更适合应用计算机视觉技术的产品推广。计算机视觉技术日趋成熟,在移动终端和app上均有落地应用,也进一步为计算机视觉企业在大众中奠定基础。未来企业可通过线上渠道开发挖掘C端用户市场。

iimediaResearch(艾媒咨询)显示,半数受访网民认为智能手机及app加入人脸识别技术功能方便了二者的使用,另有48.8%的受访网民认为人脸识别技术在手机及app上的应用是未来技术发展的趋势。艾媒咨询分析师认为,人脸识别技术在手机及app端的应用满足人们智能化和便捷化的需求,随着越来越多的手机及app产品加入人脸识别功能,未来其普及和认可程度将得到进一步提高。

iimediaResearch(艾媒咨询)显示,41.8%的受访网民表示未来愿意使用人脸识别技术进行手机及app解锁,同时有41.4%的受访网民虽持观望态度,但愿意尝试。此外,47.4%的受访网民认为人脸识别将取代其他手机及app解锁技术成为未来主流。艾媒咨询分析师认为,近期智能手机纷纷应用人脸识别技术解锁推动该功能技术的普及,便捷性的优势使该功能技术前景受看好。但目前人脸识别解锁技术的准确性仍然受到质疑,随着未来技术进一步成熟,该技术有望成为智能手机设备标配。

iimediaResearch(艾媒咨询)显示,33.9%的受访网民曾使用过人证比对功能进行业务办理。在使用过该功能的人群中,54.6%认为其方便了业务办理,提供了效率,且有47.3%该部分人群认为其识别准确程度高。艾媒咨询分析师认为,政府、银行等机构业务办理效率以往常遭诟病,人证识别技术的应用提高了办事效率,在提高人们满意度的同时,加强了计算机视觉技术的认可度。未来计算机视觉技术在政府、银行等机构的落地应用将进一步扩展,但其中涉及到个人信息保护等问题需要企业及相关机构合力解决。

iimediaResearch(艾媒咨询)显示,34.1%的受访网民认为公安办案为最有必要应用人脸识别技术的安防情景。而关于网民对人脸识别技术在安防监控领域应用看法调查中,56.1%的受访网民认为其能有力保护人们人身财产安全。艾媒咨询分析师认为,计算机视觉技术,尤其是人脸识别技术在安防领域应用意义重大,在刑侦破案、身份认证、公共安全保护等情景具有重要应用价值。未来安防领域将成为计算机视觉技术重点应用领域,而安防的重要性也对相关企业技术实力有严格的要求,未来安防领域市场或由少数技术实力较强的企业占据。

商汤科技是专注计算机视觉与深度学习原创技术的人工智能创业企业,拥有强大的技术能力和人才资源储备支撑发展。商汤科技在计算机视觉领域综合实力较强,获资本方青睐,B轮融资4.1亿美元,同时与国内外知名企业展开合作。艾媒咨询分析师认为,商汤科技在商业营收上同样处于行业领先水平,但其本质专注于技术发展,强大的技术基础能较好支撑商汤科技在上层应用场景的扩展。商汤科技在技术驱动商业应用的同时,积累商业应用经验,提高企业知名度,拓展应用至更多领域。

艾媒咨询分析师认为,商业化落地能力欠缺是目前计算机视觉行业大部分企业的痛点,商汤科技在商业落地应用方面处于行业领先位置。这一方面源于商汤科技技术能力往专业化发展,以专业技术和研发基础实现场景差异化应用。另一方面,纯计算机视觉技术或算法由于其专业性,需求方在使用时需要具备专业能力,而商汤科技技术产品往标准化方向打造,打包成行业解决方案,能适应更多企业使用需求,也有利于商汤科技技术进一步落地应用。未来坚持技术为基础,继续提高商业落地能力,商汤科技有望继续保持良好发展态势。

旷视科技成立于2011年,2017年10月完成巨额C轮融资,专注于人脸识别、图像识别和深度学习技术自主研发和商业化落地,深耕于金融安全、城市安防、商业物联、工业机器人等领域,同时打造人工智能开放云平台。艾媒咨询分析师认为,旷视科技利用云平台为开发者提供技术支撑,有利于计算机视觉技术进一步结合产品运营,同时可以收集海量图片数据,通过进行深度学习,旷视科技图像识别技术又能进一步得到提升,有利于其强化自身核心技术能力。

艾媒咨询分析师认为,人脸识别技术对于金融行业业务办理及风控等流程具有重要应用价值,旷视科技在人脸识别技术上的优势也助其有效开展金融领域的服务应用。未来随着旷视科技利用云开放平台相关图片数据进行深度学习强化人脸识别技术,以及在金融领域积累的渠道资源,其有望在金融领域继续强化技术服务,成为该领域市场有力的竞争者。

艾媒咨询分析师认为,自动驾驶为人工智能和汽车行业未来发展方向,计算机视觉技术在自动驾驶汽车实现路况感知、高精度定位等方面发挥重要作用,自动驾驶为计算机视觉技术未来重要应用领域。图森未来的计算机视觉技术和算法在自动驾驶领域实现专业化发展,未来有望在此细分领域成长为领先企业。

2017-2018中国计算机视觉行业发展趋势

需求驱使计算机视觉行业发展潜力巨大应用场景拓展渗透各行业

艾媒咨询分析师认为,人们对生活安全以及生产效率追求两大需求的提升,决定计算机视觉行业具有巨大发展空间。而计算机视觉技术场景应用具有广泛性,有望发展成为下一个智能时代的标配。目前计算机视觉技术主要应用在B端领域,短期内行业发展趋势也是集中于B端领域。未来随着技术成熟,计算机视觉有望拓展更多新的应用场景,实现场景落地,渗透至各行各业,形成ai+,开拓更多C端业务。此外,计算机视觉技术可以跟其他技术,如aR、VR、无人驾驶等结合发展,创造新的应用领域。

技术应用由点及面行业解决方案及软硬件结合成商业产品出路

对于计算机视觉技术使用者来说,由于技术的学习应用需要花费较多时间和精力,硬件产品及行业解决方案往往更受青睐。未来计算机视觉企业需要将软硬件结合,如打造嵌入式芯片等。此外,计算机视觉企业应将技术应用由点及面,将技术应用发展成针对各行业的解决方案。未来市场将出现更多基于计算机视觉技术应用的行业解决方案和软硬一体化产品,只有打造方便用户使用的商业产品,才能有效适应其需求,帮助计算机视觉企业迅速占领行业市场,在市场竞争中取得领先优势。

计算机视觉行业发展对企业综合实力要求高

艾媒咨询分析师认为,计算机视觉行业巨大的发展前景决定其具有高成长性特点,未来将涌现更多人工智能领域优秀企业。但行业发展同时伴随高风险性,行业竞争需要比拼企业技术算法能力、资金能力、以及人才资源,同时考验企业能否实现技术迅速落地,对企业综合实力要求高,综合实力不具备优势的企业在行业内将难以生存。

计算机视觉开发篇2

1.1自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。

2.1计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和Bet算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。mertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3计算机视觉技术在检测食品中微生物含量的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BaRDot)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3检测性能受环境制约

计算机视觉开发篇3

关键词:计算机辅助环境艺术设计起源现状及发展

随着计算机软硬件的进步,计算机辅助设计逐渐成为建筑效果图表现的主流。所谓计算机辅助环境艺术设计是指设计师通过计算机技术表现设计意图,最终以图像的方式告知客户,使客户清晰地理解设计师的设计意图和创意,它是一种更为直接、有效的表现方式,通常又被人们称为计算机建筑效果图。

一、计算机辅助环境艺术设计的起源

计算机的发展及应用,使人们的生活日新月异。计算机辅助设计源于计算机图形技术的产生,计算机辅助设计的研究构想发端于1950年,但使用计算机绘图的最早记录是在1963年,美国麻省理工学院的研究人员伊凡·苏泽兰在美国计算机联合会会议上发表了名为《画板》的博士论文,从而开始了计算机辅助设计的发展历程。他从1950年开始着手开发通过图形技术来处理人与电脑交互对话的操作系统。1963年,这套以电脑主机、显示屏、光电笔和键盘为工具的图形画线系统得到实现。这套图形画线系统开发和引进了许多计算机绘图的基本思想和技术,使用户可以运用电脑画出直线、复杂曲线以及简单的标准部件。

最初CaD被解释为“计算机辅助绘图”,由于当时计算机在设计上的作用是替代传统手工绘图的一种新工具,但随着后来信息技术的飞速发展,计算机技术在各领域的广泛应用,CaD的含义也在不断变化扩展,随着20世纪70年代像素的产生、80年代三维曲面造型系统的开发等,使电脑绘图从只能用“线”这一基本绘制元素发展到可以用点、面、体进行绘制计算机图形,从而使CaD的含义也发展成现在人们比较熟知的计算机辅助设计这个概念了。1970年的威尼斯双年展首次接纳了计算机绘画作品,这也标志着新的视觉艺术形式的诞生得到了社会的承认。

我国的计算机辅助设计起源于20世纪70年代。与国外计算机辅助设计发展的轨迹相似,国内计算机辅助设计的研究与应用基本上是从各高等院校发展起来的。20世纪90年代初,随着我国现代化进程的迅速发展以及计算机的进一步普及,在环境艺术设计和创作领域,计算机技术应用的价值,逐渐得到人们的重视。

二、我国计算机辅助环境艺术设计的现状

计算机作为信息时代重要的技术工具,在环境艺术设计领域得到普遍应用。在20世纪90年代前,国内对环境艺术设计效果的表现是使用手工绘制的方法,到了20世纪90年代初期,计算机辅助设计技术开始在我国建筑业应用。计算机辅助设计技术在建筑设计表现领域以不可逆转的潮流迅速发展。尤其是到了20世纪末,计算机辅助设计逐渐成为建筑效果表现的主流。起初,设计师主要运用autoCaD软件进行施工图的绘制,在方案阶段还以手绘为主。但随着相关专业软硬件的更新和进步,它自身的强大优势得以显示,同时对传统手绘表现产生了越来越大的冲击。

随着近十几年来我国计算机辅助环境艺术设计的发展,计算机建筑效果表现的类型己经有了很细致的划分,可以分为:计算机建筑效果图、计算机建筑漫游动画和计算机建筑效果虚拟现实。计算机建筑效果图主要是通过3DSmaX,Lightscape,photoshop等计算机软件制作的静态的效果图。通过计算机三维软件从平面、立面数据中得到透视图,透视点位置及视点角度均可变换,然后再渲染出二维图像,这种方式是目前社会上应用最广泛的。计算机漫游动画是利用3DSmaX软件的三维动画功能,在建筑物的室内或室外的设计阶段就能以可视的、动态的方式全方位展示建筑物所处的地理环境、建筑物外貌和各种附属设施以及建筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。

三、计算机辅助环境艺术设计的发展趋势

当前,随着计算机软硬件技术的迅猛发展,计算机辅助设计在环境艺术设计领域受到了广泛的重视和应用,比如各种方案的汇报、投标以及招商广告中随处可见,从而出现了大量的绘图软件的教程以及在教学上更加重视计算机绘图软件的教学课程。人们更多的关注计算机技术,想方设法掌握各种绘图软件,在模型、材质、灯光以及各种渲染技法上花费大量的时间,而忽略了最终的效果图的艺术性。计算机辅助设计是科学与艺术以及计算机与艺术设计相结合的边缘学科。计算机辅助设计在视觉艺术创造规律、形式法则和审美方法与传统的艺术设计是相同的。所谓视觉艺术,是通过人的视觉感受而将客观内容纳入主观心灵并予以对象化呈现的艺术形态。一些美学研究者认为,从审美主体的角度来看,艺术离不开创造者和欣赏者两个方面,而这两个方面都要通过一定的感官和相应的感性物质媒介,前者创造出审美对象,后者达到审美愉悦。所以说,作为视觉艺术的计算机辅助设计作品既要真实的描绘场景,又要使欣赏者达到审美偷悦。不可否认,人们的欣赏水平在不断提高,求新、求异的视觉口味也越来越高。这源于技术的发展、审美的进步,计算机技术的发展对于社会和艺术创造产生了重大的推动作用。

在计算机辅助环境艺术设计发展的初级阶段,设计师的目标是使效果图具有真实感,能够模拟未来场景的真实效果,具有一定的实用性。目前的计算机建筑效果图的风格单一,已经不能满足大众的不断提高的视觉口味。计算机建筑效果图既是表现的技术同时它又是视觉艺术。设计师创造出审美对象,筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。使用的软件有Creator系列三维建模工具及Vega场景管理软件。计算机建筑效果虚拟现实技术强调的是一种身临其境的感觉,采用的是人与人之间自然的交互方式。它可以实现逼真的、纯三维的场景,可以全方位、多角度、完全由用户自由控制在场景中漫游。作为建筑师可以从多个角度观察建筑方案,所以说虚拟现实技术不仅可以使用于建筑表现,而且也是一种推敲方案的有利手段。VR技术在我国的环境艺术设计领域中有着广泛的应用前景,将给环境艺术设计带来革命性的改变。

设计师创造出审美对象,要使欣赏者达到审美愉悦而不是审美疲劳。为此,根据目前我国计算机辅助环境艺术的发展情况,未来计算机建筑效果图应呈现艺术化、人情化和多样化趋势。

参考文献:

[1]邓庆尧.环境艺术设计[m].济南:山东美术出版社.

[2]张绮曼.中央工艺美术学院环境艺术设计系—室内设计的风格样式与流派[m].北京:中国建筑工业出版社.

[3]张绮受.中央工艺美术学院一环境艺术设计与理论[m].北京:中国建筑工业出版社.

计算机视觉开发篇4

关键词:CG 视觉艺术 VR 数字雕绘

“CG”为ComputerGraphics(计算机图形学)的英文缩写,是随着计算机的诞生而兴起的一门学科,是一种使用数学算法将二维或三维图形转化为计算机显示的栅格形式的科学。简单地说,计算机图形学的主要内容就是研究如何在计算机中表示图形,以及利用计算机进行图形的计算、处理和显示的相关原理与算法。在二十世纪五十年代中期,一批计算机专家为了了解电脑的潜力,开始将计算机图形学的知识运用到科学模拟和视觉艺术创作领域。到了八十年代,随着个人计算机的普及、相关艺术专业软件的开发、专业艺术家与计算机专家之间联系的加强,以交互式为特点的CG艺术开始崭露头角。时至今日,CG艺术已广泛应用于影视、娱乐、游戏、军事、建筑、网络等各行各业。

进入二十一世纪,CG在技术上已基本进入成熟期。目前,艺术家已可以利用CG技术来进行数字雕塑、数字绘画、自然笔触模拟、照片级渲染、非真实渲染等,利用CG来完成传统意义上的视觉艺术创作已成为完全可能。技术上的束缚对于CG艺术家来讲已不再是一个瓶颈。视觉艺术通常又被称为“美术”、“空间艺术”、“造型艺术”,它是一种广义的范畴,包括传统美术(诸如素描、绘画、版画、雕塑),传播和设计艺术(诸如电影、电视、图形制作、产品设计),建筑和环境艺术(诸如城市设计、内部和园林设计),民间艺术,以及诸如制陶、纤维编织、珠宝等艺术品和木制、纸制与其他材料的艺术制品。视觉艺术是用一定的物质材料,靼造直观形象的艺术,包括绘画、雕塑、建筑艺术、实用装饰艺术和工艺品等。

CG作为一种创作手段,已渗透到整个视觉艺术领域,几乎囊括了当今电脑时代中所有的视觉艺术创作活动,如平面印刷品的设计、网页设计、三维动画、影视特效、多媒体技术、以计算机辅助设计为主的建筑设计及工业造型设计等。从这一点来看,CG是视觉艺术的数字化表现形式。

CG作为一种新兴的视觉艺术表现手法,有着非常独特的特点。它的出现大大扩展视觉艺术创作的各种可能性,同时也发展出很多新的视觉艺术领域,对视觉艺术的发展产生了极其深远的影响。

CG对视觉艺术设计最直接的贡献就是新的造型语言及表达方式。计算机图像处理上的特点,使计算机创作的作品表现出新的风格。屏幕显示的方式,开辟了艺术设计表现的新领域。艺术设计过程不再是单向发展的,而是多向反复的。从作品的素材看,由于扫描仪及数码照相机的出现,设计师能更直接地输入真实的图像,通过二维或三维技术的辅助,模拟出逼真的虚幻世界,并从观念上改变了人对真实准则的认识。

如今,在用计算机模拟自然绘画笔触效果方面。软件技术已经有了很大的突破,计算机模拟绘画的技术为艺术家们提供了一个十分真实的绘画环境和更大范围发展的机遇。它包括更复杂的通用软件技术,用以模拟传统的工具:从油画、水彩、树胶水彩到铅笔、炭条和彩色粉笔、水墨,能够出色地获得传统绘画的效果。由于多种笔法效果能同时施用于一幅画面,这使艺术家可以有多种多样的尝试,尽情地表现其创意。同时,计算机笔触所特有的有序性、随机性、数学美感等特点。也为艺术家提供了更多的创意和创作可能。

在平面设计中,CG技术可以大大简化工作流程,并在作品中表现出丰富多样的感觉形式。例如:设计师用扫描、拍摄等多种手段将各种材质输入到计算机中,使之与图形或字体结合,就能将触觉肌理引入到视觉传达上产生生动的视觉形象。人们很早就在二维空间中模拟三维的效果,试图产生虚幻的空间感。CG技术将这种尝试的可能性扩展到了最大化,如通过形体的改变或形体间的重组,快速而有效地表达出画面的视觉深度;又如计算机模拟摄影、模糊形体及色彩的技法,能使图像发生改变,产生动感。之所以能产生空间感,是由于计算机图像对应的是一系列的数据。计算机在屏幕上缩放的优势,增强了精细设计的可能性,也使表现层次更多样化。观察物体时,视点如具有流动性,可以表现出物体各部分的细节,同时也能在不同的视点中对形体进行构筑和修改。另外,由于可以从现实不存在的角度来展现物体的整体或局部,这样就可以获得超乎寻常的夸张变形效果。计算机创造的形体更富于变化,复杂的空间曲面也能模拟表现出来。

三维作品也是美术和设计中一个主要的表现形式。计算机三维建模系统已成为令人信服和能力很强的新工具。在计算机的三维空间中,多个形体可以连接或打散,因此可创造出复杂的物体形象。相关联的部件可以设定成一组,在变化时保持空间关系不变,这样在分析研究对象时更具层次性和关联性。动画技术的引人可以让观者研究物体的运动状态,以及各部分之间的关系。通过CG三维技术,设计师可以将设计结果表现得更为生动和直观。

CG三维技术被广泛应用于工业设计、影视特效、动画、建筑预览表现等视觉设计领域。除此之外。CG技术还和其它计算机技术结合发展,派生出视觉艺术领域最为前沿的学科一虚拟现实。虚拟现实,英文名为VirtualReality,简称VR技术。这一名词是由美国VpL公司创建人拉尼尔(JaronLamer)在上世纪八十年代初提出的,也称灵境技术或人工环境。作为一项尖端科技,虚拟现实集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术的最新发展成果,是一种由计算机生成的高技术模拟系统,它最早源于美国军方的作战模拟系统,九十年代初逐渐为各界所关注并且在商业领域得到了进一步的发展。这种技术的特点在于计算机产生一种人为虚拟的环境,这种虚拟的环境是通过计算机图形构成三维数字模型,并编制到计算机中去生成一个以视觉感受为主,也包括听觉、触觉的综合可感知的人工环境,从而使得在视觉上产生一种沉浸于这个环境的感觉,可以直接观察、操作、触摸、检测周围环境及事物的内在变化。并能与之发生“交互”作用,使人和计算机很好地“融为一体”,给人一种“身临其境”的感觉。

同时,cG技术自身的飞速发展,也拓展出很多以前没有的视觉艺术领域。比如:美术史上曾经不止一次地出现过针对“雕塑与绘画哪种形式更优越”这一问题的论战,其中最著名的就是文艺复兴时期达・芬奇与米开朗琪罗的论战,据说这两位在各自领域内无可争议的大师曾经针对这个问题唇枪舌剑了许多年,为了论战他们甚至完整透彻地研究了对方的艺术领域,最终他们两个人都成为绘画+雕塑的双料大师。CG发展到今天,同样在技术上再次印证了这两位大师论战的结论,目前的CG三维技术已经将绘画和雕塑完全整合到了一起,发展出数字雕绘这样的新兴视觉艺术。无数三维建模师和二维概念艺术家逐步参与到数字雕绘领域,成为这一领域的先驱。并且数字雕绘技术从产生之日起,就迅速渗透到各种传统视觉艺术中去,特别是在电影特效和次世代游戏创作中发挥着超凡卓群的作用。

综上所述,CG艺术作为一门新兴的艺术独立存在。但归根结底它属于视觉艺术的一个分支,是建立在视觉艺术这个大型构架上的组合体,是一种新型表现的手段。因此,它不会脱离视觉艺术而独立存在。CG技术成就了新的表现手段,并在不断发展中,这些表现手段对某些传统视觉艺术的表现手段具有颠覆性的意义。同时,这些新的表现手段还无限地扩大了艺术家的创作思路,改变着他们的思维方式。

参考文献:

[1]倪明田,吴良芝.计算机图形学.北京大学出版社.1999,(1).

计算机视觉开发篇5

近年来,经济的发展和人们生活水平的提升也使得人们的出行更加便捷,越来越多的人都是自己驾车出行,这样导致公路上的交通流量不断增加,如何保障交通的顺畅性和安全性成为人们关注的重点问题。信息技术的发展推动了计算机视觉技术的出现,为交通安全性的提升提供了一定的保障。本文主要对计算机视觉技术进行分析,进一步探讨计算机视觉技术在智能交通系统中的应用。

【关键词】计算机视觉技术智能交通系统应用

智能交通系统简称itS,这是一种新型的交通管理系统。该系统主要结合了信息化技术、计算机技术以及数据传输技术等多种技术,用来对整个交通运输体系进行管理,可以实现人、车、路的全面监控和管理。计算机视觉艺术作为智能交通系统中的一个重要环节,受到相关工作人员的高度重视。随着计算机视觉技术的发展,不仅为交通行业的发展提供了更多的便捷,同时还能够筛选道路交通的各种信息,进一步增强了智能交通系统的灵活性和准确性。

1计算机视觉技术的概述

计算机视觉也被称为图像分析和图解理解,其包括的理论主要有摄影几何学、概率论、图像处理理论以及人工智能理论等部分。计算机视觉技术主要是用二维投影图像实现三维物体重构。这种技术的应用范围比较广泛,不仅应用于二维图像识别方面,同时还用于三维物体的识别和重建上面。通过计算机视觉技术能够获取专业化的三维信息,对三维信息的获取一般有两种方法,其中一种是直接获取法,还有一种是间接获取法。直接获取法主要是通过计算机视觉技术的效果来确定三维运动中产生的各种参数,这一过程对摄像机运动问题的关注程度较高;间接获取的方式就是将单幅图像和摄像机焦距相结合,来判断被测量位置视觉上的信息。计算机视觉技术的关键就是实现特别匹配,在特殊情况下可以利用不同的摄像C同时收集运动信息,从而提高相关控制的精确度。

2计算机视觉技术在智能交通系统中的应用

计算机视觉技术在智能交通系统中的应用可以实现道路交通的监控,同时还能够实现自动收费、智能导航等功能,主要应用有以下几个方面的内容。

2.1交通监控中对计算机视觉技术的应用

基于计算机视觉技术的交通监控系统主要分为三个步骤,首先是对车辆和行人进行跟踪和分割,其次是对车流量进行分析和计算,并且计算车辆的平均速度和道路上车辆的队列长度,最后根据道路的交通状况来规划形式线路,从而有效缓解道路交通拥堵的现状,方便人们减少出行时间。车辆和行人作为道路中运动的主要目标,在监控场合下,需要对运动时间进行有效分割,常用到的分割方式包括光流法和帧差法两种,其中前一种分割方式主要是依据图像中不同的运动用映射参数正确的表达,这样可以将具有同样映射参数的光流量进行分配,从而完成参数分割。计算机视觉在交通监控中的应用主要是对车辆速度、车辆数目、车辆分类进行检测。随着计算机通信技术的发展,计算机视觉技术也是日新月异,基于计算机视觉的交通监控系统具有较强的实时工作性,能够快速的适应高度公路以及城市道路交通的监控。

2.2车辆导航中对计算机视觉技术的应用

实现车辆的智能导航是计算机视觉技术在智能交通中应用的典型案例。这种技术主要为驾驶人员提供道路信息和车辆运行状况两大信息。通过车辆智能导航系统的运行能够对道路两边的界限进行有效的识别,将车辆引向规定的行驶车道,在车辆行驶过程中,该系统能够自动检测车辆与前方其他车辆之间的距离,从而提醒驾驶人员保持车辆的安全距离,最终实现安全导航驾驶。通过该系统的摄像机运动能够识别其他车辆的行驶状况,并且通过计算检测点的方式计算车辆的模拟匹配点。车俩智能导航系统中就使用了计算机视觉技术,可以从中提取相关信息,计算车辆行驶的安全距离和速度。

2.3计算机视觉技术用于车辆辅助驾驶

计算机视觉技术在车辆辅助驾驶中的应用主要是帮助驾驶人员对外界的变化做出反应。具体表现为车辆在市内行驶时,计算机视觉技术的应用能够识别周边道路的标记,并且对交通标志、其他车辆和行人进行识别,然后筛选相关信息进行计算,让驾驶人清楚外界的具体状况,从而避开其他的车辆和行人,能够从根本上减少交通事故的发生,增强车辆的安全运行。辅助驾驶的形式转变为人机交互的方式,一定程度上能够满足驾驶人员对信息的需求。

2.4计算机视觉技术用于车辆智能收费

车辆收费是车辆在公共交通位置行驶中的一个关键环节。随着科学技术的发展,车辆收费系统逐渐向着计算机技术的应用方向发展,计算机视觉技术在各地区交通发展中的应用是现代化交通发展的一个重要突破口。很多地区的智能化收费都是通过识别车牌的方式来实现收费,我国在车牌识别这方面仅仅限制于单目车牌和双目车牌的识别,其中单目车牌识别的核心就是将车牌照位置作为核心部分,我国大部分地区都是将单目系统作为核心部分来使用。采用双目系统对车牌进行识别,也可以对车辆的型号进行识别,通过大量的实践发现,双目系统进行车牌识别的实用性较强。但是这种识别方式在实际应用过程中仍然存在着信息获取难度大、车牌照定位难度大等多种问题,尤其是车辆在高速路上行驶时,对于车牌信息的获取更为困难,因此,在这方面还需要加大研究和实践。

3结束语

随着计算机视觉技术的智能化发展,其在智能交通系统中的应用能够解决多方面的问题。该技术的应用不仅能够实现车辆的实时监控,同时还能够实现车辆导航以及车辆收费,帮助驾驶人员识别车辆行驶中存在的障碍物,这样一来,可以增强车辆行驶的安全性,同时还能够提高我国道路交通系统的整体管理水平。但是该技术应用中也存在不足之处,未来发展中需要降低视觉系统的价格,减少系统的尺寸,从而增强系统对车辆信息的处理速度,最终实现对道路交通的全面监测。

参考文献

[1]王春波,张卫东,许晓鸣.计算机视觉技术在智能交通系统中的应用[J].测控技术,2000(05):22-24.

[2]郁梅,蒋刚毅,郁伯康.智能交通系统中的计算机视觉技术应用[J].计算机工程与应用,2001(10):101-103+121.

[3]顾晶.基于计算机视觉的智能交通监控系统的研究[D].东南大学,2006.

[4]谢萍萍,黄传春.计算机视觉技术在智能交通系统中的应用[J].福建电脑,2008(10):77+133.

计算机视觉开发篇6

abstract:Fornowthedefectsoffiremonitor’slocationtechnologyinlargespacebuilding,thebinocularstereovisionisappliedtoorientatingfireinthesebuildings,theproblemofreal-timeoffiremonitoriswellsolved,havingveryhighusevalue.

关键词:高大空间建筑双目立体视觉火源定位

Keywords:LargeSpaceBuilding,BinocularStereovision,FireLocation

中图分类号:G267文献标识码:a文章编号:

1.概述

改革开放以来,我国各种民用建筑类型都得到了长足的发展。特别是近年来高大空间建筑日益增多。高大空间建筑由于建筑结构的特殊性和使用功能的复杂性,导致其防火分隔很困难,常规的灭火设施功能难以施展。针对这一情况,人们对适合于此类建筑的灭火技术进行了大量的研究,已有相关产品(智能消防炮)应用到实际工程中。目前消防炮定位技术主要集中在红外线、紫外线火灾探测器的扫描搜索定位以及基于机器视觉技术进行火灾空间自动定位,这一方法是利用安装在炮管上的单目摄像机进行扫描定位。然而这两种装置完成对一个火源的定位,需要把探测器调整到两个理想位置,硬件调整所需时间较算法实现所需时间要长的多,因而系统定位过程所需时间主要花费在探测器位置调整上,因而具有明显滞后性,不符合火灾扑救实时性要求[1]。针对这一情况,本文采用双目立体视觉定位技术来实现火源定位来弥补滞后性问题,具有很高的利用价值。

2.双目立体视觉定位基本理论介绍

2.1双目立体视觉原理[3]

双目立体视觉(BinocularStereoVision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。己知两摄像机之间的位置关系,便可以获取两摄像机公共视场内物体的三维尺寸及空间物体特征点的三维坐标。

2.2摄像机模型

摄像机采集到的图像二维信息,要想根据这个二维信息得到物体实际的三维信息,就要建立图像坐标系与世界坐标系之间的映射模型。本文用经典针孔摄像机模型来描述这一关系,如图1所示。其中XwYwZw为世界坐标系,XCYCZC为摄像机坐标系,xy为图像物理坐标系,uv为图像像素坐标系。

图1摄像机针孔模型

上述模型存在以下关系:

(2-1)

m1为内部参数矩阵,m2为外部参数矩阵。

2.3双目立体视觉三维测量原理

双目立体视觉三维测量是基于视差原理,图2所示为简单的平视双目立体成像原理图,两摄像机的投影中心连线的距离,即基线距为B。两摄像机在同一时刻观看空间物体的同一特征点p,分别在“左眼”和“右眼”上获取了点p的图像,它们的图像坐标分别为pleft=(Xleft,Yleft),pright=(Xright,Yright)。假定两摄像机的图像在同一个平面上,则特征点p的图像坐标的Y坐标相同,即Yleft=Yright,则由三角几何关系得到:

(2-2)

图2双目立体成像模型

则视差为:D=Xleft-Xright。由此可计算出特征点p在摄像机坐标系下的三维坐标为:

(2-3)

因此,左摄像机像面上的任意一点只要能在右摄像机像面上找到对应的匹配点,就可以确定出该点的三维坐标。这种方法是点对点的运算,像面上所有点只要存在相应的匹配点,就可以参与上述运算,从而获取其相应的三维坐标。

3.双目立体视觉定位关键技术

双目立体视觉系统包括图像采集、摄像机标定、特征提取和立体匹配等部分,其中最关键的是摄像机标定和立体匹配这两项技术[2]。

所谓摄像机标定,就是确定摄像机内外参数m1、m2的过程,本文使用ZhangZ.Y.提出的基于2D平面靶标的摄像机标定方法[3]。

立体匹配其基本原理是从两个视点观察同一景物以获取立体像对,匹配出相应像点,从而计算出视差并获得三维信息。从各具特色的双目立体匹配算法框架来看,算法有效性主要依赖3个因素,即选择准确的匹配基元(决策变量)、寻找相应的匹配准则(目标函数和约束条件)和构建能够准确匹配所选基元的稳定算法(求解过程)。

在本文中,考虑到火灾火焰定位报警这种实时性要求较高的场合,我们采用的匹配算法主要是局部匹配算法中的区域匹配法。区域匹配是直接对图像像素进行匹配,匹配结果不受特征检测精度和密度的影响,可得到较高的定位精度,使得区域匹配的鲁棒性有很大提高,同时也能满足实事性需求。匹配准则利用双目立体视觉中的极线几何约束条件。

4.实验平台

4.1硬件平台实现

采用陕西维视数字图像技术有限公司提供的系统开发平台方案搭建硬件平台,整个系统总体构架如图3所示。

图3硬件系统总体架构

该系统介绍如下,用两部微型高清晰黑白工业相机获得火灾图像,该两部摄像机摄像机水平平行放置。经两路工业高清图像采集卡(mV-采集后送至台式电脑,该采集卡支持VB、VC、DeLpHi二次开发,提供开发实例源代码。带软压存储软件,支持多种操作系统。利用安装在电脑里的开发软件(VisualC++2008+openCV2.0)来实现摄像机标定以及火源空间定位软件的开发工作。利用开发的软件计算出火源空间三维坐标后,电脑给机器视觉可精确控制运动高速云台发出指令,来验证定位的准确性和实时性。该云台可通过运动控制卡(内置)来精

确控制。控制范围水平面不小于-157度到+157度,垂直平面内不小于-36度到+36度,控制精度0.0129°,60步/s-1000步/s数字化加速度控制,运动速度可控可调,用于自动控制、自动跟踪、视觉仿真等机器视觉平台的搭建,可以二次开发。

4.2软件平台实现

openCV(opensourceComputervisionLibrary)[4]是intel公司开发的开源计算机视库,它由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉方而的很多通用算法,具备强大的图像和矩阵运算能力。它拥有包括300多个c/c++函数的跨平台的中、高层api,不依赖于其它的外部库(尽管也可以使用某些外部库),通过调用openCV算法库,研究者们可以在前人己完成的成熟算法基础上迅速开展自己的工作。作为一个基本的计算机视觉、图像处理和模式识别的开源项目,openCV可以直接应用于很多领域,作为二次开发的理想工具。

该平台基于windows7操作系统,利用VisualC++2008开发了一个基于openCV2.0的火源定位系统。

图4软件平台模块功能图

图5是在本系统在openCV下生成的tsukuba三维重建图,由此可见我们便可以借助三维重建的方法,达到对火灾火源空间定位。

图5tsukuba图相对的三维重建图

5.结论

随着经济和社会的不断发展进步,大空间建筑越来越多,随之带来的高大空间建筑的火灾扑救问题受到更多的关注。本文针对目前消防炮定位技术的不足,提出了双目摄像机立体视觉空间火源定位技术,将定位和联动独立开来,可以更实时地实现定点灭火,把火灾造成的损失减小到最小程度,必将具有广阔的应用前景和使用价值。

参考文献

[1]侯杰,钱稼茹等.高大空间建筑火灾探测及扑救技术发展思考[J].华中科技大学学报(城市科学版),2008,25(4):196-201.

[2]原思聪,刘金颂等.双目立体视觉中的图像匹配方法研究[J].计算机工程与应用,2008,44(8):75-77.

计算机视觉开发篇7

(1)课程内容方面:工程应用价值较小的内容居多;具备工程应用价值的方法,如基于结构光的3D信息获取,在课程内容中却极少出现。

(2)课程定位方面:现有课程体系中未能体现最新研究成果,而掌握世界最新工程应用成果是卓越工程师的基本要求之一。

(3)教学形式方面:传统计算机视觉课程侧重基本原理,尽管范例教学被引入到课堂教学中,在一定程度上帮助学生理解,但卓越工程师培养目标是培养学生解决实际工程问题的能力。针对卓越工程师培养目标,以及目前计算机视觉课程中存在的问题,本文提出工程应用导向型的课程内容、面向最新成果的课程定位、理论实例化与工程实践化的教学形式,以培养具有扎实理论基础及工程实践能力的卓越工程师。

1工程应用导向型的课程内容传统计算机视觉课程围绕marr理论框架展开教学,其中部分原理仅在理想状态或若干假设下成立,不能直接运用到工程实践中。近年来已具备工程应用基础的原理及方法,在传统课程内容中较少出现,如已在工业测量、视频监控、游戏娱乐等领域中应用的主动式三维数据获取方法等。我们对工程应用价值高的课程内容,增加课时,充分讲解其原理及算法,并进行工程实例分析;对工程应用价值较低内容,压缩课时,以介绍方法原理为主。例如,在教授3D信息获取部分时,课时主要投入到工程应用价值较大的内容,如立体视觉、运动恢复结构、基于结构光的3D信息获取等;而对于基于阴影的景物恢复等缺乏应用基础的内容主要介绍其基本原理,并引导学生进行其工程应用的可行性分析,培养学生缜密的思维习惯,训练学生辩证的分析能力。

2面向最新成果的课程定位计算机视觉近十年来发展迅速,新方法和新理论层出不穷,在现有课程体系中未能得以体现。跟进世界最新成果是卓越工程师的基本要求之一,因此计算机视觉课程定位应当面向国际最新成果。为实现这一目标,我们主要从以下两方面入手。

(1)选用涵盖最新成果的教材。我们在教学中加入国际最新科研成果及应用范例,在教材选取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作为参考教材。该书是RichardSzeliski教授在多年mit执教经验及微软多年计算机视觉领域工作经验基础上所著,涵盖计算机视觉领域的主要科研成果及应用范例,参考文献最新引用至2010年。这是目前最新的计算机视觉著作之一,条理清晰,深入浅出,特点在于对计算机视觉的基本原理介绍非常详尽,算法应用紧跟国际前沿。

(2)强化学生调研及自学能力。“授之以鱼”,不如“授之以渔”。在教授学生的同时,更重要的是培养学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。为强化学生的知识结构,培养学生跟踪国际前沿的能力,我们在教学中加入10%的课外学时,指导每位学生完成最近三年本领域的国际最新文献调研及工程应用新技术调研,并撰写相关调研论文。同时,设置2学时课内学时,让每位学生介绍调研成果,并进行课堂讨论。在调研基础上,选择相关算法进行了实验证明,进一步强化学习成果。实践证明,由于学生能够根据自己的兴趣,选择本领域感兴趣的课题进行深入调研,极大地调动了学生的积极性,强化了学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。

3工程实践化的教学形式我们在教学中提出工程实践化的教学形式,即以人类视觉功能为背景,由相应工程实例引出相关理论,并最终将理论运用到工程实例中的算法和方法传授给学生。

计算机视觉开发篇8

[关键词]电力系统自动化计算机技术监控

中图分类号:tK414.3+5文献标识码:tK文章编号:1009914X(2013)34037101

引文:

随着我国经济的不断发展,电力产业在经济发展中的地位越来越举足轻重,这就要求电网有更高的安全性能,对其可靠性的要求也变得更高。在电力的运行中,如果出现故障问题,不仅仅会有很大的安全隐患,同时还影响着居民正常的生产活动。

一、计算机技术在电力工程中的论述

随着电力系统的自动化发展,出现了大量无人值班的变电站,同时,变电站的信息量也越来越大,电力人员需要经过仔细的分析各种情况并且经过自动化的处理相关数据,才能够及时的发现突发状况,并且科学地解决问题。

如果没有自动化的计算机技术起着关键作用,这种复杂的系统对于电力人员来说无疑具有很高的工作强度,正因为计算机的先进技术,使得电力人员在解决工程问题时更加便利。

在一个完整的电力系统中,需要具备以下功能:数据的采集、处理、控制开关、协调和配合其他系统装置等。随着计算机技术在电力工程中的不断应用,逐渐形成了三种模式,分别是:集中式、分散式、分散和集中相结合的方式。其中,集中式的结构模式可以利用不同规格的计算机对的接口进行控制,有效的对变电站的开关量等数字信息进行集中采集、运算和处理,实现对微机的保护还有自动化的控制等功能。

二、计算机视觉技术在电力系统自动化中的应用

计算机的视觉技术是指,对采集的数据或者图像进行处理分析后,进行探讨的宏观与微观的视觉技术的探讨。在电力工程中,计算机的视觉功能技术主要应用到三个层面:实时监控地方的调度、对设备的运行进行负荷控制还有对电力系统的自动化控制和处理。在监控地方的调度里,计算机的视觉技术和中心调度的监控系统有相似之处,它们都是利用计算机和专业的图像处理设备对电力设备进行实时的调度,而对于设备的负荷运行的负荷控制,常常需要运用工频或者声频进行控制处理。到目前来说,还是需要人的视觉参与,并没有实现真正的自动化控制,对于电力系统自动化的监理是电力系统自动化的发展趋势,这个技术是运用计算机的科学技能来对电力的实时状态进行控制和数据处理,减少值班的人员消耗,实现真正意义上的自动化运行模式。它在以下领域运用得比较广泛。

1、在监测环节中。计算机的视觉技术主要是利用它的红外线图像识别的功能对电力工程设备进行实时监控,在电力设备上,一般会显示其表面的温度,这在一定的程度上可以反映出系统运行时的状态。同时,利用专业的图像采集装置对电力设备进行红外线成像拍摄,可以采集到设备运行时温度的实时状态。在这个基础上,计算机系统对采集到的图谱进行处理分析,与标准图谱进行参照比较,就可以实现对电力的在线监控。另一方面,当系统运行出现问题时,红外线的成像技术还能够检测故障的具体方位,为技术人员检修故障提供了很大的便利和支持。例如:断路器的触头出现接触不良的反应、输电线路变压器少油等故障都会使系统局部设备产生发热的现象。此时若采用传统的方式进行检修,就无法实时的掌握到电力设备的运行状况,只能在故障发生之后才能够检测到故障源的位置,确认之后才能够进行排除。所以计算机的视觉性能的广泛应用,首先是让检测的方式变得更加简单,高效;其次是,如果在设备的检测中,采集到的数据超出了标准范围的最大值或者最小值,这个时候,计算机检测系统将默认设备的这个环节已经出现故障,并作出相应的处理,使故障的定位更加精准,并且缩短了故障确认环节的耗时,提高了检测和系统运行的效率。

2、在无人值班和电力环境监控下,计算机视觉技术的应用。在无人值班的电力工程系统中,计算机网络系统和微波探测器等设备组成无人监视的系统,利用这个系统对变电站及其周边的环境进行实时的视频监测,然后采用差分图像等计算机的视觉技术对正在移动的物体进行判别,准确判断出该移动物体的自身属性,在出现紧急情况时,实时报警系统就会开始报警。根据实际经验表明,在合适的天气条件下,无人监视系统的准确识别率的水平较高,如果在工程系统周围有火情发生,红外线的图像识别技术可以对火势进行快速的辨别同时发出报警的指令。

3、计算机的视觉技术应用于电力工程的检测。随着我国经济社会的不断发展,人们的电力需求也日益的增长起来,所以必须大量的铺设电力线路。在线路铺设的过程中,需要工程人员仔细的研究电力线路的铺设路径,通常铺设的地理环境都较为复杂,这时就给线路巡检人员增加了很大的困难,在巡检的过程中效率低,存在着一定的盲区。如果采用计算机的视觉技术,这些问题就可以得到很好的解决。可以在电力系统中安装监控机器人,监控机器人中被安装了控制装置、传感器、线路检测装置还有无线的图像传输设备等装置。机器人在电力铺设的过程中能够对线路进行温度的辨别然后进行判断,从而完成线路铺设的检测工作,在很大的程度上能够减少恶劣的地理环境给工程人员带来的工作难度,从而提高人员的工作效率,增强故障检测的准确度。

4、计算机视觉技术在系统位置判断的应用。通过使用计算机视觉技术可以对电力工程系统的开关位置还有继电保护压板的位置进行检测。开关的刀闸存在着三种状态:闭合、断开还有异常的情况。如果开关刀闸处于的位置不恰当,就会影响到设备的正常运行,如果使用了计算机的视觉技术,就可以自动的识别开关刀闸的工作状态,当发现有不正常的运行状态时能够及时的进行报警。继电保护压板是根据电网或者变电站的运行轨迹的变化而变化的。需要值班人员对压板的位置进行严格仔细的确认和解决,保护压板的位置。如果位置不正确,则会对继电保护产生不利的影响,从而引发安全事故。在检测压板的方面,如果继电压板的信息不能明确的显示出来,传统的检测方式就很难对其进行检测,而采用计算机视觉技术可以有效的对压板盘面进行图像的采集,然后通过识别技术对其进行位置的准确判断。

结束语

在本文中,已经大量的介绍了计算机视觉自动化技术在电力工程的功能。此技术不但提高了电力系统的工作效率,同时也使电力工程的整体技术水平得到了提高,在电力系统的自动化过程中,计算机技术也因此得到了更加充分的利用,实现了运行管理的自动化和监测系统的自动化。

计算机视觉技术在可以弥补传统技术的缺陷,当电力工程自动化中遇到实际问题的时候,计算机的视觉技术得到了充分的肯定。随着电力系统的不断完善,复杂度也不断的在提高,所以在系统的维护方面也出现了更高的要求,计算机的视觉技术一定会成为电力工程中重要的科学技术,并且前景非常可观。

参考文献

[1]唐亮.电力系统计算机网络信息安全的防护[J].供用电,2010(27).

[2]卢文贤.电力系统计算机网络信息安全防护[J].信息与电脑,2012(05).

计算机视觉开发篇9

关键词:数字摄影测量计算机视觉多目立体视觉影像匹配

引言

摄影测量学是一门古老的学科,若从1839年摄影术的发明算起,摄影测量学已有170多年的历史,而被普遍认为摄影测量学真正起点的是1851―1859年“交会摄影测量”的提出。在这漫长的发展过程中,摄影测量学经历了模拟法、解析法和数字化三个阶段。模拟摄影测量和解析摄影测量分别是以立体摄影测量的发明和计算机的发明为标志,因此很大程度上,计算机的发展决定了摄影测量学的发展。在解析摄影测量中,计算机用于大规模的空中三角测量、区域网平差、数字测图,还用于计算共线方程,在解析测图仪中起着控制相片盘的实时运动,交会空间点位的作用。而出现在数字摄影测量阶段的数字摄影测量工作站(digital photogrammetry workstation,Dpw)就是一台计算机+各种功能的摄影测量软件。如果说从模拟摄影测量到解析摄影测量的发展是一次技术的进步,那么从解析摄影测量到数字摄影测量的发展则是一场技术的革命。数字摄影测量与模拟、解析摄影测量的最大区别在于:它处理的是数字影像而不再是模拟相片,更为重要的是它开始并将不断深入地利用计算机替代作业员的眼睛。[1-2]毫无疑问,摄影测量进入数字摄影测量时代已经与计算机视觉紧密联系在一起了[2]。

计算机视觉是一个相对年轻而又发展迅速的领域。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[3]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看做是计算机视觉的分支。

数字摄影测量的发展已经借鉴了许多计算机视觉的研究成果[4]。数字摄影测量发展导致了实时摄影测量的出现,所谓实时摄影测量是指利用多台CCD数字摄影机对目标进行影像获取,并直接输入计算机系统中,在实时软件的帮助下,立刻获得和提取需要的信息,并用来控制对目标的操作[1]。在立体观测的过程中,其主要利用计算机视觉方法实现计算机代替人眼。随着数码相机技术的发展和应用,数字近景摄影测量已经成为必然趋势。近景摄影测量是利用近距离摄影取得的影像信息,研究物体大小形状和时空位置的一门新技术,它是一种基于数字信息和数字影像技术的数据获取手段。量测型的计算机视觉与数字近景摄影测量的学科交叉将会在计算机视觉中形成一个新的分支――摄影测量的计算机视觉,但是它不应仅仅局限于地学信息[2]。

1. 计算机视觉与数字摄影测量的差异

1.1 目的不同导致二者的坐标系和基本公式不同

摄影测量的基本任务是严格建立相片获取瞬间所存在的像点与对应物点之间的几何关系,最终实现利用摄影片上的影像信息测制各种比例尺地形图,建立地形数据库,为各种地理信息系统建立或更新提供基础数据。因此,它是在测绘领域内发展起来的一门学科。

而计算机视觉领域的突出特点是其多样性与不完善性。计算机视觉的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息,因此直到计算机的性能提高到足以处理大规模数据时它才得到正式的关注和发展,而这些发展往往起源于其他不同领域的需要。比如在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用计算机来替代人工视觉。

由于摄影测量是测绘地形图的重要手段之一,为了测绘某一地区而摄影的所有影像,必须建立统一的坐标系。而计算机视觉是研究怎样用计算机模拟人的眼睛,因此它是以眼睛(摄影机中心)与光轴构成的坐标系为准。因此,摄影测量与计算机视觉目的不同,导致它们对物体与影像之间关系的描述也不同。

1.2 二者处理流程不同

2. 可用于数字摄影测量领域的计算机视觉理论――立体视觉

2.1 立体视觉

立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分[5]。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。

2.2 影像匹配

立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。

在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。

2.3 多目立体视觉

根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性[5]。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度[2]。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。

计算机视觉开发篇10

 

关键词:视觉 艺术网络 虚拟现实

艺术活动反应时代的现象,且在各种意义上,艺术与时代革新或改造的根本精神,有着密切的关系。在艺术创作的过程中,感情的自发形成占了大部分,但在有些状态下理性的计划性成分亦占有相当的比例,尤其在新媒体、新美学观念、新素材及新的科学技术高度发展的今天,以理性为诉求的创作灵感,已占有绝对的重要性及审美价值。

科技的革新,从计算机、网络到虚拟现实,在艺术创作上产生极大的变化,具有实验精神的先驱艺术家们热衷于新媒体与材料与新艺术形式的探求,从十九世纪末到今天,其中发生了难以计数的艺术运动,一部新媒体艺术史,几乎就是一部近代科技史,而我们仍然活在其中,变化日新月异,很难去归纳风格,或下任何定论。到目前为止,网络艺术、包括虚拟实境的交互式装置,似乎是互动艺术的主流。科学的发明与发现,大量地运用在改善人类生活上,不过是近五十年的事,却带给人类前所未有的便捷与刺激。改变的不仅是物质的层面,在精神上的意义也相当深远。

尤其是60年代末70年代初,当电子媒体与计算机科技开始普及之时,媒体深深影响我们对世界的认知,人们视野变宽了,世界变小了。当时,艺术、科技与科学间的关系常受争议。艺术与科技运动吸引许多艺术家、科学家、工程师以及业者参与,意图发展出跨领域的合作架构,然而时至今日,这种系统化的合作模式,仍然只是一个理想。因为科技、艺术都是文化有机整体的一部分,原本就不容分割。

运用科技的视觉艺术,一个明显的议题便是科技带来的艺术品复制性与真实性的问题,一切展演都只是以复制品呈现,要观赏者破除原有的观赏习惯,在传统上的艺术价值包含了独创性、唯一性、与真实性,都将被重新思考。

数字化科技成熟后,讲求光与速度,去物质化的虚拟影像透过媒体四处传播,复制已经不再是模仿、替代真实或是真实的幻觉,数字世界已然成为另外一种真实。因为影像可被转换为数字语言,可被任意操弄,因而影像成为一种信息,于是艺术行为也大大不同于前,艺术家在庞杂的影像信息中,选择、过滤、重新组装,不只是利用技术来解决视觉问题,开发新的视觉经验,更利用新媒体去呈现人们生活中的种种困境,作品意义的产生存在于事件的脉络还有与观赏者的互动中。观赏者从最早的被

动接受,到目前已然成为参与者,甚而是展演内容的提供者。以往视觉艺术的形式,可大分为平面的绘画与立体的雕刻,而影像的领域今后将与前述二者并列为视觉艺术的重要形式之一。未来随着计算机图像处理,多媒体、高画质等新媒体技术的高度发展,传统的录像技术也将面临新的整合。

十九世纪八十年代以后高科技产品发展迅速,计算机、雷射光线、传真机、复印机、卫星传播等。这些尖端科学技术,都成为创造想象和架构的创作工具,这些新的媒介能仿真真实世界,也能创造出幻想境界中的奇景。高科技艺术是十九世纪八十年代以后,兴起于美国的新艺术。它是泛指以运用高科技创造的现代美术作品,诸如计算机艺术、雷射光艺术等作品,在美学领域中带来明显意义,结合了人类智能和科技产生的大量新颖技巧。潜藏在这种深具潜力的新视觉技巧下,有一个更深入的意义:在高科技的辅助下,视野更加瞭阔,并为艺术创作,提供了新的美学向度,跳跃连结代替线性思考,多向度空间取代绘画透视,前所未有互动性功能。

尤其是,自从计算机出现以后,因为可以储存、修改,容易重新绘制及复制,所有有关绘画的行为起了很大的改变。1952年美国的BenF.Laposky利用计算机做出一个抽象的图像,1956年才开始能创作出彩色的电子影像,1960年德国K.alsleben及w.Fetter发表最早的计算机绘图作品,直至1994年网际网络开始盛行,四、五十年间,人们对于空间的思考模式随之改变,我们离开了复杂而趋向一个快速沟通、大纲式了解的理想。我们不再需要画一堆很复杂辅助线去处理放置一个三维物体于二维平面上的问题,计算机影像帮我们解决了这些问题。因此,艺术家已把兴趣放在如何避免复杂的建构,因为人们想象的空间已经改变,波浪的、拥挤的西方绘画已被纯粹的、无限空间的现代绘画所取代。

计算机对现代艺术造成的冲击及影响之巨,超乎想象。计算机一般被认为是一个空间可视化的简单辅助工具,但它不只是一件工具,一种媒体和材料,更重要的是一种新的美学方向,新的再现可能。多数计算机艺术的创作者,深信虽然计算机本来不是为艺术创作的理由而发明,但它会持续发展出特有的本质,继续为艺术家提供最好的工作伙伴。

通常,计算机比传统铅笔的方式更简单、便宜、快速地生产,计算机让艺术家与音乐创作者更快速的生产,这也就是我为什们称之为“罐头艺术”的原因,然后,计算机也可提供一种艺术替代品更快速的方法,这也是我为什么称其为“麦当劳艺术”。当然,计算机艺术有它的隐忧。虽然计算机为艺术带来发展的新契机,却也有不少令人不安的地方。

第一:由于计算机也是科技的产物,自然有现代和传统的冲突,如何把过去的传统艺术,配合新的计算机媒材,加以融合表现出来,呈现附合时代的新风貌而被接受,是值的深思的问题。因为全世界都是用相同的软件和设备,如果一窝蜂的跟着主流,则艺术创作则会划地自限,而显露大量复制和类似的肤浅平面感,失去艺术的美感和深度。第二:如同前面提到的,工具的方便,却造成个人风格的丧失,并且

失去敏锐度,因为一旦创作者习于依赖计算机的修改功能,创作的动力则渐渐退去,例如:惯用pHotoSHop的摄影者很可能因此,不在意拍照的决定性时刻,因为可以透过计算机仿真修改,不怕拍不好,但即使效果逼真,却失去艺术价值了。