简述文化的基本特征十篇

发布时间:2024-04-25 19:17:44

简述文化的基本特征篇1

学习者在认知过程中,对当前的认识通过过滤、选择、抽象等方式,进行整理归类、精确简约、协同组织,建构出一个科学规范的图式,并随之形成良好的记忆.当学习者需要对当前的知识状态作出解释时,图式就会被激活,形成相应的预测和推理,同时可产生触类旁通的学习迁移作用.物理学认知内容具有高度的抽象性、严密的逻辑性和丰富的组织性,学好物理需要获得规范的认知图式.

1物理模型图式的表征

物理模型是对物理客体或事项的一种抽象化、理想化的反映,力求准确地体现物理研究指向的主要内容,是对客观对象的一种简明近似反映.物理模型分为实物模型、状态模型、过程模型.学习者通过对物理模型中的概念、规律等典型特征信息及相应关系进行科学规范化的认知,便可建构出一种关于物理模型知识的有序组织结构,从而形成稳定的心理表征,获得一个相应的规范图式.

实物模型与自然实体相对应,其图式属于自然范畴图式.自然范畴图式表征对象是自然实体的属性,如物体、静电场等自然界实体范畴的知识点的集合,可表征出相应的自然范畴图式;自然范畴也指由人类文化所造就的一些客观实在范畴,如点电荷、单摆等经过科学抽象简化出的物理实在.自然范畴图式可用槽(属性)与值(内涵)的表征方式来建构.槽与值的一组配对,可以构成某一范畴相应图式的其中之一特征.若干组槽与值的配对构成图式的主要典型特征,通过对各元素(槽与值)的线性排序,可构成有组织的知识结构.槽可理解为自然客体或事项的属性名称,“值”是对“槽”的内涵的具体说明.如单摆图式可用槽与值的结构表征(见表1).

实物模型是对具体客观实体的物理简化,主要关注客观实体在结构方面的物理主旨信息的提取.实物模型图式的物理教学策略以模型的结构特征为主线,以与反映结构特征相关的物理量为认知对象,达到组建简洁明确的模型图式为目的.图式建构的设计程序为:列出若干个典型的研究实体对象――研究各单个实体结构――进行信息加工提炼――确定信息表征的图式内容――组成实物模型的图式结构.例如单摆模型图式,首先要对各类具有单摆特征的同类自然对象进行归类抽象,得到简化的模型图示,列出其若干典型的共有特征,将各知识要点相互关联、组织集合,形成如表1所示的科学的单摆图式.

本图式共选取了九个知识点作为图式的要素,并给出了九个槽(属性)的简洁名称,同时前八个槽采用命题的形式给出了对应的物理内涵,表象这个槽则是用图示的方式展现出来.按物理内涵相近进行线性排序,共分出三个组块,各组块中的槽顺序在逻辑上关联递进,便于学习者记忆,同时也使知识的关联组织有序化,易于理解和学习迁移.模型构成要素反映了单摆装置的实体特点,运动特征要素则反映了单摆运动学与动力学的特点.将表象要素纳入图式,可使学生在处理问题过种中能在大脑中浮现出单摆的简洁图象,可从中联想解读出单摆各个知识要点内容.

物理状态模型、过程模型一般是关于物理特征的综合内容结论式描述,其图式可采用汇聚图式来表征.汇聚图式要求将内容的主题汇聚成有组织的简明知识结构,从而使认知者能获得一个明确的认知图式.汇聚图式的结构与自然范畴图式类同,建构方法也相近,但其认知对象是结论式的内容.后面提到的物理量、物理定律和结论性的内容等也常用汇聚图式来表征,另有详述.关于状态与过程模型的汇聚图式建构方法,在此不再讨论.

2物理量图式的表征

一些有关测量与计量的国际组织联合制定的《国际通用计量学基本术语》(1993)书中,将物理量定义为:物理量是物理现象、物体或物质的可以定性区别和定量确定的属性.因此物理量既有质的限定性,又有量的规定性.在物理教学中为了认知上的方便,又将物理量归类为可测性的物理概念.

物理量定义式具有测量上的操作性,其量度方法及定量关系能进一步揭示物理实在的内在本质.学习物理量主要关注其测度的数学表征方式和物理本质内涵要点的主旨信息提取.“物理学是研究物质的最基本、最普遍的运动形式和相互作用以及物质的基本结构的科学.”据此可将物理量分为物质性质量(简称物性量)、运动状态量、运动过程量和物质作用量四大类.物理量是人类在从事科学文化活动过程的产物,是一种结论式的文本,其内容的主题汇聚成有组织的简明知识结构,可采用汇聚图式的结构来表征物理量.

物理量的定义具有严密的科学规范性,其形成方式与内容可概括为:引入目的、基本定义及其来源、符号表征,测量规范,量度单位及其换算等六个部分.其中引入目的反映了该物理量所属的研究范畴和方向,为物理量类别的判断提供了依据;测量规范为物理量确定了科学的量度方法.此外物理量的数学表征有标量、矢量之分.依据上述分析可设计出物理量图式的基本结构,按数学结构、物理内涵和表象的顺序则进行线性排序,综合调整得到物理量图式“槽”的要素集合,即符号表征、测量定义、度量单位、数学性质、物理定义、物理意义等六个结构要素.

这些要素只是物理量图式的共有“属性”要素,对于不同类别的物理量,除了上述共同的属性要素之外,还应有它们独有的能够反映其特点的属性要素.描述物性的物理量一般由物质自性决定,其图式的“槽”应加上“物理特性”项.物质运动状态量与运动过程量在时域上分别对应时刻和时间区域,都存在“时间特性”的表征.故二者的图式“槽”项应外加“时间特性”要素.物质作用量与相互作用机制相关,其图式“槽”项需增加“作用机制”要素.有时为了使物理量的内涵能形象地表征出来,常采用图示的方法来说明,所以还要加上图示表象要素.

建构物理量图式应注意,其一“槽”名称的选取要准确典型,“值”是对“槽”的内涵的说明,其表述务必简洁明了;其二线性排序的逻辑顺序要规范明确,实行分块组合,块间层次分明,块内各要素存在递进关联;其三图式在整体上使物理知识形成科学规范的组织结构,各图式间也可形成有机联系.下面以电场强度为例,给出其汇聚图式的具体内容和表征形式.此图式将槽的要素分成了三个组块,按物理上的逻辑关系与意涵关联递进的方式进行线性排序,其中数学表征组块反映电场强度的量的规定性要点;物理表征组块显示其质的限定性内涵;表象组块可将电场强度的抽象表达直观形象化.

整个图式通过槽与值对应内涵的简明解释,实现了电场强度认知的系统化、组织化和有序化,有利于学生对电场强度的记忆、理解及运用!

按照上述方式,可以建构出其它类型的物理量图式,也可以对那些不能量化的物理概念建立相应的物理图式.

3物理规律图式的表征

物理规律是物质相互作用和有关物理现象、过程在一定条件下发生发展的必然趋势及内在的本质联系,其表示方式可分为物理原理、定律、定理及结论等.物理基本规律一般侧重于用数学公式来表示,有些也运用命题的形式来阐明,即物理规律的在表征形式上有两种――命题式与数学式,命题式表示方式是以言语来综合陈述,如伽利略相对性原理、牛顿第一定律和安培定则等;数学式表示方式是运用若于个物理量之间的因果关系来组织成精确的数学公式,如牛顿第二定律、动能定理和匀变速直线运动的推论等.,物理规律的内涵抽象深刻,逻辑严密,内容要点的因果关系密切相关,表征形式简洁明了,在整体上可组织成一种协同有序的知识结构.物理规律的表征形式是典型的科学文化活动的内容,其图式可采用汇聚图式的结构来表征.命题式与数学式的物理规律对应的图式在结构上既有相似性也存在差异性,需要依据具体对象的特征来设计建构.认知物理规律主要关注其原创发现过程所采用的思想、方法的主要特点及其物理结论的关系表述和内涵的主旨信息提取.本文以数学式的物理定律为例来建构图式,其它形式的物理规律图式可仿此来设计.

数学式的物理定律的研究及形成要涉用到如下内容:建立模型,选取实验或观察对象,确立寻找定律的方法,确定因果物理量,得到因果关系,给出数学表征,进行相应的物理解释.据此可选取物理模型、有代表性的实验对象、实验方法、适用范围、数学公式、物理内涵、实例解读、表象实例等九个要点,组构出物理定律图式的基本结构.按照这一建构的策略,我们建构出牛顿第二定律的认知图式如表3所示.

此图式分成了三个组块,第一组块将物理定律的实验考察要点提炼出来,槽的要素顺序依照实验操作的先后过程排序,符合认知规律;第二组块对物理定律的数学显示与物理解释的精致化说明,按照思维的认知顺序排列,符合物理逻辑关联特点;第三组选取得三个典型的物理运动,将牛顿第二定律的物理内涵形象化地表现出来,使抽象的内涵形象化.总体而是对“槽”与“值”的提炼遵循精准简明、科学规范的原则,知识要点的集合符合组织化与有序化及形象化的要求,达到深化理解和灵活运用的目的.

按照上述方式,可以建构出其它类型的数学式物理规律图式,也可以对那些命题式的物理规律建立相应的物理图式,只要对图式的基本要素作恰当的修改即可.

4结语

在图式理论中关于事件图式和文本图式也有详细的论述,其特点也可以方便地用于教学.事件图式是人对所从事的文化活动按先后次序所做的有组织的认识,其认知对象为自然或社会中发生的事件.该图式对于某一事件要从中分解、概括出具有个性特征的各项活动,用命题的形式表征关键信息,按活动先后来组织排序,形成规范图式.如物理实验过程就可以按照时间先后建构成一个操作简明的事件图式.文本图式的认知对象为各种体裁的文本,建构图式要求将各段文本内容特征点进行提炼,对关键信息实行分块组织排序,形成规范的文本图式.如教师的教学设计规范格式就可用文本图式来编排.

简述文化的基本特征篇2

1图像特征表示方法概述

设计图像的特征表示是计算机视觉中一项非常基本的研究内容,图像的分类、检索、标注等工作都是以提取图像特征为初始步骤,好的特征表示可以在相关图像分析中取得更佳的效果.因此,图像特征的设计与构造,直接影响算法的性能.而如何定义一个好的图像特征却是非常困难的:一方面,设计的图像特征对于同一类别下图像之间的变化(比如尺度、光照变化、对象位置变化等)要有足够的鲁棒性;另一方面,设计的图像特征要具备足够的判别性来处理不同类别间图像的变化.近年来,研究者提出了大量的底层特征用于各种图像分析任务,其中最具有代表性的是基于梯度朝向直方图的SiFt(scale-invariantfeaturetransform)[1]和HoG(histogramoforientedgradient)[2].尽管这类特征取得了一定意义的成功,但研究者发现,这类单一的底层特征并不足以在某些应用上达到更好的效果,因此提出了一类中间层的图像特征表示方法.其中,Bow(bagofwords)[3]是这类图像特征表示方法的典型代表,该方法在场景分类中获得了较好的性能.Bow算法生成图像特征表示分为3个过程:图像底层特征的获取、学习过完备字典和计算图像的码字直方图表示.然而,Bow方式并没有考虑特征向量在图像空间上的位置关系,使得其特征描述能力并没有达到最大化.为了弥补这一缺陷,空间金字塔匹配(spatialpyramidmatching,简称Spm)[4]方法通过在一幅图像的不同层次上计算码字直方图,形成了一个Bow多层特征,将Bow模型与图像空间进行合理融合.然而,由于Spm方法利用直方图交核函数来度量两幅图像间的相似度,导致无法产生低维度的图像特征表示,而且需要完整计算训练集图像间相似度的Gram矩阵,因此,其算法复杂度为o(n2)(其中,n为训练集中图像的个数).为了解决这一问题,有效匹配核算法(efficientmatchkernel,简称emK)[5]在码字间相似性的基础上构造了一个低维特征映射空间,整个图像的特征可以表示为码字映射在这个低维特征空间后的平均,且可以采用线性SVm方法训练分类器,在图像分类应用中获得了非常不错的效果.然而,有效匹配核算法仍然依赖于人为定义的图像局部特征(如SiFt或HoG),只不过是通过计算有限维空间的局部线性特征表示来推出整体图像的线性特征.

Bo等人扩展了有效匹配核算法并提出了核描述子(kerneldescriptor,简称KD)[6]方法.这种方法只需定义任意两个局部图像块之间的相似性,且该相似性函数满足核函数定义.由于每个核函数都隐性定义了一个映射,它将图像块映射为再生核希尔伯特空间(reproducingkernelHilbertspace,简称RKHS)中一个非常高维的向量,这样,核函数可以表示为RKHS中两个高维向量的内积,通过核主成分分析(kernelprincipalcomponentanalysis,简称KpCa)[7]算法,可以由核函数推出图像块特征的有限维线性表示.这种低维空间中的表示就称为核描述子,并且采用emK算法将其推广到整个图像的特征表示.尽管核描述子方法的设计思想较为新颖,但仍然存在计算复杂度过高这一缺陷,限制了其在大规模图像数据库上的应用.事实上,在KpCa方法的离线阶段,所有联合基向量对之间的相似性都需要计算,这是非常耗时的.更重要的是:在线阶段计算一个新图像块的特征映射时,该图像块与所有联合基向量之间的相似性也是需要计算的,而这实际上是不需要的.Xie等人[8]通过使用不完整Cholesky分解替代KpCa算法,成功地解决了这个问题,并且通过迭代,应用不完整Cholesky分解算法表示整个图像特征[9].但文献[8,9]中,通过不完整Cholesky分解得到的标志联合基向量并没有对应实际的图像块,因此,其产生的特征判别能力并没有最大化地得到利用.

wang等人提出了有监督的核描述子方法[10],该方法利用训练集中的图像类标来辅助设计底层图像块特征.尽管他们利用该特征取得了不错的分类效果,但这个算法运行过程中需要大量有类标的图像,并且对象优化函数求解过程复杂,时间复杂度过高.除了上述生成图像底层特征表示的方法以外,另外一类构成图像特征的方法基于深度学习理论.2006年,Hinton等人[11,12]提出了用于深度信任网络(deepbeliefnetwork,简称DBn)的无监督学习算法,DBn的多层结构,使得它能够学习得到层次化的特征表示,实现自动特征抽象,文献[12]将DBn模型成功用于手写数字识别应用上.Bengio等人在文献[13]中提出了基于自编码器(auto-encoder)[14]的深度学习网络,在手写数字识别图像数据库上得到了类似的实验结果.另外,文献[1517]提出了一系列基于稀疏编码的深层学习网络,在图像应用中取得了一定的成功.LeCun等人用误差梯度设计并训练卷积神经网络(convolutionalneuralnetwork,简称Cnn),其在图像分类,特别是手写体字符识别应用中得到优越的性能.在此基础上,Krizhevsky等人[21]将Cnn模型应用到分类大规模imagenet图像数据库,更加充分地显示了深度学习模型的表达能力.尽管在深度学习模型下获得的图像特征有很强的判别表示能力,但其要求计算机硬件条件较高,单机环境下很难实现.除此之外,更加详细地介绍图像特征描述子领域的综述可以参考文献[23].本文在大数据时代背景下,为了能够快速得到图像块的线性特征表示,提出了有效图像块描述子(efficientpatch-leveldescriptor,简称epLd)方法.该方法在不完整Cholesky分解基础上,可以自动地进行图像块筛选,对于求解新图像块的线性特征表示,只需计算它和一小部分基图像块的相似性就足够了.有了图像块的特征表示之后,一幅图像就对应着一个图像块特征的集合,该集合可以看作是特征空间中基于某个分布的样本集,这样,两幅图像之间的差异可以看作两个分布的距离.本文采用基于高维概率分布的mmD距离[24]进行估算,进而计算两幅图像间的相似性.本文首先介绍核描述子方法,然后给出有效图像块描述子算法的具体实现过程以及如何利用mmD距离计算两幅图像的相似性,并在几个著名的图像分类数据库上进行实验,最后给出工作的结论和展望.

2核描述子方法简介

核描述子方法是对图像像素点属性(梯度/形状/颜色+位置)基础上生成的联合基向量应用KpCa方法,从而计算新图像块的有限维特征表示.为了方便叙述,本文采用像素点的梯度属性来介绍核描述子方法.通过公式(2)可以看到,核描述子方法的主要缺陷有以下3点:(1)算法计算复杂度高,因为需要对dodp维的联合基向量形成的Gram矩阵计算特征值分解,如果联合基向量的维度过高或者个数过多,KpCa算法甚至无法实施;(2)对联合基向量进行KpCa获得的tij并不是稀疏的,这也就意味着在计算新图像块的特征表示时,需要和所有的联合基向量进行在线计算,所以算法需要存储全部的联合基向量;(3)算法无法进行特征选择,即,并不知道联合基向量中哪些样本最具代表性.

3有效图像块描述子算法

针对核描述子方法的3点不足之处,文献[8]解决了其主要缺陷的第一、第二两点,但是文献[8]在本质上仍然使用联合基向量,所以没有明确地进行特征选择,即,找出哪些图像块是最具代表性的,使得其特征表示能力并没有达到最大化.为了更加完善地解决核描述子方法的缺陷,本文提出了一种新的图像块特征表示方法,称为有效图像块描述子.该方法基于对图像块相似度矩阵执行不完整Cholesky分解。总体上来说,有效图像块描述子算法由两部分构成:1)首先从训练图像集中均匀抽取足够的图像块,然后在这些图像块形成的Gram矩阵上执行不完整Cholesky分解算法.如果设定n代表图像块的个数,m代表分解后矩阵的秩,通常情况下,m<

3.1Gram矩阵的低秩近似半正定的Gram矩阵K可以分解为GGt,所以不完整Cholesky分解的目标就是找到一个矩阵G,其大小为nm,使得tGG在m足够小的情况下近似K.在执行不完整Cholesky分解算法的过程中,选择出m个最具代表性的基图像块,利用所有图像块和这m个基图像块之间的相似性,可以近似恢复Gram矩阵K.这里,m的值是可以通过算法在线确定的,由算法中提前给定的近似精度参数来控制.关于不完整Cholesky分解的详细执行过程可以参考文献[26],其中,作为输入参数的Gram矩阵K实际上是按需计算的,即,算法执行过程中需要用到哪两个训练图像块间的相似度,就按照公式(1)计算得到.算法执行后,就得到了一些具有代表性的基图像块,用向量p保存基图像块的索引序号,同时得到了矩阵G,使得.tGGK

3.2构造图像块特征映射算法一旦获得了nm的矩阵G,新图像块的特征(有效图像块描述子)就可以由G构造.其中,新图像块特征维度大小由m确定,每一维度i的值可由新图像块与p(i)所指示的基图像块间相似性K(newpatch,p(i))恢复得到。通过算法1可以看到:选择出的m个最具代表性的基图像块可以看成是一系列局部图像块的非线性滤波器,将每个新图像块和这些基图像块进行相似性度量的过程,也可看成是对这个新图像块进行特征提取的过程.另外,针对图像块相似度矩阵执行不完整Cholesky分解往往可以保证获得精度非常高的低秩近似,且分解过程中只与某些训练样本(图像块)有关.也就是说,利用这些训练样本就可以很好地近似恢复相似度矩阵,所以训练集中的图像块具有不同程度的重要性.因此,我们称重要性最高的前m个图像块为“最具代表性”的基图像块.为了更加形象地展示这些重要的基图像块,我们在Scene-15图像库上提取了最重要的前16个基图像块,如图1所示(每个图像块由其像素点的梯度幅值来表示).可以看到,每个图像块都包含了丰富的边缘和纹理信息.本文提出的有效图像块描述子算法不只继承了文献[8]的有效性,而且很好地解决了核描述子算法中的第3点缺陷,最大限度地发挥了图像块特征的判别能力.

4利用mmD距离计算图像间的相似性

基于算法1,每一个图像块都可以用有效图像块描述子来表示.一幅图像通过稠密采样确定很多关键点,每一个关键点都对应着一个局部的图像块,因此,一幅图像就对应着一个局部特征的集合.假定图像i1包含m个图像块,则其特征集合可以表示为Fp(patchp1,patchp2,…,patchpm),图像i2包含n个图像块,其特征集合表示为Fq(patchq1,patchq2,…,patchqn).Fp可以看作特征空间中来自分布p的一个样本集,同样,Fq也可以看作是来自分布q的样本集.这样,图像i1与i2之间的差异性就可以由p和q两个分布的距离表示.当然,这两个概率分布之间的距离只能通过这两个样本集进行估算.为此,本文采用基于高维概率分布的maximummeanDiscrepancy(mmD)距离[24]进行估算.mmD距离可以看作是将两个概率分布,通过非线性核函数映射到再生核希尔伯特空间(RKHS)后均值的距离.对于上述分布p和q的mmD距离估计可由公式(3)计算。单纯地利用公式(3),并没有考虑局部特征在整幅图像上的空间分布信息.为了解决这个问题,本文首先采用空间金字塔方法将整幅图像进行逐层划分;然后,在两幅图像每个层次对应的小图像上计算它们之间的mmD距离;最终,将所有层次的mmD距离按照其对应层次的权重进行汇总求和,然后度量两幅图像i1与i2之间的差异性.

5实验

本文使用像素点的梯度、形状和颜色属性分别构造基于梯度的有效图像块描述子(epLd-G)、基于形状的有效图像块描述子(epLd-S)和基于颜色的有效图像块描述子(epLd-C).为了测试有效图像块描述子算法的性能,分别在3个著名的图像分类数据库(Scene-15,Caltech-101[28]和UiUC-8[29])上做了实验.在接下来的实验中,计算3个不同类型的有效图像块描述子都是首先将图像按照固定比率缩放到不超过300300像素点;特别地,在计算epLd-G和epLd-S时,将缩放后的图像中的像素点的灰度值标准化为[0,1]范围.图像块通过每隔8个像素点的稠密采样方式从训练集图像中进行抽取,大小为1616像素点.epLd-all是将epLd-G,epLd-S和epLd-C这3个描述子串接起来形成的.训练线性SVm分类器使用LiBLineaR[30],其中,图像间的相似性利用mmD距离来定义.在计算mmD时,将图像按照11,22和33分为3个层次来汇总求和,尺度参数在不同的数据库上利用交叉验证方法确定.所有的实验均重复10次,每次的训练集和测试集都随机抽取确定,将10次分类准确率的平均值和方差记录下来.实验中的其他参数从公平比较的角度考虑,与文献[6,8]设置相同.

5.1Scene-15Scene-15场景数据库包含4485张图片,这些图片分属15个类别,有室内场景和室外场景,每一个类别包含200张~400张图片不等.按照惯例,从每个类别中随机抽取100张图片作为训练,剩余图片作为测试.在算法中设置pivots的个数为200,即,利用不完整Cholesky分解选出200个最具代表性的基图像块来构造维度为200的有效图像块描述子.实验结果列在表1中(其中,KD代表核描述子方法[6],eKD代表有效核描述子方法[8],epLd代表本文提出的有效图像块描述子方法),epLd方法获得在这个数据库上的最佳分类准确率(87.0%).另外,epLd方法在所有4种不同情况(梯度、形状、颜色和上述3种属性的汇总)下的性能均超过了文献[6,8].在实验中,除了测试分类准确率来体现epLd的判别能力,还通过不同维度下测试分类准确率来体现epLd的有效性.我们发现,在特征维度只有50维的情况下也获得了接近最优分类准确率的性能,这充分体现出epLd算法的有效性和健壮性.事实上,通过表2可以看到:特征维度从50维增加到300维,分类准确率并没有得到明显的提升.造成这一现象的原因是,不完整Cholesky分解容易获得高质量的低秩近似.表2中的数据表明:即使是50维的低秩近似也足以体现Gram矩阵中的关键信息,而这些关键信息直接决定了分类的性能.在后面的实验中,从算法效率的角度考虑都使用了100维的特征表示.

5.2Caltech-101Caltech-101图像数据库包含9144张图片.这9144张图片隶属于101个对象类别外加一个背景类别,每个类别中的图片在31张~800张不等.表3中,将epLd与其他有代表性的描述子算法进行了对比.同样根据惯例,每个类别随机挑出30张图片进行训练,从剩余图片中挑选不超过50张进行测试.可以看到:epLd算法达到了最佳的分类准确率(77.1%),甚至在仅仅使用梯度属性的情况下(epLd-G)也达到了非常不错的分类效果(73.7%).

5.3UiUC-8UiUC-8图像数据库包含1579张图片,这1579张图片隶属于8个运动类别,每个类别下包含图片137张~250张不等.按照惯例,随机从每个类别中抽取70张图片进行训练,从剩余图片中挑选60张进行测试.分类准确率结果列于表4中.通过表4可以看到,epLd-all非常接近最佳分类准确率(87.2%vs.87.23%).在实验部分的最后,本文对比了构造3种不同描述子(epLdvs.KDvs.eKD)的计算效率.其中,最耗时的是形状特征,一幅标准图像(最大300300分辨率,图像块大小为1616像素点,图像块间隔8个像素点)上的epLd-S与eKD-S描述子在matlab环境下计算需要耗时2s,而KD-S需要耗时2.5s.对于梯度特征,epLd-G与eKD-G描述子耗时0.9s,KD-G耗时1s.以上对比结果列在表5中.表5中的对比结果是在生成100维特征情况下得到的,如果提高特征的维度,epLd与eKD的计算效率提升相对于KD会表现得更加明显.另外一点需要指出的是:epLd与eKD的计算耗时虽然基本相同,但epLd描述子的特征判别能力相对于eKD描述子要强很多,这一点通过在3个图像数据库上的实验对比结果可以得到印证.所以,综合考虑,epLd描述子无论在计算效率还是在判别能力上都要优于eKD和KD描述子.

6结束语

简述文化的基本特征篇3

关键词:特征矩阵;数字识别;图像处理;识别率

中图分类号:tp312文献标识码:a文章编号文章编号:16727800(2014)001005903

作者简介作者简介:徐敬(1989-),女,北方民族大学电信学院硕士研究生,研究方向为嵌入式与信息处理;刘炜(1963-),男,北方民族大学电信学院副教授、硕士生导师,研究方向为智能仪器。

0引言

数字识别技术是图像处理领域中的一个研究热点,在食品、化妆品、药品等外包装生产日期提取上具有重要的实用价值。近年来,随着人们对数字图像识别算法的不断研究,数字图像识别方法也越来越多,主要有基于神经网络数字图像识别[1]、基于最小距离法的数字图像识别,以及基于模板匹配的数字图像识别[2]。在实际应用中,人们发现数字识别算法的识别率一般较低,个别识别率较高的算法比较复杂,且收敛速度普遍较慢,缺少两方面性能皆优的方法。针对目前存在的问题,结合印刷体数字的特点,笔者提出了一种基于特征矩阵的高效数字图像识别算法。该算法首先在预处理的基础上提取字符

的特征矩阵,

利用特征矩阵对简单的特征[34](横线)进行提取,然后应用结构语句识别方法将数字中的多数识别出来。再采用排除法缩小识别数字的范围,并对其中的数字特征凹陷区域进行分析和比较,同时采用上述同样的方法对数字进行识别使算法简单,识别速度快且识别效果好。

1数字图像预处理

图像预处理是对采集到的图像画面在进行数字识别之前所做的一些相关工作,主要包括图像灰度化、二值化、梯度锐化、中值滤波、分割、归一化、细化等步骤,具体流程如图1所示。对图像进行预处理非常必要,它能够有效地去除图像噪声,减小各类干扰对图像识别的不利影响,为特征提取和识别奠定了基础。图像预处理的每一步结果如图2-图9所示。

图1数字预处理流程

图2原始图像图3灰度化图4二值化

图5梯度锐化图6中值滤波图7分割

图8归一化图9细化

2数字识别算法

经过细化之后,通过从上到下,从左到右对图像进行扫描,提取字符的特征矩阵。由于细化后矩阵的边界可能存在全为0的行或列,为了便于后续特征提取,需要将其全为0的行列全部删除,得到类似如图10所示的矩阵,记为juzhen[m][n]。设前景像素为1,背景像素为0。

对0~9这10个印刷体数字,首先可以根据是否存在横线将数字分为两个子集,其中1、2、4、5、7存在横线记H=1。0、3、6、8、9不存在横线记H=0。在H=1的集合中,因为横线存在的位置不同,可以将其再分为3个子集:1、2存在下横线;5、7存在上横线;4横线位置记为其它。这样数字识别的范围又进一步缩小了,接下来可以在小范围内进行特征比较来实现数字的识别。如5、7特征比较发现,5上半部分存在左凹陷区,下半部分存在右凹陷区。对于凹陷区域的识别可以依据矩阵在凹陷区域内像素值为0,限定区域范围统计0的行数即可,该区域范围仅针对每个特定数字而言,这样5就可以识别出来,运用排除法7自然而然也被识别出来。1、2特征比较发现,1存在竖线,2没有这个特征,4不需进行特征比较即可得出结果,为了使识别结果更加准确,可以加上竖线这个特征。在H=0的集合中,0的结构较简单,特征也较明显,把它作为一个集合来对待。它是一个封闭的圆圈,圆圈内没有像素则通过矩阵在一个较大区域内像素1的个数小于阈值的范围来提取。3、8、6、9作为另一个集合,特征比较发现,3上、下两部都存在右凹陷区,6上半部分存在左凹陷区,9下半部分存在右凹陷,除此之外就是8。这10个数字中的1较特殊,有的字体底部没有横线,有的底部存在横线,所以除了上述判断还要考虑没有横线的情况。数字识别流程如图11所示,其中上半部分左凹陷区域记为上左,上半部分右凹陷区记为上右,下半部分右凹陷区域记为下右,下半部分左凹陷区域记为下左。识别顺序按照从上到下、从左到右进行。对于易识别错误的字符进行了多处特征比较,如字符3、5等。数字特征提取条件如表1所示,特征的提取需要用到以下自定义函数:

3实验结果与分析

在上述数字图像预处理基础上,利用上述识别算法对图像进行数字识别,结果保存在文本文件中,图像识别的结果如图12所示。

图12数字识别结果

为了检验本文的算法对数字识别的效果,对0~9这10个印刷体数字包括不同字体在内的单个字符各100幅图像进行识别测试,测试硬件环境为amDathlon1.91GHz、内存2GB,采用C语言,并结合数字图像处理和计算机软件平台openCV,在VC6.0集成开发环境中实现

以上算法编程。单个字符可在6ms内完成整个识别过程,

实验结果如表2所示。识别率等于99%的0、1两个数字

本身结构比较简单,容易识别;识别率在98%的有3、5、6、9这4个数字,只要能够限制准确数字凹陷区的起始行、起始列、结束行和结束列,数字识别率还可以提高;图像数字2、8的识别率分别建立在3、5和6、9的识别率的基础之上,所以数字2、8的识别率比3、5和6、9的识别率要低一些;数字图像4、7在细化后容易对字符造成损害,再加上特征提取的条件较为简单,因此,很容易识别为1和8。

4结语

本文提出了一种基于特征矩阵的高效数字识别算法,并对从0~9的每个数字字符图像进行了测试。结果表明,该算法的思路简单、速度快,且识别率达97%以上。通过分析发现,使用该方法发生误判时,错误源可能来自于图像的不规范,比如图像本身的不完整、预处理技术的缺陷,以及特征选取的局限性。

参考文献参考文献:

[1]张翼成,陈欣,杨红军,等.基于组合特征的Bp神经网络数字识别方法[J].计算机系统应用,2013,22(3):113116.

[2]陈爱斌,陆丽娜.基于多特征的印刷体数字识别[J].计算技术与自动化,2011,30(3):105108.

简述文化的基本特征篇4

关键词:局部二值模式;特征提取;主成分分析;降维;识别率

中图分类号:tp391文献标识码:a文章编号:1009-3044(2017)17-0173-02

1概述

人脸识别,是对人的脸部特征信息进行身份识别的一种生物识别技术,它的应用前景十分广泛。如视频监控、公安、司法和刑侦等安全领域。人脸识别的关键是如何提取出合适的信息来识别人脸。在过去的几十年里,相关的研究者们提出了许多有关于特征提取的算法。基于几何特征的方法、线性鉴别分析法、特征脸方法和神经网络方法等能很好地将人脸的形状、纹理等信息描述出来,但是这些方法很难处理维数过高的图像,且容易受到光照等客观因素的影响。近几年,基于局部的方法越来越受到研究者的欢迎,这是由于基于局部的方法不但能解决数据维数过高的问题,而且对光照和表情等具有不变性。

局部二值模式(LocalBinarypattern,简称LBp)是一种很有效的纹理描述算子。LBp算法最初是被用于纹理描述中的,由于其计算简单、特征分类能力强等特点而被用于人脸识别中。该算法首先计算图像中每个点与其邻域点在灰度上的二值关系;然后,对二值关系按照某种规则形成局部二值模式;最后使用得到的特征向量来描述图像的特征。但是局部二值模式在计算LBp算子时会产生大量的噪声信息,计算时又由于特征向量维数过大而使得计算量变大,影响识别效率。

基于以上问题,本文提出了一种改进的LBp算法并结合主成分分析方法(principalComponentanalysis,简称pCa)降维来描述和识别人脸信息。首先,将图像中的每个点和与其相邻邻域点的灰度值相加;然后将计算结果与其相邻的计算结果比较;再将比较的结果按一定规则形成局部二值模式;最后用pCa算法处理得到的特征向量,对人脸进行分类识别。

通过oRL人脸库实验验证,与原始的LBp算法相比,改进后的算法对人脸图像具有更好的表示和判别能力。

2基于改进的LBp和pCa算法的人脸识别

2.1LBp算法

LBp是一种用来描述图像局部纹理特征的算子;它拥有旋转不变性以及灰度不变性等优点。它是首先由t.ojala,m.pi-etikainen和D.Harwood在1994年提出,用于纹理特征提取。后来由于其独特的优势,被用于人脸识别。

2.1.1LBp特征的描述

原始的LBp算子是定义在九宫格里的,中间点的像素值叫做阈值,将其余8个相邻邻域点的像素值和阈值比较,如果相邻邻域点的像素值大于或等于阈值,那么这个像素点的值记做1,否则记做0。九宫格里的8个邻域点经过与阈值相比,得到的结果按某种顺序排列,可以得到一个8位的二进制数,再将二进制值转化成十进制,就得到了九宫格中心像素点的LBp值(共有256种),并用这个数值表示该区域周边的灰度情况。如图1所示:

循环遍v整张图像的每个像素点,即可得到该图像的所有LBp值,即该人脸的特征向量,并对特征向量进行模式转换,最后计算每个LBp特征之间的距离。

2.1.2改进的LBp算法

LBp算法虽然简单有效,但是仍然有一定的局限性。算法只与中心像素点和各邻域点灰度值的大小有关,并没有考虑到各相邻的邻域点间的灰度相关性。针对该问题,本文提出了一个新的改进的LBp算法:比较邻域点时不仅仅只依赖阈值点,而是将邻域点与自己相邻的下一个邻域点来较。具体实现如图2所示。

该算法使用原始图像的中心点和它周围各个邻域点相加;再将各邻域点得到的值按一定顺序与其相邻邻域点的值比较;然后进行二值化处理。这样既保证了其与中心像素点的关系,又体现了其与相邻像素点间的联系,能更好地反映该点的灰度情况。

2.2pCa算法

主成分分析(pCa)方法是目前应用十分广泛的一种代数特征提取的方法,是一种基于变量协方差矩阵处理、压缩和抽提样本中数据的有效方法。

主成分分析的原理是借助某个特殊的特征向量矩阵U,将一个高维的矩阵x投影到一个低维的特征向量空间中,称作低维向量y,且损失了一些不重要的数据。即借助低维的向量y和特征向量矩阵U,就能够大致模拟出所对应的原始高维的矩阵x。

2.3结合pCa的LBp人脸识别过程

LBp算法虽然能很好地表示人脸信息,但是特征维度过高,计算难度较大,而pCa算法可以降低特征维度。因此,本文针对这一问题,提出了结合pCa的LBp人脸识别算法。具体实现过程如图3所示。

主要过程包括:1)计算图像的LBp描述子,统计出各图像的LBp直方图,并将每个图像的LBp直方图特征转换成一维向量;2)将得到的LBp直方图向量利用pCa算法做降维处理,得到人脸图像的特征表达;3)用得到的人脸特征表达和数据库中的人脸依次比较,计算识别的正确率。

3实验结果与分析

本文采用oRL人脸数据库对原始的LBp算法和改进后的LBp算法进行比较验证。oRL人脸库共有40个人脸。每个人脸有10幅图像,一共由400张灰度图像构成,图像的尺寸是92×112像素。其中每张人脸的表情和细节都有一定的变化,例如笑和不笑、睁眼和闭眼,戴和不戴眼镜等,人脸的姿态也有一些变化,它的深度旋转和平面旋转可以达到20度,人脸的大小也有至多10%的变化。

本实验将oRL人脸数据库中的图像分为训练样本和测试样本,实验改变训练样本数目(从2张到9张),其余的作为测试样本,比较改进前后LBp算法的识别情况。实验结果如图4所示。

由实验结果图4可知,改进后的LBp算法较改进前的算法,在识别率上明显有所提高,随着训练样本数目的增加,识别率也显著增高。这主要是改进后的算法,结合了点与相邻邻域点之间的关系,使用了pCa降维处理,降低了特征向量维度,且去除了特征向量的冗余,提高了计算效率,能更准确的描述图像的像素值。

简述文化的基本特征篇5

关键词:设问类型;成因;评价;突破方法

结合近年来简答题的设问,一般有以下四种类型:特征描述、成因分析、规律概括与总结、评价与判断,使一些学生感到难以理解和掌握,我根据设问类型不同,寻求不同的突破方法。

一、特征描述和突破方法

1.区域地理特征的描述,要从地理位置(经纬度位置、海陆位置、相对位置)、自然环境特征(地形、气候、植被、水文、土壤)、社会经济特征(农业、工业、贸易、旅游、交通、城市、人口)等方面筛选描述。例如解答2011年全国卷1的36题,黄麻产区的气候特征、地形特征、水文条件。

2.地形(地貌)特征,要从从地形种类(高原、山地、丘陵、平原、盆地、山谷或河谷、冲积扇、三角洲),地面起伏状况(坡度陡缓、相对高差),海拔高度、地势四个方面概括。

3.气候特征的描述:首先要明确气候类型,再从气温、降水入手,分冬夏两季进行概括。从气温(高低的季节变化、年较差),降水(年降水量的多少、季节变化),四季的变化(冬夏季节的长短)等方面概括。

4.对河流特征的描述:河流特征可分为水文特征和水系特征。水文特征包括:水位、流量、汛期、含沙量、结冰期、有无凌汛、水能。水系特征包括:河流长短、流向、流域面积、支流数量及其形态;河网密度;落差或峡谷分布及流速大小。如以松花江为例,描述水文特征,并分析原因。

5.工农业生产特征,要从农业地域类型、农作物种类和单位面积产量、农业各部门结构(所占比重)、农业机械化水平、农业生产经营方式和专门化水平等方面概括。

从工业的发达程度、工业部门结构、工业技术水平、工业产品的销售和工业原料能源对国际市场的依赖程度等方面概括。

二、成因分析和突破方法

1.自然地理事象成因的分析,要分析气候的影响因素,位置,洋流,河流,自然灾害的原因。

2.人文地理事象(区位因素)成因的分析,要从自然和社会经济和技术三方面来答。其中经济因素包括原料、燃料、市场、交通、劳动力、技术等;社会因素包括国防、政策、个人偏好、工业惯性等;环境因素包括与风向、水源等;自然因素包括土地、水源,再者影响工业的区位的主要因素是社会经济因素,技术因素包括技术的进步对人文事象的区位变化有重大影响。转贴于

三、规律的概括总结和突破方法

要从地理分布规律,地理演变规律,地理结构规律,人地关系规律等分析。例如地图地球知识、大气、人口知识,这是高中地理主干知识,在此不用多说。

四、评价类分析和突破方法

简述文化的基本特征篇6

关键词:给力;给;最简方案

中图分类号:H08文献标识码:a文章编号:1009-0118(2013)01-0381-02

“给力”无疑是2010年中国网络流行语中最炙手可热的词语。它的出现为“给”字带来了丰富的内涵。

一、传统语义描述

从传统语法的语义描述看,“给”有四种句式:

S1:ns+V+给+n’+n

S2:ns+V+n+给+n’

S3:ns+给+n’+V+n

S4:ns+V+n’+n

ns代表充任主语的体词性成分,n’和n代表充任宾语的体词性成分,V代表动词,S4是S1的简化形式。在动词表述上就形成了三类不同的动词:Va表示给予,Vb表示取得,Vc表示制作。“给力”作为Va的延伸,在保留动词意思的基础上,在词类上,已经转化为形容词。

1a.这游戏真无聊,不给力呀!

1b.要给力啊,后面靠你了。

在1a中,“给力”作形容词用,表示“精彩”,对应fantastic,cool,awesome,powerful,wonderful之类。而1b中的“给力”仍然是动词表示empower和givingpower之类。

除了可以做动词外,“给”还可以作介词,相当于for,by或者to,如2a,2b和2c;作语气助词,如2d;以及形容词和副词,如2e和2f。

2a.为给人类带来利益而工作。

2b.屋子里给弄得乱七八糟。

2c.给这儿灌水。

2d.裤腿都叫露水给湿透了。

2e.镇国家,抚百姓,给馈饷。——《史记·高祖本纪》

2f.富必给贫,壮必给老。——《邓析子》

二、最简方案

面对纷繁复杂的语义描述,乔姆斯基的最简方案提供了全新的分析视角。

最简方案从管辖约束理论的调整发展而来。原则与参数体系下的管辖与约束(GovernmentandBinding)理论有悖于乔姆斯基历来提倡的语言理论简洁雅致(simplicityandelegance)观,众多的参数导致结构描写SD(symbolicobjects)的困难。

语言的运用系统也可以分为两类:说听部分(articular-perceptual,a-p)和“概念—意图部分”(conceptual-intentional)。语言的表达式必须有与它们有关的指令。相应地我们就有两个接口层面(interfacelevels):a—p和C—i。语言的认知系统正是通过它们与运用系统发生关系的。a—p层面通常被当作pF(表达式),C—i被看成是LF(逻辑式)。

乔姆斯基将原来管辖约束理论运算过程中的深层结构D结构和表层结构S结构以及逻辑层面LF和语音层面pF这两个接口层面简化为三个表征系统(S结构、pF、LF),取消原有的两个基本结构,即深层结构和表层结构,并且将移动的驱动力定位为特征核查(featurechecking),尤其是他把推导运算的经济性(economy)摆在极其重要的位置。并设定了延迟原则(procrastinate)、自利(Greed)、最短距离移动(Shortestmove)、无奈原则(LastResort)等几个经济原则。

Leech(1983)从语言使用的角度出发,认为在信息交流时应该尽量减少交际双方在编码和解码时所花费的时间和精力,所以要对文本尽量简缩。

在最简框架中,乔姆斯基明确核心功能语类CFCs只包括C,t和v。且这三个核心功能语类都有一致性特征(n-feature);对于t和v而言,一致性特征必须得到满足。在最简方案中,推导式中的t、v、aGR之类的功能节点不包含词库中调取的词项,这些位置不是插入屈折词缀之处,屈折词缀全部附加在词项上,t之类的功能语类仅携带形态(屈折)特征,用于核查Dp、V的特征。

在最简方案的新框架里,Chomsky引进了语段的概念。所谓语段就是句法实体(syntacticobject),它可以是轻动词短语vp,也可以是导句词短语Cp。语段的中心词触发合并、一致和移动操作,而操作按语段依次自下而上逐个进行。非诠释性特征是操作的动因。特征核查就是特征匹配(featurematching),即在每个语段上将非诠释性特征通过核查逐一消除,否则语段推导失败;所有语段上的所有非诠释性特征全部消除,句子推导成功。

三、最简方案下的“给力”

通过例子转换,我们可以将S1,S2,S3和S4看作:

3a.张三送给李四苹果。

3b.张三送苹果给李四。

3c.张三给李四送苹果。

3d.张三送李四苹果。

如果加入“给力”,则:

3e.﹡张三送给力李四。

3f.张三给力送李四。

3g.张三给力李四。

3h.张三给李四送力。

通过运算,如图1所示,3a和3h基本运算形式一致;图2为3b运算形式。

3e运算的不合法在于“给力”的词库特征将“给”字在保留[+动作],两个主目和两个语义角色的基础上,从三价谓词降格为二价谓词。3f中的“送”在“给力”的干扰下通过核查,只与“李四”发生一致,李四作为兼语,省略了谓词“走”“离开”等。

3g的句式与4a“张三支持李四”相同。其推导为:

基于以上分析,“给力”的出现为汉语“给”字带来了新的词库特征,通过运算,形成了新的句式表达S5,为:

S5:ns+给力+n

另外S6:n+pRo+给力也随着“给力”的形容词性质而很容易推断。同时,语段推导的可靠性遵循了经济原则,造成“给力”密不可分。

四、结语

自然语言的丰富性和创造力在形式推导中可以按照最方案简化,通过词库特征调整而赋予新的句式,但是推导中的核查机制起着非常重要的作用。“给力”的新词新意创造了汉语中新的动词“给”字句S5和形容词性句式S6。“给力”的密不可分正式在经济原则的驱动下,说明语段移动的可靠性。乔姆斯基的最简方案扬弃了原来的管辖约束参数,为语言的数理描述提供了新的理论框架。

参考文献:

[1]戴曼纯.最简方案框架下的句法新理论[J].外国语言文学,2007,(2):73-79.

简述文化的基本特征篇7

关键词:数学形态学;机械领域;图像处理

鉴于数学形态学的主要优点:计算简单,并行快速,一般只包含布尔运算、加减法运算而不需要做先进乘法,便于硬件实现;可以应用于简化图像数据,保持基本的形状特性,并除去不相干的结构。因此在计算机文字识别,图像编码压缩,工业检测,机器人视觉等诸多领域取得了非常可观的应用。

1数学形态学的特点

(1)它反映一幅图像中像素点之间的逻辑关系,而不仅为简单的数值关系;

(2)它是一种非线性的图像处理方法,具有不可逆性;

(3)它能够并行实现;

(4)它能够用来描述和定义图像的各种集合参数和特征。

针对正在大力推进的工业4.0计划的要求:提升制造业的智能化水平,建立具有适应性、资源效率及人因工程学的智慧工厂。其技术基础是网络实体系统及物联网。因此数学形态学在机械行业的应用前景非常乐观,目前已经应用的领域有机械信号处理,机械故障诊断,机器视觉等诸多领域。

数学形态学处理方法特殊,尽管在最终结果方面与其他处理方式有相同之处,可以用来增强输入的某种特征来减弱其他特征,但在理论基础和处理过程方面,存在着差异。数学工具不同于常用的频域和空域方法,形态学是以积分集合及随机集论为基础,积分几何有利于几何参数间接测量,随机集论适合描述书信号或图像随机性质。普通信号、图像的处理变换存在集合特性的扭曲,通过合适的形态运算和结构元素进行处理,能保留信号或图像的形态信息。

数学形态学的基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。它的基本运算包含4个:膨胀(或扩张)、腐蚀(或侵蚀)、开启和闭合,它们在二值图像和灰度图像中各有特点。本文只针对数学形态学在机械方向的应用展开探讨。

在机械信号处理方面,数学形态学基本运算可以进行详细有效的图像处理分析。(1)骨架化。骨架化广泛应用于图像识别以及数据压缩方向,是二值目标的重要拓扑描述。在综合比较形态学与中轴变幻的优缺点时,形态学骨架综合性更好一些,缺点是产生的骨架并非连续的,对比中轴变换计算量太大的缺点要好一些。(2)波峰、波谷检测。此处用到的原理为数学形态学中顶帽变换(top-Hattransform),实现了对波峰或波谷的检测。(3)边缘检测。图像处理中一般情况下认为局部极值点或灰度发生剧烈变化的点即为边缘点。数学形态学利用形态学梯度可进行边缘检测,在增强边缘的同时可以抑制噪声。

在机械故障诊断方面,传统的信号处理方法应用于故障信号分析存在诸多弊端,核心需求在于机械故障非线性非平稳信号的处理。数学形态学是一种非线性滤波方法,运算简单、快速,具有明确的物理意义。因而被应用与诸多图像处理当中。(1)滚动轴承故障信号处理,自适应提升形态小波降噪对滚动轴承故障信号进行处理,构造出无需抽样的形态非抽样小波。实现对滚动轴承故障机理分析,以及故障的固有信号特点和特征频率判别。(2)采用多尺度多结构元素的数学形态学分析方法对齿轮和转子时频图像进行处理,检测出齿轮振动源,以及实现齿轮故障振动响应及调节机理。并且通过信号拟合来判别齿轮典型的故障信号特征。(3)数学形态学与GG(Gath-Geva)模糊聚类相结合的旋转机械故障诊断方法,通过对滚动轴承信号的多尺度形态运算得到信号的形态谱,定量反映了信号在不同尺度下的形态变化特征。为进一步对滚动轴承信号进行故障识别奠定基础。

在机械视觉方面,对机械作业对象进行图像采集,利用颜色特征在RGB颜色空间完成图像分割,利用数学形态学完成图像滤波。数学图像处理技术由于其独特的非线性特点在图像增强与图像领域中占有较大的实用空间。数学形态数学形态学是一种特殊的图像处理技术,它的描述语言是集合论,它设计了一整套基于集合运算的概念和方法,提供了统一而强大的工具来处理图像。其中基于集合的观点是极其重要的。它通过研究图像中对象的几何特征等来描述图像中各个研究对象的特征和对象之间的相互关系。数学形态学进行图像处理的基本思想是用结构元素对原图像进行位移、交、并等运算,然后输出处理后的图像。

2数学形态学处理图像的一般步骤

(1)提出所要描述的物体的几何结构模式(提取物体的几何结构特征);

(2)选择相应的结构元素,元素应简单而且对该模式最具有表现力;

(3)用选定的结构元素对图像进行形态变换,得到比原始图像更显著突出研究对象特征信息的图像。若赋予相应变量,则可得到对结构模式的描述;

(4)用经过形态变换的图像提取所需要的信息。

数学形态学在图像处理方面具有直观上的简明性和数学上的严谨性,能定量描述和分析图像的几何结构。因此,非常适合图像处理各方面的应用。可进行并行处理,大大加快了图像处理的速度,为实时识别和处理图像奠定了基础。如何改善形态运算的通用性,使其可以应用到更加广阔的图像处理领域,充分利用数学形态学的图像处理与分析方法,是数学形态学今后的必经之路。

参考文献

[1]沈路.数学形态学在机械故障诊断中的应用研究

简述文化的基本特征篇8

关键词SiFt尺度空间图像匹配特征描述符

中图分类号:tp39文献标识码:a

ResearchontheSimplifiedSiFtFeaturematchingalgorithm

YinLihua[1],CHenYong[1],YanGYuping[2]

([1]ChongqingnormalUniversity,Chongqing401331;

[2]ChongqingCollegeofelectronicengineering,Chongqing401331)

abstractForSiFtalgorithm,forthematchingproblemoftheclassicdescriptorsforfeaturedimensionistoohighandleadtoreducedefficiency,thispaperpresentsasimplifiedSiFtfeaturematchingalgorithm,thefirstoftheoperatordimensionalityreductiontoimprovethespeed,thenusetwo-waymatchingtoeliminateerrorstogetherwiththealgorithmtoensuretheaccuracyofexperimentsandachievedgoodresults,verifythefeasibilityofthemethod.

KeywordsSiFt;scalespace;imagematching;featuredescriptors

0引言

图像匹配是同一场景在两个不同视点下的图像之间的对应关系,是虚拟现实、计算机视觉等研究领域的一个热点,也是计算机视觉应用,如深度恢复、摄像机标定、运动分析以及三维重构等研究的基本问题。①总结起来,图像匹配算法大致分为:基于面积的方法、②基于比值的方法③等,但这些算法有着共同的缺点。本文提出一种简化的SiFt算法,通过减少特征描述符的维数来降低计算的复杂度,并采用双向匹配增强匹配的精度。

1SiFt算法研究

SiFt(scaleinvariantfeaturetransform,即尺度不变特征变换)算法是DavidG.Lowe于1999年提出,2004年进行了总结和完善的特征匹配算法,SiFt特征匹配算法共分为如下五个步骤:

1.1尺度空间的形成。

Koendetink等人证明了高斯卷积核是实现尺度变换的惟一线性核,因此,一幅二维图像的尺度空间可定义为:

()=()*()(1)

式中:L为尺度空间,()为空间坐标,则为尺度因子。的值越小表示图像越清晰,越大则表示图像越模糊。为了提高尺度空间中被检测关键点的稳定性,采用了高斯差分尺度空间()。定义为两相邻尺度的高斯核差分,公式如下:

()=[()()]*()=()-()(2)

1.2空间极值点的检测

在中,为确保在尺度空间及二维图像空间都能检测到极值点,每一个像素点(最顶层和最底层像素点除外)要和其上下两层各9个及同层8个相邻点进行比较。并通过拟和三维二次函数来精确确定特征点的尺度和位置,同时去除对比度低的特征点和不稳定的边缘特征点,以增强图像匹配的稳定性、提高抗噪声能力。

1.3特征点方向分配

为使算子具备旋转不变性,统计特征点邻域像素的梯度方向直方图,以确定每个特征点的方向参数。

1.4特征点描述器的生成

为了增强算子的抗噪能力,每个特征点选用16个种子点来描述,而每个种子点又有8个方向的向量信息,因此,每个特征点就能形成16共128维的SiFt特征向量。

1.5特征匹配

SiFt算法选用欧式距离作为特征点的相似性度量函数,设定一个阈值,当距离小于这个阈值时就接受这一对匹配点。

2简化的SiFt算法研究

2.1简化算法的匹配步骤

经典算法中,第三步的计算时间在整个算法中占了70%多,大大地降低了算法的速度,影响了实时性。为了改善这一状况,将第二、三步合并,并在对特征点进行描述时,把原来的128维向量降为现在的12维向量。匹配步骤如下:

2.1.1初步特征点的检测(方法同原算法)

2.1.2形成特征向量

(1)以初步检测到的特征点为中心采用圆形窗体来确定需要统计的领域范围,选取圆形窗口半径为4.5s,在该窗体内统计12个梯度方向。

(2)归一化这12个梯度方向,以保证算子的光照不变性。用表示特征向量,即=,归一化后得到:

(3)

(3)为保证算子的旋转不变性,查找最大的梯度方向统计量。向左循环移动整个向量序列,直至梯度方向统计量最大的元素移动到序列的第一个元素。

2.1.3特征匹配

为保证算法的精度,采用双向匹配。即第一次匹配完后,记录下成功匹配的坐标对,然后交换匹配对的坐标位置,再匹配一次,如果这两次匹配得到的坐标对是一样的,就接受这一对匹配点。

2.2维数设定

简化算法中最重要的一步就是圆形窗口中维数n的设定,实验结果表明,当<12时,匹配效率随着维数的增加呈指数级增加;反之,当>12时,匹配效率却随着维数的增加反而下降。由此可得,当=12时,匹配效率最高,=12即为所需确定的维数。对于匹配效率,定义为:

匹配效率=(4)

3仿真实验及结果

为了验证算法,在CpU为intelCorei32.20GHz,内存为2G的pC机上采用matlab7.8软件平台进行实验。为了证明算法对物体旋转、遮挡和光照的鲁棒性,在设计场景的时候将物体任意摆放,在不同的光照条件下进行实验,部分效果及结果如图表所示,其中图1(a)为SiFt算法匹配图像,图1(b)为简化SiFt算法匹配图像,表1为两种算法匹配对比结果。

4结论

总之,本文研究了经典SiFt算法,并分析了算法的优势及其局限性,从匹配速度上加以了改进。首先利用圆形窗口本身的旋转不变特性对算法进行降维,从原来的128维降为12维;其次采用双向匹配提高匹配的精度,去除可能存在的不明显误匹配。将匹配结果同原SiFt算法进行了比较,试验结果表明本文改进算法比原SiFt算法在速度上有了很大的提高,同时在一定程度上也保证了精度。

注释

①孔晓东,屈磊,桂国富等.基于极约束和边缘点检测的图像密集匹配[J].计算机工程,2004(20):178-179.

简述文化的基本特征篇9

论文关键词:世博展馆简介,功能文体学,情景语境,主题意义,文体特征

 

1.引言

2010上海世博会是“探讨人类城市生活的盛会”,也是“人类文明的一次精彩对话”(expo2010.cn/zlzx/gk/index.htm)。200多个国家和国际组织建馆参展,展示各自的城市文明进程、交流城市发展经验。为让参观者更好地了解各展馆文化、特色,“2010上海世博会官方网站”(expo2010.cn/)对各展馆配备了英文简介。研究发现,这些英文简介具有鲜明的文体特征,本文将对此展开文体分析。

传统的文体分析唯“语言变异”是宗,而近年来,文体学家开始在多个层面上展开了研究,注意各种语言功能是如何相互作用来构成文体特征的。本文试图打破传统文体学中的“文体分析”等同于“变异分析”的观点,以功能文体学理论为指导,从情景语境和主题意义的角度文体特征,对上海世博展馆英文简介进行文体分析;并探讨情景语境和主题意义对语篇语言选择和语言表现形式等文体特征的影响。

2.功能文体学

功能文体学是以Halliday的系统功能语法理论为基础的文体学理论(张德禄,2005)。韩礼德认为语言有三种“元功能”:概念功能、人际功能和语篇功能。语篇功能把人际功能和概念功能根据情景语境统一在一个语篇中构成整体。

“情景语境”是由语场,基调和语式三个部分组成的概念框架(Halliday,1985)。语场指发生了什么事、所发生的社会活动的性质、参与者所从事的活动等中国期刊全文数据库。基调指谁是参与者、参与者的特点、性质、地位和角色、参与者之间的关系。语式指语言在情景中所起的作用,语篇的符号组织方式及其在情景中的地位和功能(张德禄,1998)。

“主题意义”是作者通过文本的全部语言要素和表现形式所表达的思想。Halliday指出,文体分析的目标之一是展示语篇的意义是如何表达的;而且“一个突出的特征只有与语篇的整体意义相关才能前景化”(Halliday,1971)。文体学家申丹也指出,语言“只要它对表达文本的主题意义作出了贡献,就是真正的前景化”(申丹,2002)。可见,功能文体学通过主题意义映照“前景化”的文体特征。

Halliday还提出“语言各层次之间呈现出体现的关系,语言形式只有被上一层所促动或者说对上一层有所体现时,才有文体意义”(引自刘扬,2005,70-72)。情景语境是语篇的最高层,“语篇是在情景语境的制约下通过对意义的选择生成的”(张德禄,1998)。因此,功能文体学中,文体特征是语言通过元功能的作用,在情景语境的制约和促动下,对主题意义的选择表达而形成的。

3.展馆英文简介的功能文体分析与解读

3.1情景语境

功能文体学认为,所有的语言或表达形式的选择都是有意义的文体特征,具有文体特征,而文体特征受情景语境的制约和促动,那么情景语境是怎样制约和促动这些英文简介的的文体特征的呢?

情景语境这一概念包括语场、基调和语式。上海世博展馆英文简介语场比较固定,即介绍各馆建构、文化、特色,展示城市文明、交流和探讨城市发展道路,吸引游客参观。基于这一语场,各展馆简介中大量使用“pavilion”、“presentzone”、“exposhowcase”、“exhibition”、“structure”、“architecture”、“design”等与“展馆”概念密切相关的名词和“feature”、“display”、“express”、“represent”、“stage”、“showcase”、“beexhibited”、“makeitsappearance”等表达“展览活动”这一概念的动词和动词词组,以及“visit”、“travel”、“enjoy”、“explore”等表达“游览”概念的动词。语场决定了这些语言的选择,反过来这些语言通过概念功能的作用对这一语场活动进行了很好地表达。

基调反映的是角色关系问题。这些英文简介是上海世博向世界各地的游客宣传推介各展馆,因此有两层角色关系:一是世博组织者向游客介绍各展馆,吸引游客参观;二是世博组织者描述各展馆建构、文化、理念、特色。这些角色关系通过语言的人际功能得以表达,在词汇语法层由语气、情态系统等来体现。分析发现,这些简介中的语句基本都是陈述肯定的语气;而且,文中还有大量“词汇情态”词语,如“distinctive”、“unique”、“great”、“famous”、“modern”、“spectacular”、“sophisticated”、“better”、“best”、“human-friendly”、“funandrelaxed”等,暗示出作者对展馆的推介和对游客的劝诱。

语式指语言在情景中所起的作用,是语篇的符号组织方式。在上海世博情境下,各展馆英文简介语篇具有正式、书面文体的特点,除第一部分“基本信息”以简明扼要的短语呈现外,第二和第三部分文本几乎都是陈述句的形式,且多用正式完整的语句(主要是长句和复杂句),逻辑严密、清晰。此外,文本几乎一致使用现在时;且常用到“定语从句”等各种从句和不定式、动名词、分词等非谓语动词文体特征,句子与句子之间衔接紧密连贯,条理清晰。如,委内瑞拉馆“Highlight1”只有三句话,却包含了90个单词,且都是长而复杂的语句,运用了非谓语动词词组“reproducingthestyleofanumberofethnicresidences”和“optingtorepresentthem”、定语从句“thathasthrivedintherainforestsofSouthamericaforthousandsofyears”、倒装句“norhasitignoredthelifeexperiencesof…”等表达形式,使文体具有庄重、紧凑,逻辑清晰的特点。

3.2主题意义

功能文体学对文本文体特征的分析不仅以“情景语境”为参考,也和“主题意义”紧密相关中国期刊全文数据库。语言“只要它对表达文本的主题意义作出了贡献,就是真正的前景化”(申丹,2002)。

上海世博会的主题是“城市,让生活更美好(BetterCity,BetterLife.)”,副主题是“城市多元文化的融合、城市经济的繁荣、城市科技的创新、城市社区的重塑、城市和乡村的互动”(expo2010.cn/zlzx/indexn.htm)。在这些英文简介中,语言的选择和运用很好地阐释、突出了上海世博主题,对表达主题意义作出了贡献;语言前景化,形成了独特的文体特征。

首先,如简介的第一部分“基本信息”中“theme”一项:

中国馆:theme:ChinesewisdominUrbanDevelopment

肯尼亚馆:theme:CitiesofDiscoveriesandHarmony

委内瑞拉馆:theme:aBetterLife,aBetterCity

信息通讯馆:theme:informationandCommunication-extendingCityDreams

分析可见,各馆关键词组的形式出现,在文本中“前景化”,形成了鲜明的特色。

此外,在简介的第二、三部分“展馆特色”和“亮点”中文体特征,作者尤其注意语言的选择和表达,使其贡献于文本的主题意义,形成了很强的的文本特征。统计分析发现,文本中选用了大量紧扣“主题意义”的名词或名词性词组及其近义词或上下义词:city(urbanarea)、human、nature(landscape、deserts、rainforests)、citylife(urbanliving)、culture(wisdom)、economy、technology(skill、cutting-edgetechnologies)、environment(globalwarming、watersourceprotection)development、diversity、harmony、sustainability、energy、innovation、friendship等,阐述“主题意义”的形容词:sustainable、harmonious、environmentally-friendly、solar、human-friendly、energy-saving、water-purification、low-carbon、intelligent等,以及“主题意义”促动下的其他相关词汇。如日本馆“Highlight1”中词语“friendship”表达了国家之间的友谊、合作及和谐相处的意义,“modernenergysavingandwaterpurificationtechnologies”体现城市发展中的科技创新,而“watersourceprotection,globalwarmingandtheagingproblem”则表现了城市发展中的问题。

所有这些词语的大量选用很好地表达了文本的主题意义“城市让生活更美好——城市多元文化的融合、城市经济的繁荣、城市科技的创新、城市社区的重塑和城市和乡村的互动”;反过来,在文本主题意义的控架下,这些语言及表达形式“前景化”,构成突现了上海世博情境下展馆英文简介鲜明的文体特征。

4.结语

上海世博展馆英文简介在上海世博这一特殊情境和主题下应运而生,具有独特的文体特征。本文借鉴功能文体学理论,从情景语境和主题意义的角度,对其进行了文体分析;并探讨了情景语境和主题意义对语篇语言选择和语言表现形式等文体特征的影响。但本文只是从近两百篇上海世博展馆英文简介中随机抽取部分作为研究文本进行探讨性分析,更为系统深入的研究仍有待进行。

[参考文献]

[1]Halliday,m.a.K.anintroductiontoFunctionalGrammar[m].London:edwardarnold,1985.

[2]Halliday,m.a.K.Linguisticfunctionandliterarystyle:aninquiryintothelanguageofwilliamGolding’stheinheritors[a].inChatman,S.(ed).LiteraryStyle:aSymposium[C].oxford:oUp,1971.

[3]刘扬.试论功能文体学中的主题意义[J].淮海工学院学报,2005,4.

[4]申丹.功能文体学再思考[J].外语教学与研究,2002,3.

[5]张德禄.功能文体学[m].山东教育出版社,1998.

[6]张德禄.语言的功能与文体[m].北京高等教育出版社,2005.

简述文化的基本特征篇10

关键词:蒙古族;长调;综述

中图分类号:J607 文献标识码:a

蒙古族的长调,是蒙古族特有的歌曲,其旋律特征有二:一、无固定节拍、节奏循环规律,气息宽广,悠扬辽阔,演唱时节奏和速度十分自由。旋律中的装饰性细节难以纪录。虽然可以发现各句之间的内在结构规律,但要找到方正结构是较难的事。二、在旋律进行中,长音和密集节奏的华彩性短句之问的对比,以及用密集的同音反复来构成的颤动着的长音。其具有特有的演唱方法――即下颚颤音和喉颤音。男声演唱时常用下颚颤音,女声演唱时常用喉颤音。掌握其演唱风格与技术难度较大。长调民歌是蒙古族传统音乐中最典型和最有代表性的形式。自古以来“习为歌唱”。歌悠悠、声悠悠的马背生涯,使民间歌曲成为本民族历史、社会、文化与生活的缩影。其旋律、节奏、调式调性、结构及织体诸方面都有自己的民族风格。多年来,音乐家对长调的研究孜孜不倦,本人有多年从事声乐教学的经验,对长调这一声乐艺术形式有浓厚的兴趣。遂对十二年来(1994-2006)音乐家对长调的研究加以综述,希望对声乐理论的研究有一定的推动作用。有关蒙古族长调民歌特征的文章,有刘永福载于《音乐探索》上的文章《略述蒙古族“长调”民歌的艺术特色》,他指出蒙古族自古以来就是一个崇尚札乐的民族,一个能歌善舞的民族。文章从四方面分析了略述蒙古族“长调”民歌的艺术特色:一、色彩的多样性;二、功能的广泛性;三、内容的丰富性;四、从形式上的独特性、发声技巧的独特性、旋法上的独特性分析了音乐的独特性。从表现形式上来讲长调民歌的演唱既可以有伴奏,也可以无伴奏,伴奏乐器一般是马头琴。文章最后指出蒙古族长调民歌作为草原音乐文化的基础和主流,诞生在马背,扎根于草原。在民族民间音乐艺术的百花园中独树一帜。李世相在《内蒙古艺术》上的文章《缘爱为本的蒙古族长调民歌歌词特色》一文中阐述了长调民歌的歌词的特点:既遵循着蒙古族诗歌的韵律特点,又在音乐化过程中形成了一定的个性特征。其基本特征如下所述:“每一首歌词都遵循着蒙古诗歌的格律,包括谐头声、开始的节奏、语音和语义在行间或行内词逗间的对应关系,以及具有平衡和连接行间作用的无词义音节,这些都作为对旋律形式的支持。以缘爱为本特色与礼仪规范的严肃性,善用比兴的抒情性结合,共同构成了长调民歌歌词的整体特征。”宫日格玛在《内蒙古艺术》上发表的文章《关于“长调”的旋律形式与表现特征》中指出:所谓旋律形式,即构成音乐的各种元素的整体。在传统旋律形式中,蒙古民歌的旋律在艺术表现力方面最为典型。在旋律形式中,自由节拍的起伏性变化,跳进与级进音程的有机结合,长、短节奏的对比,自由庞大的旋律结构,体现出蓝天原野、翱翔的雄鹰、奔驰的骏马、花草树木、山川河流等大草原的自然风光与蒙古人的情感和精神气质。长调旋律的基本情绪和风格主要是辽阔、抒情、雄壮和谐、深沉幻想。长调旋律的速度的表现特点是由基本速度、节奏速度、平均速度感等三个方面组成。长调旋律是自由节拍形式的,它的力度表现主要以自由节拍、切分音、附点音和连音等形式体现。长调旋律的音程由级进与跳进两种类型组成。乐音运动线条表现图式是根据长调旋律线条的张驰形式和乐音运动曲线形象为主要依据而形成的。