地理信息系统的含义十篇

发布时间:2024-04-25 20:28:04

地理信息系统的含义篇1

GiS(GeographicinformationSystem)是综合类的技术学科。是基于计算机技术的发展、遥感技术的广泛运用,再与地质学科相互辅助和结合的新型科学理论。即属于又区别于信息科学。

地理信息系统的定义最早由西方国家确定,主要目的是为了获取空间数据,并将这些数据做储存和整理,方便检索和分析,这里的数据主要指空间定位数据。对这些数据运用信息化技术进行管理,就是西方地理中心对地理信息系统的定义。在我国,对它的定义则内容涵盖的更加广泛和全面一些。国内的定义认为地理信息系统,是对承载地理信息的所有物质进行一系列的分析整理活动(数据的输入、数据的存放、数据的修改以及进行计算和分析,再输出的过程)。这里的物质,包含文字材料、图片信息、各类型的数据。

由上,我们将地理信息系统的定义归纳总结为:针对地表空间,具有采集信息、存储数据、并能够便捷的进行维护、及时更新的功能。具有综合分析、管理和预测的特征;它的主要工具是使用计算机的软件、硬件的作用,结合地理理论知识,快速有效的分析复杂的地表空间信息。

地理信息系统的主要核心来源于计算机系统,另一方面管理和使用者则是地理信息系统表现形式和运行方式的决定者。主要内容则是通过空间的数据来体现。因此,完整的地理信息系统的构成,必须含有其核心:计算机硬件系统以及软件系统;其内容的体现:空间数据的收集。运行方式的决定者,操作人员。

2.地理信息系统的内容

(1)特定的专题信息。这一方面的内容是某一地理资源体系或地理形态的专项信息类别。是专项为某种目的服务的,具有很强的专业性和目的性。

(2)根据地域形态或区域划分不同,设定的地理信息系统。这一内容主要服务于相应的区域。是地区内对气候、资源、生态环境等地理情况的综合分析和了解的主要工具。比如国家地理信息系统。

(3)主要的系统工具。主要是计算机软件系统的工具运用。一般性是以软件包形式出现。将所有图片信息、文字材料组合形成综合信息,借助数字化软件,将其数字化,以方便于管理和查询;

3.GiS的主要运用

国际上,地理信息系统的首次出现是在加拿大,于1964年由加拿大政府批准,称为CGiS(加拿大国家地理信息系统)。这为后期GiS的发展做了铺垫。在这之后,GiS在美国得到了高速发展,在二十年间,由美国研究开发的GiS软件已超过两百个。

国内GiS的发展从上世纪80年代初才开始萌芽,主要由国家科技发展委员会进行组织,建立了专项的研究小组,主要规范研究我国国家资源和生态环境体系。随着遥感技术得到越来越广泛的运用,一些专门性研究所和国家高等院校开始加入到研究队伍中来。丰富了研究体系,并取得了明显的研究成绩。

关于地理信息系统的运用,在国内外主要在土地和资源的规划、勘测方面。例如城市的规划、水土流失的研究、水资源管理等方面。地理信息系统逐步发展,不再是单一的在地理、自然科学领域的运用。同时在社会科学领域中,它可以帮助社会经济的发展,进行规划管理,协助研究的作用。

3.1水文地质的地理信息系统运用

由于GiS在我国的发展时间较短,在水文地质方面的应用还处于基础萌芽阶段。其实,水文地质方面的GiS运用在一些发达国家已经发展的较为成熟,为我国的GiS实践,提供了宝贵的经验。

3.1.1国外对水文地质方面GiS的应用的发展

上世纪90年代初,美国亚拉巴马州的莫比尔市,开展了专题讨论会。讨论了地下水模型以及水文资源运用方面的问题。这次专题讨论会还讨论了GiS的主要技术问题。比如计算机软件的应用,硬件的使用以及结合遥感系统的发展等各个方面。

紧接着美国“地理信息系统和水资源专题讨论会”的召开,在奥地利的维也纳也召开了同类型的学术讨论会,主要讨论了水文学和水资源管理的实际应用。这次讨论会比较全面的提出了GiS在水文地质专业的应用。包含了相关的决策系统,遥感技术的具体应用方法,三维立体技术以及四维技术的问题研究,低下水系统如何运用GiS系统等。

3.1.2GiS在水文地质方面的应用形式

(1)决策支持系统:主要运用于地下水管理中,由操作者即信息管理工作人员、操作工具即主要的计算机硬件、软件系统,主要的载体即用户操作体系组成。主要作用是帮助决策者进行决策。主要方式的是数据库和基本模型库的综合利用,以构建半结构化的过程。主要的研究成果是识别和分析采集到的空间数据库。并形成相应的图像显示出来。以Sandia国家实验室为例,在环境保护的决策系统中,提出了定量化的概率形式来评估监测井网。因为按照美国的环境恢复法要求,必须设置地下水监测系统。但是只规定了关于数量的设定,监测井网的质量和其他方面的细节之处则需要通过管理者的主观判断。这就容易形成较大的误差和环境保护结果的区别。

(2)地下水系统:主要是地下水流模型的运用。可以有效准确的模拟地下水的具体位置、地下水流量的大小以及根据测算结果,进行地下水量补给的过程。这一系列活动的原理,来源于GiS的各个方面,例如对专业模型的开发和设计。方便清楚模拟情景展示等。以水量的平衡模型来举例。主要利用数学微积分,根据水文数据、地形遥感图像,运算出区域年降水量平衡、构建一维模型。来研究某一区域的年水量是否平衡。

(3)不同的含水层确定:这一应用,可以判断出冲击含水层和深层含水层。首先运用信息软件生成地域空间图像。采集已挖掘水井的含水层深度。分析出供水的主要含水层。

(4)地下水监测网的设计:为了促使GiS性能的一体化,运用分析法和排列法等方式,验证实例已达到对空间数据的管理。因为其具有灵活形象的显示功能,在评价权重方案和监测最优监测点方面,有非常重要的作用。

(5)数据的比较和计算设置:GiS在地下水流模型边界的排列方面、以及地质图和地区地表厚度图的数据比较是非常有效的,结果也十分准确。这给社会学科的部分解释提供了有力依据。但是对宽阔的山谷、高原地区等起伏较小的地表高度数据的形成,有部分错误性。需要进一步的检查。

GiS在水文地质方面的应用形式多样,比如在水源保护方面:GiS可以开发出相应的用户界面。储存水源保护区的GiS数据库。提供给用户自由提取信息。方便对水源保护区的管理和描述。例如对潜在污染源的识别和预防机制的建立。在研究地下水方面:通过遥感技术可以有效辨别地表形态,利用高分辨率的卫星数据,可以为地下水的开采确定目标区域,提高地下水开采的质量和效率。还有编制水文地质图方面都有较为广泛和有效的应用。

地理信息系统的含义篇2

[关键词]数字图书馆 语义模型 信息抽取 本体

[分类号]G250.76

1 引言

语义是指“数据(符号)”所指代的概念的含义以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。语义通过两种途径产生:①人类赋予;②通过计算模型产生。通过第二种方式产生的语义可以被计算机理解和处理,可以被获取、传递、共享。根据实体资源(如文本和图像)来产生语义或挖掘出信息所蕴含的隐性语义是一个挑战性的任务。基于统计的聚类分析、共词分析、信息抽取和挖掘技术可以帮助实现语义的自动抽取。实现的关键在于建立一个语义模型,该模型既适用于显式语义,又适用于通过显式语义挖掘推导出隐含语义。语义模型是通过模型作为媒介来实现数据语义关系形式化描述的一种方式。基于本体的语义模型是通过以本体为核心的模型作为媒介,实现数字资源语义关系形式化描述的一种方式。本文基于本体构建了语义模型,并基于该语义模型探讨数字图书馆知识组织过程中信息抽取策略。

2 信息抽取与本体

信息抽取是从分布的、异构的文本中提取出特定的事实信息,将其中隐含的语义提取出来并以更为结构化、更为清晰的形式表示,为用户使用提供便利。信息抽取与语义标注总是融合在一起、互相支持的;信息抽取需要在语义标注的基础上进行,语义标注的内容是经过信息抽取提取出来的。因此,目前对于信息抽取研究离不开对抽取对象的语义分析和描述。语义分析与描述技术的研究热点是本体技术。

本体是对面向计算机语言的、已被组织的知识的描述,而信息抽取是面向自然语言,分析文档表达的事实和从这些文档中提取相关信息片段。信息抽取和本体是相辅相成的:作为抽取相关信息的理解程序,本体被用于信息抽取,是信息抽取的语义知识依据;信息抽取可以丰富本体,因为信息抽取出来的文档可以作为设计和丰富本体的知识资源。

这两方面的任务被结合在循环中(见图1)。本体可以有效地、准确地、解释信息抽取出来的数据,而信息抽取从文档提取出来的新知识可以整合进入本体从而丰富本体。

2.1本体对信息抽取的支持

在抽取过程中,本体知识对文档的语义解释具有重要作用。

本体对领域概念以及概念的多种形式进行了规范性说明,因此在信息抽取中可以用来进行字符串的语义分析,进而进行概念识别;在信息抽取过程中,需要领域本体对文档中实体名称进行识别与分类。本体中的类可以对信息抽取文档进行概念识别、语义标注和概念规范。

本体的概念层次结构。传统信息抽取的重点是使用同义词集而不是层次关系。例如,在wordnet中,同义词集可以用于语义标注和消歧,但上下类关系还需要本体参与。本体中包含的语义类型或语义的层次关系,有助于通过抽取内容进行推理和忠实释义。

更先进的信息抽取系统也需要利用领域本体的概念节点、概念节点的属性和相互关系予以描述。本体中的概念与属性值能够清楚地描述信息抽取对象的本质。对于文档中抽取对象的分析既能提高自然语言处理,又能指导概念框架的实体构成,而相应的规则即是基于短语模型,更多是基于语义分析的。

领域概念模型。领域概念模型本身用于推理,它能合并不同表现形式的同一概念,并且能够揭示出隐含的语义。

2.2信息抽取对本体的丰富

本体构建一直是公认的语义进程中的瓶颈,而信息抽取有助于本体构建。已经提出各种方法用于语料库的建设以利于本体构建,如基于规则的信息抽取即是对本体构建方法的补充。基于推理规则抽取出基本数据,通过已有本体对该数据进行概念及概念关系分析,在此基础上将数据中新的概念或概念间的新关系整合到本体。

实体命名抽取:实体命名通过在本体中以实例的形式表示。从这个角度看,需要自动地不断地为本体增添一些热门领域的实体名称。而信息抽取被广泛应用于识别和分类文档、网页、数据库等中的实体。

关系抽取:在结构化本体中,概念与概念之间存在着语义关联。目前从文档中获取本体关系的方法主要有三种:基于共词分析方法、基于知识库方法和基于信息抽取模式方法。信息提取模式方法提升了前两种方式:第一种方法需要对基本关系类型进行解释,而信息抽取中的规则就是特色化关系;第二种方法原有的知识可以帮助设计一个提取规则。

信息抽取通过本体进行基于领域的语义分析,提升信息的语义性,为智能检索打下基础;本体通过信息抽取不断学习,不断演化,解决本体构建的瓶颈问题。鉴于此,本文基于本体构建数字图书馆知识组织语义互联的语义模型,利用语义模型探讨语义互联实现过程中各个重要环节的策略,进而最终完成数字图书馆知识组织的语义互联。

3 数字图书馆互联的语义模型

语义模型是对内容语义、语义类型及语义关系进行描述和组织的机制,它试图在用户的信息需求和信息资源之间搭建一座桥梁,将两者灵活而有机地结合起来,从语义的角度来解析信息资源,进而从互理解的角度来提升用户检索的准确度和召回率,更好地满足用户的信息需求。语义模型是影响数字图书馆知识组织语义互联的核心要素。本文构建了以元数据、领域本体、桥本体和本体解析体系为组成要素的语义模型,利用语义模型实现数字图书馆知识组织过程中的数字资源、用户需求表达的语义解析,完成数字图书馆用户交互层、内容管理与功能层、内容层之间的语义映射。其中,元数据进行资源的标准化描述,领域本体进行概念以及概念之间关系的语义标注,桥本体用于资源之间语义聚合,本体解析主要解决本体的具体效用发挥的方式,如图2所示:

3.1元数据

元数据是数字图书馆用来解决语义互联的重要基础工具。数字图书馆由资源构成,而资源是可以被标识的。元数据提供了对资源各种属性的描述。元数据通过定义数字图书馆中资源的信息结构以及定义由数字对象构成的资源库的组织结构,决定着数字图书馆知识组织和知识服务方式。元数据发展比较成熟,已经形成完整规范的元数据体系,包括元数据格式、元数据标准、元数据方案、元数据应用纲要、元数据注册系统等等,这些为数字图书馆知识组织语义互联打下了基础。

3.2领域本体

领域本体是知识组织体系中重要组成部分,其目标是捕获相关领域的知识。领域本体是对领域内共享概念模型的明确的形式化的规范说明;概念以及概念之间的关系是经过精确定义的,提供了对领域知识的共同理解与描述,能够为计算机所使用并可用数学方

式表达。在领域本体技术驱动下,信息资源以全新方式进行组织,组织原理发生如下改变:①从用户可理解到机器可理解;②从信息描述到知识表现;③从语义隐含到语义揭示;④从“以概念为中心”到“以概念一关系为中心”;⑤从信息表示到智能推理。这些变化要求知识组织理论、形式、方法、技术、体系以及知识组织过程都要随之改变,实现对资源从语法层面向语义层面深入,最后直至语用层面的组织,在获取、表示、加工、存储、重组、提供、共享、利用、控制等知识组织过程中,充分体现语义性,在数字图书馆系统的各层之间,在用户、资源、服务之间,形成语义互理解和互操作。

3.3桥本体

桥本体是一种特殊的本体,完成不同领域本体概念之间关系的映射,进而实现本体整合,形成领域内的共享本体。桥本体记作obridg。,可以用一个六元组表示:

obridge={cb,acb,Rb,arb,hb,xb}(1)

其中,cb表示桥本体概念的集合,acb表示桥本体概念所对应的属性集的集合,Rb表示桥本体之间关系的集合;arb是桥本体之间关系所对应的属性集的集合,Hb代表了概念的层次结构,xb是一系列公理集合。

在概念上,桥本体具有四层树形结构(见图3):第一层是最普遍的概念,标记为t;第二层具有概念桥和关系桥两个概念,它们分别表示了两种不同的桥关系;第三层由10种不同类型的子类桥组成;第四层是一系列动态创建概念的集合,它们的属性描述了不同本体之间关系的信息。其中上面三层是固定的,称之为静态层,第四层的概念是根据已知的多本体动态产生的,为动态层。

3.4本体解析体系

数据存储模式的选择直接影响使用的效率。本体是系统多层之间语义联系的纽带,因此本体、桥本体的存储方式影响数字图书馆知识组织和知识服务的质量。本文选用的本体描述语言为w3C推荐的owL,将其存储到关系数据库。关系数据库存储本体既有缺点,对本体含有的丰富语义缺乏精准的表现,又有无可比拟的优点。已有文献对本体到关系数据库模式映射进行了详尽的阐述,在此仅谈及桥本体的解析。

根据桥本体的概念结构和关系数据库的形式化定义,下面给出它到关系数据库模式的映射规则。

以桥本体建立数据库,取名为database-brid―geo。

桥本体中的十个桥关系分别为桥本体的子类,分别以这十个桥关系建立十张表,表名为table―Bcequal、table_BCdifferent、table_BCisa、table_Bcinstan―ceof、tableBCoverlap、tableBChasa、table_Beopposed、ta-ble_BCconnect、table_BRsubsume和table_Brinverse。

将桥本体的属性映射为各个表的属性,属性类型为字符型;各表属性个数并不相同,主要包括三类:一类表示具有该种桥关系的两个领域本体的名称;一类表示具有该种桥关系的领域本体的类名称;一类属性代表该类所对应表的地址。

属性值分别取值为领域本体名、领域本体中类名和类对应的表名。

不同领域本体概念之间的关系构成表中的记录。

表中的主键为复合主键,由不同领域本体名称和不同概念名称组合而成。

4 基于语义模型的信息抽取策略

抽取对象是异质的、异构的、多语种的、半结构化甚至是非结构化的,并且可能存在着语义模糊、语义缺失,因此对抽取对象实体命名识别、实体间关系的识别变得更加困难,需要多种技术协作完成。语义模型能有效协助信息抽取:利用元数据对数字信息资源和用户信息资源进行规范化描述,利用领域本体集和桥本体实现数字资源和用户信息资源语义关系形式化描述,而语义模型中本体解析体系为信息抽取为利用本体提供了途径。因此,利用语义模型可以有效地进行实体命名识别和信息抽取规则制定。基于规则进行信息抽取能有效过滤掉噪声,增加新的结构信息。大体过程如图4所示:

4.1数据采集和数据清洗

通过各种数据采集工具对数据库、文档和网页进行数据采集。数据库中的数据是结构化的,采集相对简易;而文档和网页结构各异,先将它们抓取入系统;数据清洗目的是对有信息价值的各种数据通过处理产生纯文档。首先对抓取的原始数据进行结构分析,去除噪声,分析数据是表结构、文档结构还是网页结构,网页结构是内容型网页还是表单型网页,并对各种结构进行识别剥离;然后进行内容分析,例如网页中的广告、图像、版权信息等等;最后对用户关心的信息内容进行提取,产生待处理的纯文档,如图5所示:

4.2文档预处理

文档预处理的任务是自然语言处理,将文档处理切分为待处理的词汇和信息单元。首先将待处理的纯文档进行词语切分和词性标注,取出分词结果中的名词和动词;然后按标点符号进行短句分割,作为信息单元,并以此作为信息抽取的粒度;最后对短句进行语法词法分析,并实施初次筛选,保留其中至少包含两个名词和一个动词的信息单元。该过程需要相关领域知识的术语表、词汇表、主题词表等,对分词系统中的词表进行二次加工。语义模型中的领域本体可以提供规范化的概念及概念中所涉及术语的多种形式,可以对词表进行丰富和规范,如图6所示:

4.3规则生成

信息抽取规则的生成利用了本文构建的语义模型。语义模型中的领域本体描述了概念、属性、实例以及本体内部概念与概念之间的关系,桥本体描述跨本体的概念之间的多种关系。领域本体和桥本体用owL描述,将owL本体映射到关系数据库,形成语义模型数据库;数据库中含有若干个表,通过表、表的属性、表的主键与外键以及属性之间的约束对本体进行解析。信息规则在此基础上生成:首先从语义模型数据库抽取类、抽取属性、抽取实例、抽取关系,对于桥本体还需要抽取表名;然后通过其解析出的本体中描述的概念、关系、层次结构等来生成三元组,再将此三元组作为信息抽取的规则存入规则库。如图7所示:

4.4实体抽取

信息抽取主要是对信息单元进行解析后,对信息单元中的名词基于语义模型中的概念和实例进行实体命名识别,充分利用本体对概念规范描述的优势,提高实体命名识别的准确性;再对信息单元重新规范,形成具有主、谓、宾三元关系的分析树。将该分析树与抽取规则三元组进行匹配,如果匹配成功则将该三元关系存入数据库中,完成信息抽取;如果匹配不成功,对该三元关系的概念与语义模型进行语义相似度计算,根据计算结果,形成本体中的新概念或新关系,添加到语义模型中,完成本体学习,丰富领域本体,如图8所示:

基于语义模型的信息抽取有如下好处:①语义模型的引入既保证了结构的一致性,又保证了数据的一致性,使不同来源的数据都能以统一的标准进行描述和呈现,方便了信息的继承与交换,提高了信息抽取的准确率及召回率;②驱使整个信息抽取过程都直接来自于语义模型,这为利用各种各样的本体数据呈现了一条非常自然的路径;③基于语义模型的系统可以促进本体进化,丰富领域本体。

地理信息系统的含义篇3

关键词:本体;语义网;自然语言处理;信息获取

中图分类号:tp393文献标识码:a文章编号:1009-3044(2008)32-1197-03

LuceneBasedSemanticSearchengineDesign

YUXiao-Shun

(DepartmentofComputerScience&technology,tongjiUniversity,Shanghai201804,China)

abstract:thispaperdesignsasemanticinformationretrievalsystembasedontheopensourcefulltextsearchengine:Lucene.itcombinesontologyandnaturallanguageprocessingtechnology.itanalyzeshowtocomprehendwebpagesemantically,designsasemanticindex,andproposesasemanticsortingalgorithm.

Keywords:ontology;semanticweb;naturallanguageprocessing;informationretrieval

1引言

如今,web页面每天爆炸式的增长,用户想找到需要的信息已经变得很困难。目前的web信息检索方法主要是基于内容分类目录和基于关键词搜索的。目录分类常见于一些门户网站(如Yahoo!等),主要是通过相关链接获得一些浅层信息。基于关键词搜索是把用户的查询请求和web页面、文档中的每一个词进行比较,只要发现某个网页中含有这个关键字符,就将该网页作为查询结果返回给用户。因此,目前信息检索的查全率(Recall,也称召回率,即被找到的信息/全部所需要的信息)和准确率(precision,即有用的信息/全部查询结果)难以令人满意。究其主要原因,是因为对计算机而言,关键词几乎没有任何语义,计算机不理解web页面中词语表达的语义及其相互关系,因此检索的性能还是难以得到本质的提高。

语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术。它从语义理解的角度分析信息对象与检索者的检索请求,是一种基于概念及其相关关系的检索匹配机制。

对于语义分析技术来说目前正在研究的有多种方法。语义网[2]技术是其中一种,它旨在赋予网页机器可以理解的语义。在现在的语义万维网的研究中,机器可理解的语义是通过用本体对数据进行定义、用标准的RDF或owL语言进行表示、并用逻辑推理的方式进行处理来实现的。这里的核心在于本体。本体是一个来源于哲学领域的概念,它是指关于存在及其规律的学说,后来被引入人工智能领域。一个广为接受的在人工智能领域中关于本体的定义是:本体是一个关于概念化的明确的规格定义。本体把一组需要处理的概念以及概念之间关系进行了严格的逻辑定义。机器因而可以根据这些逻辑定义对概念和关系进行有意义的处理和推理,从而达到机器“理解”了概念和关系符号的目的。自然语言处理技术领域对于文本的语义分析也正在如火如荼的展开。

在信息检索技术方面已经取得很大进展,著名开源搜索引擎Lucene为研究者提供了一个很好的基础架构。

本文尝试Lucene的架构基础上,使用自然语言处理中的词类标注技术以及语义网技术进行信息处理,同时相应适当改变Lucene原有的索引结构,从而形成一个具有初步语义信息分析能力的语义信息检索系统。

在接下来的第二部分中将首先介绍本系统的整体架构,而后在第三部分讲述如何对网页信息进行语义分析,在第四部分讨论生成的语义索引的结构。第五部分描述网页排序算法,最后在第六部分对全文进行总结。

2系统整体结构

本文设计的语义信息检索系统的架构如图1所示。

系统首先对web页面进行语义分析。在这个过程当中将使用词类识别技术及本体技术,中间结果将以owl文件形式表示。而后按照语义索引的格式将语义分析后的页面文件转化成索引文件从而形成系统真正需要的索引。在检索方式上依然采用关键字方式的查询。

3文本语义分析

对于信息检索系统来说信息处理是整个系统最核心的部分。在Lucene中只是简单的将网页内容分词,得到了最基本的信息处理单元,但是网页中大量的语义信息并没有能够被系统表示出来,因而在后续的检索中也无法从语义层面进行检索。在本文描述的系统中尝试引入了自然语言处理技术以及本体技术对网页进行语义分析,本节具体讲述如何进行该步。总体的流程如图2所示,总共分三个步骤:

1)文档预处理

web页面通常含有很多用户不关心的信息,如广告链接、图像、版权信息等,通常称作为噪声。在建立索引之前,需要将网页进行清洗,去掉这些噪声。

2)词类识别

使用自然语言处理中的词类识别技术给词语添加词类信息,比如原本网页中有句话:“我的电脑坏”了,那么经过词类识别之后就可以得到信息:“我/pn,的/DeG,电脑/nn,坏/Va,了/aS”。将原来的词语序列分割成了5个部分,并分别标注上了词类。而后将该结果转化成语义网中的owl格式,这样做既有利于后续处理,同时与本体推理需要的文件格式相符。

在转化过程中将每一个分割出来的部分作为一个概念这样形成一个层次的概念,比如上文中词类分析后可以提取出“我,的,电脑,坏,了”5个概念,每个概念在文中的一次出现作为该概念的一次实例,每个实例以它在正文中出现的位置为名字,那么就可以形成“我(#0),的(#1),电脑(#2),坏(#4),了(#5)”。而后转化成owl格式就可以形成

<rdf:RDF>

<owl:ontologyrdf:about=""/>

<owl:Classrdf:iD="我"/>

<owl:Classrdf:iD="的"/>

<owl:Classrdf:iD="电脑"/>

<owl:Classrdf:iD="坏"/>

<owl:Classrdf:iD="了"/>

<电脑rdf:iD="#2"/>

<坏rdf:iD="#4"/>

<了rdf:iD="#5"/>

<的rdf:iD="#1"/>

<我rdf:iD="#0"/>

</rdf:RDF>

而词类作为另一个层面的概念可以按照同样的方法实例话,那么就可以形成如下的文件片断:

<rdf:RDF>

<owl:ontologyrdf:about=""/>

<owl:Classrdf:iD="pn"/>

<owl:Classrdf:iD="DeG"/>

<owl:Classrdf:iD="nn"/>

<owl:Classrdf:iD="Va"/>

<owl:Classrdf:iD="aS"/>

<nnrdf:iD="#2"/>

<Vardf:iD="#4"/>

<aSrdf:iD="#5"/>

<DeGrdf:iD="#1"/>

<pnrdf:iD="#0"/>

</rdf:RDF>

两者合并,生成文件“/sample1.owl“,作为词类识别处理部分的最终输出。

3)本体推理

本体是基于本体的语义检索系统的另一重要部分。它是领域内背景知识的良好表达,通过它可以对已经形式化的实例信息进行推理从而添加更多地语义信息。作为示例本文可以引入简易的电脑本体,其内容如图3所示。

在该本体中定义了与电脑有关的6个概念,以及他们的上下位关系,那么通过它可以对第二步词类识别产生的实例信息进行推理。

在上步产生的实例信息中有这样一条:

<owl:Classrdf:iD="电脑"/>

<电脑rdf:iD="#2"/>

定义了“电脑”这个概念有一个名为“#2”的实例。在简易电脑本体中存在这样一条公理:

<owl:Classrdf:iD="计算机">

<owl:equivalentClass>

<owl:Classrdf:iD="电脑"/>

</owl:equivalentClass>

</owl:Class>

语义是说“电脑”这个概念与“计算机”这个概念是相等的。那么两个结合就可以推理得到一条新的陈述

<计算机rdf:iD="#2"/>

经过该步骤之后最终形成了语义分析的结果。

4索引结构

在对文本进行语义分析之后,下一步就是利用这些信息生成索引。其基本思想是采用类似lucene的反向索引格式。反向索引是一种以索引项为中心来组织文档的方式,每个索引项指向一个文档序列,这个序列中的文档都包含该索引项。相反,在正向索引中,文档占据了中心的位置,每个文档指向了一个它所包含的索引项的序列。你可以利用反向索引轻松的找到那些文档包含了特定的索引项。在lucene中,最核心的索引文件包括三个:

1)索引项信息文件

这是索引文件里面最核心的一个文件,它存储了所有的索引项的值以及相关信息,并且以索引项来排序。

2)频率文件

这个文件包含了包含索引项的文档的列表,以及索引项在每个文档中出现的频率信息。如果lucene在索引项信息文件中发现有索引项和搜索词相匹配。那么lucene就会在频率文件中找有哪些文件包含了该索引项。

3)位置文件

这个文件包含了索引项在每个文档中出现的位置信息,你可以利用这些信息来参与对索引结果的排序。它们的关系如图4所示。

在进行语义分析之后,系统得到的信息比标准的lucene索引结果多了一个词类,因此,需要修改lucene索引结构,在位置文件中多加入一列信息:词类。即将位置文件改称如下表1所示:

5排序算法

本节讲述在接收用户搜索条件后,系统如何处理并返回检索结果。

对于搜索引擎来说检索需要完成两个工作,首先找到相应于检索条件的文档集合,而后要对该集合进行排序。

对于检索文档集合可以通过索引项文件中的频率文件指针找到频率文件,而后可以在频率文件中得到文档集合。

对于排序在lucene中是使用基于频率的评价标准的,具体的计算方法如式1所示:

式1文档排序公式其具体解释如下表2所示:

通过该公式就可以得到每个文档的得分,从而对文档集合进行排序。

在进行语义分析之后,系统除了频率信息,还可以得到每个索引项在文中扮演的角色即词类。因此可以通过该信息对上面的计算方法进行改进从而提高查准率。

首先,对于用户输入的查询,也同样做词类分析,得到待查询索引项及其词类。而后将排序公式修改如下:

式2语义文档排序公式相较于先前的公式,该公式将因子f(tind)修改成了ptf(tind),它代表索引项t在文档d中以与查询中相同的词类出现的频率。相较于原来公式的索引项t在文档d中出现的频率可以更准确地反映文档的相关度。该值可以通过扩展的频率文件中的poS字段得到。

6结束语

语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术,它从语义理解的角度分析信息对象与检索者的检索请求,是一种基于概念及其相关关系的检索匹配机制。本文尝试在开源搜索引擎Lucene的基础上设计了一个语义检索系统。该设计首先通过使用第三方词类分析软件对文本进行分析从而将文本语义化。而后设计了语义索引结构以存储语义信息。最后在Lucene原有的排序算法基础之上提出了使用语义信息的排序算法,以期提高查全率和查准率。

参考文献:

[1]BaaderF,CalvaneseD,mcGuinnessL,nardiD,Fpatel-Schneiderp,theDescriptionLogicHandboktheory,implementationandapplications[m].2ndedition.London:CambridgeUniversitypress,2007.

[2]ericH,otisG,Luceneinaction[m],oreilly&associates,manningpublishing,2004.

[3]Jena.aSemanticwebFrameworkforJava[eB/oL].[2008-08-29]./.

地理信息系统的含义篇4

关键词:软件通信体系结构;CoRBa;FpGa;iDL编译器

中图分类号:tn915?34;tp314文献标识码:a文章编号:1004?373X(2017)14?0018?05

abstract:thesoftwarecommunicationsarchitecture(SCa)normstipulatesthattheCoRBamiddlewareshouldbeusedtorealizeintercommunicationbetweenthewaveformcomponentsrunninginthedifferentprocessors,butthereisnoiDLcompilerwhichcansupporttheCoRBamiddlewareonFpGaeffectively.therefore,aniDL?Verilogcompilerwasdesigned,whichcansupportanyiDLfilesdefinedbyusersthemselves,andgeneratetheoRBcoreandFpGacomponentframeworkcoderunningonFpGaautomaticallyaccordingtothefunctionalrequirementsofFpGacomponents,soastorealizetheCoRBacommunicationbetweenFpGacomponentsandGppcomponents.thewholestructureofiDL?Verilogcompilerisintroduced.thedesignandimplementationofthecompilerareexpoundedindetail.Sometestsforthecompilerwerecarriedout.theresultsshowthattheiDL?VerilogcompilercanparsetheiDLfilescorrectly,implementthemappingfromiDLtoVeriloglanguage,andgeneratethetargetfilesautomaticallytomakeFpGareallyhavetheabilityofCoRBacommunication.

Keywords:softwarecommunicationarchitecture;CoRBa;FpGa;iDLcompiler

0引言

软件无线电(SoftwareDefinedRadio,SDR)是一种基于通用硬件平台依靠软件实现其功能的无线电通信技术,其体系结构是通过软件通信体系架构(SoftwareCommunicationarchitecture,SCa)来定义的[1?2]。SCa采用CoRBa中间件来实现其所需的分布式计算环境[3?4],其硬件平台通常包含通用处理器(Gpp)、数字信号处理器(DSp)、可编程门阵列(FpGa)等。虽然CoRBa(公共对象请求体系结构)中间件技术在Gpp上已经广泛应用,但在DSp,FpGa等专用处理器上实现起来较为困难,目前只有oiS公司开发的oRBexpressFpGa[5]和prismtech公司开发的集成电路oRB(iCo)[6]实现了FpGa上的CoRBa通信,但考虑到国防安全问题,不允许在我国军事领域中使用[7]。基于以上考虑,为了实现FpGa上的CoRBa通信,研发了支持FpGa处理器的CoRBa中间件产品FpGa?oRB。

FpGa?oRB中间件主要包括运行在FpGa处理器上的oRB核心、客户端桩和服务器框架以及运行在pC机上的iDL?Verilog编译器,其体系结构如图1所示。其中,oRB核心用于实现客户端请求和服务器对象之间的连接,客户端的oRB核心接收被调用操作的参数并将其组码为网络可接收的格式,服务器的oRB核心将来自网络的操作参数解组,然后送给服务器来执行所调用的操作。客户端桩用于将客户端的请求编码,通过客户端的oRB发送到服务器,并把返回的结果解码后送给客户端。服务器框架负责把客户端通过oRB发过来的请求解码,通过对象操作实现,然后把结果编码后通过服务器oRB发送给客户端。客户端调用的接口和服务器实现的接口是通过接口描述语言(interfaceDefinitionLanguage,iDL)来定义的,但是与某一种具体编程语言不同,iDL是一种纯说明性语言,它只能够给出该接口的定义和每个操作要求的参数而不牵涉到具体的实现[8?9],因此要用iDL?Verilog编译器对iDL文件进行编译,然后根据解析得到的iDL文件信息修改模板文件代码,最后生成Verilog语言实现的oRB核心、客户端桩和服务器框架。可见,iDL?Verilog编译器是FpGa?oRB的关键模块,本文主要论述iDL?Verilog编译器的设计与实现。

1iDL?Verilog编译器的设计与实现

本文设计的iDL?Verilog编译器划分为三个子系统:参数解析子系统、编译前端子系统、编译后端子系统,其具体结构如图2所示。其中,参数解析子系统用于完成对用户编译命令的解析,存储编译器控制信息;编译前端子系统用于完成对输入iDL文件的解析,并生成一棵抽象语法树;编译器后端子系统用于完成对编译前端子系统生成的抽象语法树的遍历,并提取相关信息完成对输入模板文件的修改,然后生成目标文件。这种设计方式带来的好处是,可以保持参数解析子系统和编译前端子系统的代码不变,仅仅通过改变编译后端子系统的代码就可以实现针对不同处理器和开发语言的iDL编译器,这样就大大增强了iDL编译器的通用性。下面分别对三个子系统进行详细的阐述。

1.1参数解析子系统

参数解析子系统的作用是通过解析处理用户输入的命令参数以获取控制命令信息来实现对编译器的控制。文中设计的iDL?Verilog编译器需要输入的命令参数包括:源文件名、包含文件路径、输出目标代码文件路径、模板文件路径、参数传递文件路径以及帮助查询命令。

1.2编译前端子系统

编译器前端子系统主要由预处理模块、词法分析模块和语法分析模块组成。下面分别对三个模块进行详细的阐述。

1.2.1预处理模块

预处理模块的主要作用是对输入的iDL文件进行预处理,以方便词法分析模块、语法分析模块进行后续处理。其主要功能子模块包括:源文件包含处理子模块、宏定义处理子模块和条件编译处理子模块。

(1)源文件包含处理子模块。源文件包含处理子模块用来对源文件当中的“#include”语句进行解析,提取输入源文件中的包含文件;然后以包含文件的绝对路径作为输入文件递归调用预处理模块;最后按由外向内和由前向后的原则存储包含文件的绝对路径。iDL?Verilog编译器将按照存储的包含文件的绝对路径的先后顺序对相关文件逐一进行解析处理。

(2)宏定义处理子模块。宏定义处理子模块用来对源文件和包含文件当中的“#define”语句进行解析,将宏定义中的宏名存储,用于预处理模块当中条件编译的判断处理,而并不进行宏定义替换。在语法解析模块中,则会提取完整的宏定义信息,然后将基本数据类型的标识符和已存储的有效宏名进行匹配,如果匹配成功,则将该标识符替换为宏定义的字符串。

(3)条件编译处理子模块。条件编译处理子模块用来对源文件和包含文件当中的“#ifdef”,“#ifdefined”等语句进行解析,具体方法就是将参数解析模块存储的预定义变量名和预处理模块存储的宏名作为依据,对条件编译语句进行判断,找出需要编译的语句。

为了确保源文件和包含文件内容的不变性,预处理模块为每个源文件和包含文件都新建一个与之对应的临时文件。将预处理之后的源文件和包含文件存入与之对应的临时文件。词法分析模块、语法分析模块对源文件和包含文件的后续处理就转化为对临时文件的解析。当所有解析处理结束之后,iDL?Verilog编译器会删除预处理模块生成的临时文件。

预处理模块具体执行流程图如图3所示。

1.2.2词法分析模块

词法分析模块是iDL?Verilog编译器前端子系统的关键模块之一。该模块按从左往右的顺序对源文件进行扫描,在扫描的过程中会跳过空格和换行符并删除注释,将若干连续字符拼接成一个符合iDL语言的构词规则的标识符并提取,然后将提取的标识符交给语法分析模块进行后续处理,其具体过程如图4所示。

1.2.3语法分析模块

语法分析模块采用“边检查、边存储、边转换”的方式来对输入文件进行语法解析:每当语法分析模块从输入文件中检查到一种语法成分时,则调用相对应的语法解析函数对该语法成分进行解析;接着按照iDL语言的语法规则来对语法成分进行解析和检查,并在解析和检查过程中,将该语法成分的信息存储;将Verilog语言不支持的函数参数类型转换为基本数据类型,当函数参数类型为结构体时,则将其按结构体成员的数量拆分为基本数据类型,当函数参数类型为别名时,则将其与存储的别名信息对比,找出其原始基本数据类型。其具体执行流程图如图5所示。最终,一个iDL文件经预处理模块、词法分析模块和语法分析模块会生成一棵抽象语法树,该抽象语法树存储了完整的iDL文件信息[10]。每棵抽象语法树可能包含十棵子树,这十棵子树分别存储:包含文件信息、宏定义信息、常量信息、结构体信息、别名信息、异常信息、枚举信息、联合信息、接口信息、模块信息。

语法分析流程如下:

(1)判断文件是否结束,如果是则执行第(6)步,否则继续执行第(2)步。

(2)从文件中读取一个字符串。

(3)判断该字符串是否为合法字符串,如果为合法字符串,则执行第(4)步,否则执行第(5)步。

(4)判断字符串,如果字符串为函数,则调用函数解析接口进行函数信息提取和存储,并将函数参数的数据类型转换为基本数据类型存储,然后返回第(1)步继续执行;如果字符串为文件包含、属性、异常和用户定义的数据类型(宏定义、别名、常量、结构、枚举、联合),则调用相应的解析函数,完成相应信息的提取和存储,然后返回第(1)步继续执行;如果字符串为接口,则提取接口名和继承接口信息并存储,然后返回第(1)步继续执行;如果字符串为模块,则提取并存储模块名,然后返回第(1)步继续执行;如果字符串不是上面提到的任一字符串,则返回第(1)步继续执行。

(5)报告错误文件名字、错误行数和错误类型。

(6)Y束。

1.3编译后端子系统

编译后端子系统主要包括目标代码生成模块。目标代码生成模块是iDL?Verilog编译器最后一个关键模块。这一模块的主要作用是通过遍历语法分析模块生成的抽象语法树来提取接口信息,然后根据提取的信息完成对模板文件的修改来生成目标文件。

为了方便生成目标代码,本文为每一个需要更改的FpGa?oRB模板文件内容都做了注释标记,目标文件生成函数会从抽象语法树中提取相应信息对模板文件中的标记内容进行修改,并生成目标文件,这样就大大减少了目标代码生成模块的工作量。生成的目标文件按功能可以划分为:oRB模块、ioR解析模块、选择器模块、客户端桩模块、服务器框架模块、组件接口模块,其结构如图6所示。

(1)oRB模块。该模块主要用于Giop报文头、请求报文头、应答报文头的解析和封装。

(2)ioR解析模块。该模块用于解析应答报文中的对象引用(ioR),获取相应的对象密钥(objectkey)。

(3)选择器模块。该模块为选择器模块,用于报文发送和接收选择。

(4)客户端桩模块。该模块包含多个客户端桩子模块,其数量与组件端口数量相同,其主要作用是对请求报文中的函数参数进行封装以及对应答报文中的函数参数进行解析。

(5)服务器框架模块。该模块包含多个服务器框架模子模块,其数量与组件端口数量相同,其主要作用是对请求报文中的函数参数进行解析以及对应答报文中的函数参数进行封装。

(6)组件接口模块。该模块采用硬件抽象层(HaL)的接口规范[11],其主要作用是实现FpGa组件端口和FpGa?oRB之间的数据传递。

2iDL?Verilog编译器测试

本文对iDL?Verilog编译器的测试主要分为本地测试和CoRBa通信测试两个方面。

(1)iDL?Verilog编译器本地测试。iDL?Verilog编译器本地测试主要是测试iDL?Verilog编译器对iDL文件的解析处理能力。因为输入的iDL文件是无法穷举的,本文采用了等价类测试的方法来测试[12]。通过将输入的文件中的语句划分成能够覆盖iDL语法各种情况的等价类,并对每个等价类完成了测试。由于各等价类的测试步骤相同,本文仅选用了一个测试用例来介绍本地测试的过程。测试的iDL文件test.idl如图7所示,该iDL文件经iDL?Verilog编译器编译之后生成的目标文件如表1所示。测试表明,iDL?Verilog编译器能够实现对输入iDL文件的正确解析,并成功生成目标文件。

(2)CoRBa通信测试。CoRBa通信测试主要是测试表1中的目标文件能否配合的FpGa?oRB实现FpGa上的CoRBa通信。

立足于实验室的测试条件,搭建一个如图8所示的测试平台。该测试平台主要由Gpp和FpGa组成,其中,Gpp主要用来运行核心框架和Gpp波形组件a,FpGa用来运行FpGa波形组件B。Gpp采用tao进行CoRBa通信,FpGa采用表1中目标文件组成的FpGa?oRB进行CoRBa通信,GppoRB与FpGaoRB之间实际通过eLBC总线相连。

测试平台的通信过程如图9所示,上电之后,FpGa组件B也能像Gpp组件a一样通过FpGa?oRB向核心框架中的域管理器进行注册,然后域管理器对组件a进行初始化、端口连接和参数配置以完成整个波形组件的初始化;最后组件a和组件B可以通过各自的中间件向对方发送函数调用请求,并返回调用结果。测试表明,iDL?Verilog编译器生成的目标文件成功地实现了FpGa与Gpp之间的CoRBa通信。

3结语

本文根据iDL语言的语法规则,使用C语言实现了iDL?Verilog编译器。该编译器采用模块化的设计方法,⒄个编译器按功能划分为不同的子模块,可以通过改变其子模块实现不同的语言映射,大大提高了iDL编译器的通用性。同时该编译器生成的目标文件能够正确完成iDL语言到Verilog语言的映射。iDL?Verilog编译器目前已经调试通过,并作为FpGa?oRB重要组成部分实现了FpGa上CoRBa通信。

参考文献

[1]JoHnSonCR,Jr,SetHaReSwa.软件无线电[m].北京:机械工业出版社,2008.

[2]粟欣,许希斌.软件无线电原理与技术[m].北京:人民邮电出版社,2010.

[3]崔小鹏,胡中豫,张豪.SCa中CoRBa与硬件抽象层技术研究[J].现代电子技术,2011,34(6):32?35.

[4]李雅萍,杨尚森,李阳.CoRBa技术在SCa系统中的应用[J].计算机工程与设计,2008,29(16):4200?4203.

[5]BeCKwitHw,DeLLeRS,GtHompSonJ.Hardwarecommunicationsinfrastructuresupportinglocationtransparencyanddynamicpartialreconfiguration:US2008/0229326a1[p].2008?09?18.

[6]prismtech.prismtechopenfusionCoRBaproducts[eB/oL].[2013?12?10].http:///sectionitem.

[7]高宏伟.SCa系统中针对FpGa处理器的中间件关键技术研究与实现[D].长沙:国防科技大学,2011.

[8]HenninGmichi,VinoSKiSteve.基于C++CoRBa高级编程[m].北京:清华大学出版社,2007.

[9]韦乐平.CoRBa语言映射[m].北京:电子工业出版社,2001.

[10]aHoaV.编译原理[m].北京:机械工业出版社,2009.

地理信息系统的含义篇5

关键词:建筑设计创作抽象艺术理论色彩

“抽象”一次来源于纯艺术,自然被认为是那些不容易被看懂,甚至是无法被人们欣赏的抽象画;也有人认为它应该是纯艺术的美和感受,是纯粹的、自由的和谨慎的,其实这些认识都是片面的。随着近年来科学技术的飞速发展,各学科领域的逐步扩大,相邻学科之间的接线逐步象散,学科内容逐步的渗透和通话,因此原本不能被称之为艺术的建筑业逐步具有了艺术气息,并且在建筑设计和规划中表现淋漓尽致,抽象艺术理论在其中发挥着重要的作用。

1、艺术与信息论概述

抽象是与具体相对应的,是将许多事物所共同具有的特征和因素逐个分离出来或者阐明他们之间所蕴含的一种关系的心理过程。它主要包含了对复杂事物的概括、综述和简化,因此在过去的艺术工作中常常为了突出事物的某一方面而忽视了其他的因素,这就造成了在艺术作品中出现了表达方式含糊不清的问题,这也是造成当前人们对抽象艺术理解不深,无法理解。所以在当前的作品赏析中,人们将抽象理解为是无法看懂和理解的东西,是从自然里面抽离的东西,用在哪些不能够表现自然的艺术上面。抽象在艺术作品中是一个较为高级的形式,它是通过不断提炼和融合而形成的,是没有具体东西代替的结构。根据现代信息论的含义,当前的艺术作品所表达的含义主要分为三种层次,即语言信息含义、符号信息含义和表现信息含义。其中语义信息指艺术作品所传达的是它自身之中所包含的各种世界和事物的信息,如作品中事物的大小、形状和色彩等;符号信息指艺术作品在创作中所需要表达的一种信息要求,也是作者内心活动的主要表达方式。其主要包括艺术作品的感觉性质、结构性质各部分的关系,以及制作艺术作品所传达的材料等等信息;表现信息指艺术作品所传达的关于事物的表现性特征、艺术家的情感特征以及创作时的相随状态的信息。其中语义信息和符号信息容易把握和确定,表现信息不容易把握和确定。

“抽象”的含义都是指转移或分离,特别是指把注意力从某些事物或一件事物的某些方面转移开。“抽象”在艺术领域有两种含义,其一是一件传达了可见世界以外的某些方面信息的作品,根据它传达的信息不太完整或更为完整的情况,而被说成更多地或更少地是抽象的,这种再现性的抽象叫做“语义性抽象”;另一种含义是指许多不同种类的艺术中所有那些不传达或意在不传达外在世界信息的艺术作品,它不描绘不塑造任何事物,只不过是由非传统的要素塑造,由非传统的结构所组成的人工制品,在作品与被再现的事物之间不存在任何关系,因为作品不再现它本身之外的任何事物,这种非再现性的抽象叫做“非传统抽象”。在抽象化与单纯化的口号下,风格派提倡数学精神。从后印象主义经过立体主义走向抽象创造的蒙德里安,使黑和白的分割、黑与黄的冲突达到原色的和谐。因而,平面、直线、矩形成为艺术中的支柱,色彩亦减至红黄蓝三原色及黑白灰三非色。艺术以足够的明确、秩序和简洁建立起精确严格且自足完善的几何风格。风格派是绘画史上的革命,更是对之后的艺术风格产生了深远的影响。二十一世纪,许多著名的设计师对风格派的艺术运动更是念念不忘,时时在他们的作品中发现风格派精髓被运用。

2、建筑创作中的应用

2.1再现性语义抽象

抽象表现为把事物的某一个细节、功能夸大而设计出的一种新的事物。在家具中,通过这种夸大某个细节的设计理念带来的简洁家具,简练而又丰富,往往令使用者回味悠长。风格派通过提炼去表达简约。风格派家具有醒目的色彩、简练的造型、精巧利落的线条和多种材质的混搭等特点。风格派的家具设计特色是点、线、面和色彩等设计元素、材料都很单一。总的说来,建筑师在设计时运用再现性语义抽象的方法,通过作品一定的语义信息或符号信息来传达建筑的思想。

2.2、非再现性非传统抽象

在建筑历史上,运用非传统抽象设计手法进行建筑创作是近现代的事,并且占了主导地位。西方现代建筑运动应溯源于18世纪欧洲的工业革命,到本世纪20年代走向高潮。现代建筑运动对中国的影响并不那么大,先是经济基础落后,而后是政治观点的制约,严格地说,中国建筑界敞开思想了解西方现代建筑是八十年代才开始的。几乎半个世纪关于现代建筑运动在西方建筑界的争论我们了解甚少,恐怕只有少数研究西方近现代建筑史的同志才关心这些事。构成派运用立体构成、平面构成和色彩构成的知识进行建筑创作,重视几何形体、空间和色彩的构图效果,这种设计手法在现代建筑或后现代建筑创作中常用。

2.3建筑图中的抽象艺术理论

在建筑工程领域,经过现代主义之后对抽象建筑形式的认识实现了某种程度上的普及,所以在后现代建筑设计中运用较为广泛。而在研究中它对于非习惯,非传统形态的建筑设计要进行合理思考,避免在设计中出现墨守成规和缺乏活力的设计方式。在建筑图中画配景时,把配景的细节部分舍弃而抽象地画出,最常见的是人和树的程式画法。

2.4、室内设计的应用

运用抽象元素如鲜明的色彩、活泼的图案,会有很多人感觉难以适应,且与传统的设计风格又格格不入,其实,抽象元素很容易与现代室内风格相配合。很久以来,传统的设计装饰图案:点、锯齿形、重复的条纹与自然的、生物的形状常被用于装饰设计之中,现代的艺术家和设计师们延续了这一传统,使用现代设计手法古为今用、变形改造等获得强有力的表现效果,在色彩上常常运用黑白两色强烈比对的形式。黑白两色与三原色的组合是抽象艺术设计的典型表现,能够形成一种明快的色彩设计,中性色的墙壁使得抽象图案成为空间的主角,装饰品和布艺的多种色彩相映成趣,这就使抽象完全融入到了设计之中。

3、结束语

运用抽象艺术理论进行建筑创作是工业革命以后建筑师一直在研究和探讨的问题,世纪中叶以后,在建筑创作领域占据了主流。建筑之美从古代具象美逐渐地转向建筑之抽象美,这也正反映了艺术领域审美标准发生的变革。随着时代的进步和社会的发展,人们的审美标准会越来越向抽象方向靠拢,这样利用抽象艺术理论进行建筑创作就成为历史的必然。抽象艺术的流派很多,将来可能还会出现新的流派,在建筑创作时需透过各种流派形态差异的外表,领会其精神实质,才能真正创作出高水平的建筑精品。

参考文献

[1]杨奇;现代山地城市居住空间地域化的思考[D];重庆大学;2007年

地理信息系统的含义篇6

关键词 语义检索 语义网 本体 信息检索

分类号 tp391

1 网络信息检索的局限与语义检索

目前网络检索的实现技术主要有两种:一种是依赖于编码处理,通过分类模式来描述信息资源,从而实现检索;另一种是通过全文检索,查找文本中含有用户指定词语的信息源。其应用的体现分别为基于分类目录的搜索引擎和全文搜索引擎。前者虽然基于人工处理,准确性较高,但它更适合用于网络信息资源的浏览和导航;后者实现较为方便,适应了对迅速增长的海量网络信息资源进行自动处理的需要,成为网络信息检索的主要途径。但是用户在检索中始终面临不少困难,如:检索结果的过载和低查准率,用户负担重;检索结果及其排序不一致,且与用户使用的查询词汇形式及其组合形式高度相关等。究其原因,统计意义上的词型匹配难以支持对网络信息资源的有效检索利用。因此研究者们将目光投向了对词形背后的意义的挖掘上,探索实现基于概念匹配的检索技术和方法。

早在上世纪80年代对语义检索的讨论就出现在SiGiR会议论文中,但语义检索研究始终受制于语义信息处理发展水平的局限。随着自然语言处理、人工智能的发展,尤其是语义网技术的兴起与发展,语义检索研究自上世纪末以来得以迅速发展。尽管到目前为止对语义检索在概念上仍没有统一的界定,但不同的研究却有着共同之处,就是基于对信息资源的语义处理实现效率更高的检索。语义信息的提取和处理可以是基于语义网方法与技术的,也可以是基于自然语言处理技术的。目前,前者在语义检索研究中相对更为普遍。事实上,正是由于语义网的出现与发展,才使语义检索的研究更加得以明确并发展如此迅速。

2 基于本体的信息资源检索

本体是语义网技术的核心部分,承担着语义表达的关键任务。本体在传统信息检索中的应用可促进从词型匹配到概念匹配的转变。从处理环节来看,它体现在两个方面:查询处理与文档标注及索引。

2.1 基于本体的查询处理

基于本体的查询处理包括查询消歧与查询扩展。通过消歧,明确查询的确切所指,准确反映用户的信息意图,继而通过加入与其语义相关的其他概念来实施扩展。许多研究中利用了语言本体(如wordnet),通过其所提供的词的不同义项来实现查询消歧,通过其所蕴含的同义、整分、上下位等词汇关系来实现查询扩展。支持两种处理模式:查询消歧和扩展、检索结果后分类控制。前者是系统在查询消歧的基础上将某义项的上位词或下位词加入以扩展查询;后者则是系统先以常规方式处理用户查询,再对检索结果基于用户指定的查询义项进行分析和加权。则在词义消歧的基础上,利用wordnet根据查询词义抽取子概念图来实现查询扩展。子概念图作为查询的上下文信息用于支持对由普通搜索引擎返回的初次结果的过滤,以选出相关文档。提出的查询消歧方法包括三步:首先用wordnet中的义项及同义词簇,对查询用词进行两两配对,即在固定其中一词的情况下,与另一词的所有义项进行组合,得到若干种不同的组合情况,反之亦然其次将这些组合作为提问通过altaVista进行搜索,并根据命中数对它们进行排序;最后,以wordnet中对相关义项的注释为上下文,计算排序在前的配对词间不同义项组合的语义密度,从而决定查询用词所指的确切概念。国内基于wordnet汉化而建设的中文概念词典(CCD)也在信息检索研究中得到了应用。

此外,各种自建的领域本体也被应用于查询处理。以一个有关人、地、事件、组织等的本体为基础来实现查询消歧,为每一个初始查询结果提供一个特别链接,用户通过点击这些链接来向系统确认该结果代表的概念符合其查询意图。构建了一个三层本体模型,分别为概念层(即按等级层次组织起来的概念)、语言层(即与概念对应的表达形式)、出现层(即对应于表达形式的具体字串)。在其可视化本体浏览提问接口中,用户可在本体层级体系中点击选择合适的概念。系统会自动执行查询扩展,将用户指定层级范围内的下位概念以及相关关联概念增加进来。扩展后的查询通过上述三层本体模型从抽象到具体被依次转换,最终变为由文档中实际出现的具体词汇构成的查询式。

2.2 语义标注文档的检索

语义标注文档检索的一种普遍思路是在对文档进行语义标注与索引的基础上,先进行实例检索,再据此返回所有以检出实例标注的文档信息。此外,也有其他不同方案。引入了向量空间模型,采用了基于概念级的向量空间文档表达,还设计了文档排序算法。在进行标注时以文档为单位,将其作为一个概念类的实例来进行处理。它设计了一种独特的索引和检索方法,以从文档全文和其语义标注数据中抽出的内容描述符(词)来代表文档,并建立索引记录。这样的索引可支持基于关键词或语义标注信息的检索。根据自建的历史领域本体对文档进行实例标注以构成其语义上下文信息(含概念与时间信息),并认为用户浏览的当前资源的上下文信息可代表其真实查询意图。检索时,用户首先通过传统的全文检索获得一个初始资源或自行提供一个初始资源。然后系统据此反馈该资源的上下文信息,并以嵌入文档中的链接供用户选择。当用户点击链接时,系统即将当前上下文信息作为新的查询,对其进行基于本体和规则的查询扩展,在对系统全部文档先进行过滤之后,再进行最终的检索匹配。

3 语义网资源检索

语义网是一个基于某种知识表达语言(如RFD(S)、owL等)的、机器可处理的语义网文档集合。从逻辑上看,它不再仅是一个普通文档的网络,而是一个资源(可以是各种媒介资源和现实世界中的其实对象,如人、地方、组织、事件等)及其语义关系的网络,表现为本体文档,实例数据和各种语义关系。

3.1 本体文档检索

本体文档检索旨在找到含有特定类或属性的本体文档。普通搜索引擎,如Google,可以通过指定文档类型为RDF等方法来搜索本体文档,但其根本问题是不能识别本体文档中的结构化语义标注信息,因而也无法将它们与普通文本信息区别对待。所以在检索的过程中无法将真正符合需要的本体文档与那些只是含有检索词的本体文档区分开来。这正是对本体文档进行检索需要解决的问题。

解决问题的一种思路就是对本体文档进行适用于普通搜索引擎的改造处理。就是基于这种思路,通过对RDF文档进行一定处理使其可被普通搜索引擎索引和检索,而同时又能在某种意义上发挥其语义信息的作用。它的关键技术Swangling能将语义信息编码成普通文本,并将其作为新的陈

述加入到原RDF文档中(对于以三元组表示的查询,也以相同编码方法处理,将其变为普通文本)。这样提问与文档的匹配就可以按传统的方式进行。

另一种思路则是探索新的本体搜索方法和技术。使用了本体注册的方法。注册服务器并不实际存储任何本体文档,只保存由本体服务器提供的元数据信息。同时,系统通过将本体中的元素与wordnet中的词进行匹配来构建本体摘要,并将其也放入元数据信息。这样,用户就可以从wordnet中选词来对注册服务器进行检索。采用基于GooglewebService构建的Googlecrawler来进行本体搜索。在此基础上,基于向量空间模型,采用一种概念一权重向量匹配方法来进行本体索引与匹配。也进行基于Googlecrawler的本体搜索,不同的是,系统没有独立的索引和匹配过程,而是将Google搜索与本地仓库结合起来,后者专门用于存储已搜索到的本体文档,并保存检索历史。对于已经执行过的同类查询,系统直接从本地仓库中提供查询结果,只有当一定时间内无相同查询被执行过时,才启动新的一次Google搜索。还另开发了针对某个特定网站的搜索器以及基于Jena2的搜索器。系统将从搜集到的语义网文档中抽取的元数据与原结构信息一起存入数据库。它们支持对含有某一特定类或属性的本体的查询。同时还通过定制的索引与检索引擎Sire对语义文档进行基于传统检索技术的处理。提出了另一种匹配方法,它通过Google搜索获取一批与用户查询域相关的文档,然后从这些文档中抽取一批词,并用这个词集合取代原始查询与本体文档进行检索匹配。在结果排序方面,主要有两种方法:一种是跨本体链接分析方法(cross-ontologylink-analysis);另一种则是图分析方法(graph-analysismethod)。从效果上看,前者是让更流行的本体文档排序在前,而后者则是让更相关的本体文档排序在前。

3.2 实例检索

除了本体文档外,语义网资源还有表征各类对象的实例数据。对于大多数一般用户来说,对实例数据检索的需求更为普遍。实例检索的目的是在基于本体的知识库中发现和搜集关于某一指定类的所有实例信息。尽管传统检索技术在其中也有不同应用,但实例检索主要是基于结构化查询与推理的。基于RDF(S)、owL等底层知识模型的图遍历(graph-traversal)与图模式(graphpatterns)得到了广泛的应用。用语义网数据来补充传统检索结果的这一部分就属于实例检索。其“语义网”资源包括正式的语义网文档和语义标注信息。在执行传统检索的同时,系统会针对查询概念在RDF知识库中通过图遍历搜索所有相关的数据信息。相对复杂的是将一种认知模型加入到搜索过程中,它支持用户用自然语言输入一段文字,从中抽出概念并将其作为关键词概念的上下文信息以用于检索过程。在传统关键词检索的基础上,结合了扩展激活算法,通过图遍历进一步扩展搜索与初始结果相关的更多实例信息(即使其不含查询中的关键词甚至与初始结果不是直接相关联)。在此基础上还提出了一个特别的实例相似性计算方法,并将其用于扩展激活过程中。提出了一种面向RDF(S)仓库的可视的语义检索途径。系统为用户提供可视的语义检索与语义浏览服务,其基础是底层的本体及基于本体映射得到的概念分面。在多分面视图中,用户可对系统资源有一个概括的了解,并通过点击各分面中的不同范畴概念来提交查询。语义搜索引擎通过图遍历等方法来进行查询构建与查询扩展。系统接受用户的自然语言提问,并将其解析为一组元素(包括类、属性、实例等),构建基于这些元素的图模式以作为复杂提问。隐式查询扩展也是基于类层次关系与规则而实现的。为了更好地结合传统信息检索技术与结构化查询及推理,充分利用普通文本信息与语义标注信息,一种增强的语义检索模型,基于自由文本的关键词搜索与基于语义信息的结构化查询与推理被紧密地融合在一起来实现检索目标,这种检索有利于解决集中了模糊关键词概念与结构化查询要素的混合查询问题,如“请查找由研究语义网检索的教授撰写的论文”。

3.3 语义关系检索

尽管在上述本体文档检索与实例检索中运用了各种语义关系,但毕竟没有直接以这些语义关系为检索处理对象。而概念、文档等之间的语义关系也应是语义网资源检索的重要内容之一。目前,一些研究已开始关注针对语义关系的检索问题,进行的有关语义关联检索(Semanticassociationsearch)的研究。它所关注的不仅是简单的属性链关系,更是概念间的各种复杂关联关系。研究的主要贡献是分析了语义关系检索所面临的三大主要挑战(即对关系的理解不够通用和全面、缺少以关系而非概念为对象的查询语言和系统、检索结果排序问题),并提出了相应的解决方法(将关系分为语义关联和语义相似性两类并形式化、设计了p-query以支持关系查询、基于用户指定的上下文来进行结果排序)。为检验这些解决思路,在相关研究的基础上,还在国家安全领域实现了一个名为SemDiS的检索系统。

4 结语

地理信息系统的含义篇7

abstract:thedatastructureofbasicgeographicinformationelementsisresearched,usingVBandaCCeSSdatabaseasadevelopmenttool,thebasicelementsofdatadictionaryquerygeographicinformationsystemisdesignedanddevelopedtorealizetheaccurateinquiryoffundamentalgeographicinformation.

关键词:基础地理信息要素数据字典;数据库;查询

Keywords:fundamentalgeographicinformationdatadictionary;database;query

中图分类号:p208文献标识码:a文章编号:1006-4311(2011)03-0278-01

0引言

基础地理数据要素的数据量是庞大的,仅第一部分就包含了475个数据要素,这对于测绘部门基层用户的外出携带、使用和查找都比较繁琐。为解决这些困难,我们研究和开发出了一套使用简单、查询快捷的基础地理数据要素查询系统。

1系统数据库的设计

基础地理数据要素主要分四部分内容,第一部分有要素名称、要素描述和要素分类代码,这部分的内容相对每个数据要素具有唯一性;第二部分是属性表,包含属性名称、属性描述、数据类型字段要求、属性值域或示例、约束/条件和备注,每个数据要素的属性表中都含有多项记录;第三部分为几何表示,包含几何特征、图形代码、表示方法、属性、几何表示示例和制图表示示例,其中几何特征、图形代码、表示方法和属性含有多项记录,而几何表示示例和图形表示示例具有唯一性;第四部分为相关要素、关系和备注,这三项也具有唯一性。

为了数据库的方便存储、查询,我们把第一部分、第三部分和第四部分中具有唯一性的项合并为一个表,并把要素分类代码定义为索引。其中几何表示示例和图形表示示例为图形数据,我们把这两项的类型定义为oLe对象,以二进制的方式存储在数据表中。为了方便查询我们在表中增加了“要素简码”字段,要素简码字段存储的是要素名称的汉语拼音缩写,如“大地原点”的要素简码为“ddyd”。

属性表中含有多项记录,我们为属性表单独建立了一个表,并使用要素分类代码与要素表相关联。

几何表示中的几何特征、图形代码、表示方法和属性项也含有多项记录,我们为这四项也单独建了一个表,并使用要素分类代码与要素表相关联。

2系统功能的设计与实现

系统根据需要设计了两大功能模块:录入模块和查询模块,系统功能如图1。

2.1基础地理信息要素数据字典录入模块系统需要录入三个数据库表的数据,分别是要素表的录入、属性表的录入和几何表示表的录入。

2.1.1要素表的录入。要素表的录入模块分为添加、修改、删除和存储功能。其中包含几何表示示例和制图表示示例两个图形数据,对于这两个数据需要先进行图片的扫描,形成位图文件,然后系统读入位图文件,并以oLe对象的形式存储在数据库表中,这样就可以在查询系统中调用、显示图形元素。

2.1.2属性表和几何表示表的录入。属性表和几何表示表的录入模块分为添加、修改、删除和存储功能。

2.2基础地理信息要素数据字典查询模块根据基础地理信息要素数据的特点和实际的应用情况,我们在查询系统中设计了两种查询方式:按要素简码查询和要素分类代码查询。

2.2.1要素简码查询。要素简码是要素名称的汉语拼音缩写,我们也在系统中为要素简码设计了模糊查询功能,模糊查询功能就是在查询过程中输入要素名称的汉语品音缩写的前n位,系统会把要素简码前n位为输入字符的所有要素都显示出来。

例如:输入“dd”,系统会把所有要素简码是以“dd”开头的要素都显示出来,方便了用户的选择。这种查询方式是用户的主要查询手段。

2.2.2要素分类代码查询。要素分类代码是由6位数字组成的,同样我们在系统中也设计了模糊查询的功能,例如:输入“11”,系统会把要素分类代码是以“11”开头的所有要素都显示出来,方便用户的选择。

2.2.3要素数据的输出。系统的输出方式是采用了直接调用execl的方式,把查询到的数据直接输出到execl文件中,用户可以很方便地进行数据的打印、编辑、保存和传输。

3结束语

《基础地理信息要素数据字典查询系统》是在充分、全面分析基础地理信息要素数据的数据结构,结合用户使用实际的需求而进行研究、设计开发的,也确实为基层用户在作业过程中更加快捷、高效地查询要素数据提供了方便,证实是值得推广的查询工具。

参考文献:

[1]段怡红,吕玉霞,李建利,等.《基础地理信息要素数据字典第2、3部分》编制说明[Z].国家测绘局测绘标准化研究所.

[2]GB/t20258.1-2007基础地理信息要素数据字典第一部分:1:5001:10001:2000基础地理信息要素数据字典[S].

[3]GB/t20258.2-2006基础地理信息要素数据字典第2部分:1:50001:10000基础地理信息要素数据字典[S].

地理信息系统的含义篇8

关键词:招贴设计;符号语义学;研究

20世纪的德国哲学家卡西尔给人下了一个全新的定义:“从人类文化的角度来看,符号化的思维与符号化的行为是人类生活最富有代表性的特征,可以把人定义为符号动物。”可见人类的意识领域正是一个符号的世界。而招贴设计图形视觉符号是一种特殊的符号系统,以图形和色彩以及文字为信息的载体。通过视觉符号把信息进行传播和交流,从而为企业、市场服务。

一、图形符号的基本特性

招贴设计中的图形作为一个视觉符号是平面设计中的关键,它直接影响了作品的整体效果以及深层含义同时也对招贴设计中所传达的信息有着密不可分的联系性。

1.1信息的传递者

招贴设计中的图形设计,非常直观,一目了然,比较感性。我们在“读”懂一段文字和“看”懂一幅图形之间的感受过程是明显不同的。当看招贴设计中的图形可以直观感受它的含义以及与招贴中的意境。好比一千个读者就会有一千个哈姆雷特。但我们把哈姆雷特的照片一放,他的形象特征就一览无遗了。可见图形在传播信息中占优势。招贴设计中图形的选择也要考虑它与主题的是否相符。

1.2信息的活跃者

图形传递直接有力,因属视觉传播,即可将其所代表的信息有效地投射出来。图形因在招贴设计中所占的比例大小、空间位置的不一样会导致画面的活跃指数以及受众的接受信息的程度。而语言在传递信息这一块相对弱,比如同一段文字不同的人就会有不同的感受。而好的图形设计则可以表达出含义深刻,视觉吸引力强又带给人们更深的回味和无尽的想象,揭示着情感内容和思想观念,使意念表达得饱满、形象、且有深度,可达言有尽、意无穷的效果。

1.3信息的提取者

图形形象的直观,生动准确,富有特点,比语言文字更易识别、方便人们理解记忆。因此,尽管有了文字这种沟通交流的工具,我们很多的视觉传达还是要配上图形才更能说明问题。图形在当今高度发达的信息社会中的作用显得尤为重要。周围的人们每天要面对大量的信息,如何使招贴设计的图形信息鹤立鸡群,不被信息的海洋淹没,恰如其分的图形设计将显示其巨大的效力。

1.4信息的推动者

语言文字具有民族性、地域性,各民族都有自己独特的语言,这已成为世界各族人民沟通交流的一大障碍。而图形是具有世界性的,它可以超越国家民族间的语言障碍有效推动信息的交流传播,因为构成图形的视觉元素大都源于人类的生活或生存环境,它们是相同的或相似的。但也因源于不同的生活经历,图形有时也会具有一定的民族性,从而很好的都通彼此间文化信息的传递。

二.图形的语义研究

招贴设计中图形的符号形式与语义是相互依存、辨证统一的关系。在设计创作和解读中,如果我们过于陷入纯粹的图形设计中,就可能导致削弱图形语义深刻的人文内涵,导致招贴设计的图形与社会脱离,忽视符号作为人类文化积淀的丰富信息和内涵。如果把图形混同于语义,因强调图形的形式感而弱化内涵,就容易造成招贴设计中只看到具象的图形美而忽视其招贴的深层含义以及作者的意图。实际上,图形与视觉符号所具有的语义内涵远远超过形式本身可以显现的样貌,具有深刻的历史、文化、社会和环境背景,拥有巨大的文化研究价值和发展潜力。如果我们不超越传统形式主义美学观念,重视从符号语义学的视角来认识反思我们的视觉艺术,就很难体会到视觉语言中丰富的内涵和积淀,难以真正把握招贴设计的本质含义、作者的设计目的、传播的影响力以及结果。

2.1符号语义与招贴的文化相融

一幅公共场所投放的商业招贴,如果受众看后却不知所云,不能理解作品所表达的主题,这样的作品无疑是失败的,另外,符号意义的表达必须吻合一定的历史文脉,不能断章取义地进行设计,每个时代有其特定的时代风格,设计师的设计必须依据一定的文脉,有的放矢,才能在设计的符号系统中既延续一种文化传统,又表现出不同时代的风格特征。

2.2符号语义与招贴的环境适度

符号学设计必须充分注意设计语意表达的外显性与内涵性的关系,中国古代造园设计理论中就曾明确提出过“宜设而设”的设计观。设计符号的语义表达要充分把握“度”,处理好语义表达的层次性,内外结合,形成设计语义有效的、合理的表达。符号语义的使用要符合周围的环境,使之很好的融合以避免不协调性。同时在运用的时候要把握好度,否则适得其反。

2.21符号语义的传播

设计符号系统的信息传达要适中,要有一定的信息冗余度,即除必要的信息处,还要有一定的隐含信息,以免在符号语义表达中造成信息缺乏,但是,必须注意的是,信息过分充裕也会造成符号系统内部秩序的紊乱,以致难以有效、恰当地表征符号的意义。

2.22符号语义的构建

符号形式以符号底层基础元素点、线、面为物质基础,并因为其现实空间的可视性而呈现出形状的、色彩的、材料的、位置的等等相关物质属性。它和纯粹理论上“形”的概念所具有的高度抽象性和概括性不同,是现实世界形态的具体样貌。正如阿恩海姆所指出的:“形状和形式这两个词在应用中往往被用来标示同一事物。”随着人类语言和文化的发展,被标示“事物”的内涵愈加丰富。阿恩海姆认为“所有的形状都应该是有内容的形式”,就是反映了符号形式与符号语义的关系发展和密切联系。我们在完成形式语言塑造的同时,也建构了符号语义和符号本身。

2.4小结

图形符号是图形中的具体语义单位。尽管它有自身独立的意义,在某些特定环境中也可能独立地作为“图形”特殊形式使用,但它总体上依然还是隶属于图形语言表述整体,需要和图形环境中的其他符号有机结合,才能建构图形完整的语言表述内容。

三、总结

符号语义的形成,依赖于符号形式这个物质载体,源于人类自身生存经历和文化经验的积累、延伸。图形符号形成的最初形态是以与外在事物类似、近似为原则的象形和指示。随着人类生存体验和文化积淀越来越丰富深厚,象征性图形符号开始产生并越来越丰富多元。符号语义从单纯的图像和指示作用发展到象征语言的表达,从单一符号诉求发展到组合符号创意,图形符号语言超越了传统意义的“内容”,包容了感觉、意象、概念等多层内涵,具有更广泛的意义。(作者单位:中南大学建筑与艺术学院)

参考文献:

[1]朱永明.视觉传达设计中的图形、符号与语言[J].美术与设计,2004,(1):58-62.

地理信息系统的含义篇9

关键词:环境艺术设计;城市形象;冗余信息;公共导向;识别系统

中图分类号:J50

文献标识码:a

文章编号:1003-9104(2011)05-0228-03

一、冗余信息的定义和概念

信息论是研究存在于通讯和控制系统中普遍存在着的信息传递的共同规律,以及如何提高各信息传输系统的有效性和可靠性的一门通讯理论。1948年传播学学者香农(或译申农)将信息理论运用于研究中,提出“信息”是用于消除不确定性的东西。这个定义舍弃了信息中的具体内容,而把信息仅仅看作是一个“抽象的量”。香农所提出的线性传播模式反映出信息是单向流动的,这一点也同以视觉为主要表达方式的信息导向的单向度传播方式一致。其中,影响消息传递的过程性因素有两个,一个是传播渠道的容量,渠道的容量越大,所能承载的信息越多,传达的效果就越好;另一个是噪音,噪音对信息的传达起到衰减和降低的作用。前者与信息传达效果成正比关系,后者成反比关系。为了保证意义被理解,达到理想的传播效果,传播者有必要给出比实际需要多得多的信息。这些信息往往都是“已知”或“可预计”的内容,即“冗余信息”。

“冗余信息”作为消息或讯息的一种伴生成分,主要表现为信息的重复和累加,从而使传播者的意图被准确传达,实现信息共享的目的。冗余信息与人的认知机制高度关联,人在接受信息总量一定的前提下,认知的快慢取决于必要信息和冗余信息的比例。在冗余信息理论看来,由于冗余信息是在以往信息储备即先验知识的基础传达的,因此冗余信息越多,人的反应速度就越快;相反必要信息的比例越大,人对信息的理解越慢。费斯克等学者认为,“冗余信息”的存在有助于进行精确编码和加强社会联系。在视觉表现上,赫伯特・w・卡皮茨基认为“图示是一种图像符号,它反映所描绘的形象的特征,并通过抽象化的方法来获得符号的质量”。“通过联想与周围环境、色彩组合起来。表达与图示相关的信息。”因此,图形符号具有高度的冗余性,对信息传达至关重要。iSo-tYpe的创造者奥地利社会学家、政治经济学家奥托・纽拉特提出“文字产生细分、图像制造连接”,指出图形语言即象征符号在信息传播中的作用,图形在天然上具有连接和导引的作用,同时具有表达功能、理解功能和思考功能。冗余信息也在图形符号的导引和指示方面发挥着作用。例如:公共图形符号“请勿吸烟”标志往往采用燃烧的香烟形象上被覆盖有斜线的圆圈的形象,红色圆圈表示警示,红色斜线表示禁止。尽管noSmoKinG已经明确了在此场所内的人必须要遵循的事宜,但由英文字母“n”变形演化而来的圆,红色醒目,表示警戒的意思。其中红色和圆都属于冗余信息,它们和香烟的形状结合在一起,强化图片的强制力和视觉效果。

二、公共导向标志与冗余信息

公共图形符号是人们在长期社会生活中逐渐沉淀和沿袭下来的共同认知的基础上形成的,具有直观、简明、易懂、易记的特征,便于信息的传递,设计者借用它向受众传达自身思维过程与结论,达到指导或是劝说的目的。借鉴理查・弗罗里达的《寻找你的幸福城市》中提出的观点:“将幸福城市标准的地点金字塔模型设定为五层,第一层为机会,第二层为基本服务,第三层为领导层,第四城为价值观,第五层为审美。”城市的公共导向识别系统,是将一个城市的历史沉淀和文化精神(第四层面),通过视觉化的表现――公共图形(第五层面),实现解释、指示、导向和沟通的功能(第二层面),并将一个城市的现状(第三层面的表象)与城市的未来(第一层面)有机地联系起来。因此,公共导向系统对于一个城市的发展至关重要。它能使外来访客或市民,能够便捷快速地到达目的地。可以说,越是开放发达的城市,以视觉为依托的公共导向系统越是发达,公共导向识别系统是一个城市国际接轨是否成功的重要标志。

(一)公共图形符号与冗余信息

公共图形符号以图形为主要特征,传递某种信息的视觉符号,表示地图要素的空间位置及其质量和数量特征的特定图形记号或文字。它可以指导人们的行动,提醒人们注意或给以警告等。公共导向系统中的图形符号针对的是全体社会成员,并在每个使用环节中被多次重复消费,承载着关于城市功能结构的信息和城市的人文历史信息,给人们的工作和生活带来更多的便利,对于构建我国和谐文明社会是十分需要的。如道路交通标志、消防安全标志、公共信息标志等。它必须满足清晰度、理解度、明确度三个方面的基本要求。从符号与它所指涉的对象的关联系上,符号可以分为三个层次。

1 图像符号。由模拟对象或与对象相似而构成的,借助与表达事物相似的图形形象来表达意义。在计算机领域是指定GiF格式或JpeG格式的小图标(16×16)或大图标(32×32)的文件名,这种定义说明了图形符号必须具备规范性的基本特征。如公共图形符号中的飞机、巴士、出租车、风景区等符号设置。图像符号的直观性和相形性,对图像的理解与已有储备的基础知识有相当大的相关性,使该符号体系能直接迅速地被辨认和识别。

2 指示符号。功能如同图书馆的查询目录,它借助时空上的逻辑因果关系,具有鲜明的指向。如指针符号、箭头符号、路标符号等,在公共图形符号中最为常见的是不同朝向的箭头符号,意指信息目的的不同导向。通过对指示性符号元素的增加,可以赋予它他更多的意义。如箭头增加了开放性的边框,意为出口;箭头增加门和跑动人的形状,说明该标志指向安全出口。

3 象征符号。指某种抽象的概念或思想的形象传达,借助图形、图像来传达象征的意义。符号与指涉的对象,无必然的或内在的联系,是约定俗成的结果。观念性、世俗性在象征符号中体现明显。如碗和筷子的组合出现是中餐的标志;刀叉的组合是西餐的标识。此类符号体系在承担情感和民族习俗方面的功能尤为突出,并往往依赖于具体环境的解释。在公共导向符号领域,象征符号较多地使用了冗余信息,为了实现抽象意义的表达,很多情况下,象征符号往往将两个或以上的图像符号或图像、指示符号组合,常以人为图形主体,通过增加其他的图形来体现公共图形所要表达的意义。

公共导向符号作为一种空间语言的存在,具有可视性和可读性双重属性,具有高度的信息冗余度。图像符号模拟事物的形状,人可以与现实的形象自然联系起来解码,起到“形”的认知作用。指示符号起引导作用,象征符号是事物的社会信息的载体,如礼品的符号模拟了丝带的形状,意指物品赠与

关系。

(二)形状、色彩与冗余信息

尽管压缩或环境影响产生噪声会图像发生变化,人的视觉系统在对图像做的编码和解码处理,诸多变化并不能为视觉所感知,则仍认为图像足够好。通常视觉系统的分辨能力约为26灰度等级,而一般图像量化采用28灰度等级,这种信息量的级差被称为视觉冗余。视觉冗余是非均匀和非线性的。眼睛对亮度变化敏感,而对色度的变化相对不敏感;在高亮度区,对亮度变化敏感度下降;对物体边缘敏感,内部区域相对不敏感;对整体结构敏感,而对内部细节相对不敏感。根据这些视觉特性对图像信息做技巧性取舍,决定了信息传播的效果。

在图像中重复出现或相近的纹理结构,会产生明显的图像分布模式,构成某类标志在结构上的冗余。例如:为实现公共图形符号传达信息的功能,采用最容易被认知和理解的正方形“口”表示提示和安全;三角形“”表示在交通标志中坡道、转弯、道口等注意标识;圆形“”表示禁止、注意、危险等。在公共导向识别系统中,通过某些场景定的结构形式,造成某类信息的整齐划一的表达方式,方便对同类型信息的快速准确的理解和认知。

在公共导向识别系统中,利用色彩的冗余信息使标志更加容易被解码。源于人类对自然界虎豹与毒蜂恐惧本能的遗传,黑黄相间色彩用来表示危险事物的标准。同样道理,红色含义为停止、危险,用于消防设施;橙色含义为警告,意指机械或电子组件中能碾压、切割或撞击的危险部分;黄色含义为注意,意指可能发生反倒、掉落、撞撞倒或能导致以上问题的非移动物体产生的物理危险;绿色意为安全,用于提示和导向,指与急救有关的区域或设备;蓝色含义为信息,用在信息标识和公告板上;黑白相交含义为界限,指家政或交通区域。

三、冗余信息的应用――地铁路径寻找

在图形符号领域,“冗余信息”使跨国界、现代化的传播与沟通更为简便和直接,并对公共导向识别系统中五个关键维度:路径、边界、区域、节点以及地标方面同样具有指导意义。在这里“易读性”用来表示路线可被沿行的建议程度。最佳的“易读性”是以点带面的路线引导方法。其中“点”表示地点,出发地、目的地、岔路口等关键节点;“线”引导人从此地到达彼地;面是大量类似信息的集合,并由此产生的社区、行政区、商业区等城市功能的划分。在图形辅助下,增加道路决策点的引导标示、图形和方向标等清晰度,实现在抽象的、虚拟的和概念性的环境中辨明方位,使乘客的出行更为便利。

以城市现代化的重要标志地铁为例。在功能上讲,地铁是现代城市最重要的交通枢纽之一;在意义上讲,地铁是一个城市精神风貌的象征,我国城市建设对此十分重视。由于地铁多数是由地下通行的轨道连接城市的各个部分,由此产生的问题就是,很多乘客会因为失去地面标志性建筑物的参考而丧失方向感。因此,在地铁内部以及周边的视觉引导是必要的。对于地铁导向系统的信息设计来说,隐含标识本体支撑结构的存在感,突出标识传达的指示意义,使标识本身与环境协调和融合是设计成功与否的重要问题,应从结构、材料、色彩各个方面充分考虑。地铁导向系统分为地上导向部分、地下导向部分、换乘点导向部分。由于现阶段我国并无地铁公共图形系统的标准出炉,多数地铁仍沿用现有的标准公共图形(国家标准局制定),个别图形(如扶梯)借鉴国外和欧洲标准。

地标既要重视一般功能性信息的传递,又要传达该城市的文化内涵和鲜明突出的艺术形象特征,将该城市的景深用二维图像生动地表现出来。因此需要更多的创新性和独特性。地标往往可以成为更突出城市形象的重点。地上导向部分告知乘客如何从地面道路寻找到地铁入口。展示内容为地铁标志,挑高3米以上,确保乘客在较远处就能看到。我国地铁标志设计实现了地域风貌和公共图形标准化二者的统一。如,北京的地铁标志外形采取圆形,以轨道的首字母“G”构成,示意地下的隧道,线条庄重大气。中间部分是轮廓为字母“D”,内心有字母“B”,三者构成“北京高速电车”的缩写,符合目前世界各国地铁标志设计中简练、含义准确和几何化的趋向,具有现代感。上海地铁用上海拼音首字母s包围地文首字母m(metro)彰显现代化大都市的风貌,英文的应用使之最为贴近国际标准。南京地铁秉承“博爱博雅”的市民精神,并用精神的物化――梅花作为标识的主体,中间为圆形的m,充分显示南京特色。地上导视部分主要使用旗帜形标志和柱形标志,旗帜型标志多为指引和诱导,标志地铁的方向。柱形标志应用较多,多用于地铁入口处,起提示作用。

地下导向部分告知行如何进入地铁轨道系统、在候车区等候、乘车方法,以及出站的路径。在地铁路线搜寻中,人们普遍存在着查找、阅读和判断的动态行为。“一个图示即处于符号链中的符号,需要与系统中其他的图示结合起来进行完整的理解,这样一个独立的图示对于受众才是可视和可理解的。整个传播过程具有了动态性、互动性和交互性等特点。”为克服标志适合表现具体的事物,但不适合表现过程和行为的缺陷,大量重复使用箭头创建后一幅图像与前一幅图像之间的相关性,实现乘客按照图像序列中的两幅相邻的图像寻找路径,实现公共导向识别系统的指示功能。在物料的使用上,地铁导向系统用悬挂指示牌、地贴指明换乘和方向;橱窗、综合性信息牌,与入口标志相对应。通过对沿线所有图形符号的标准化设计,实现图形设计风格、图形要素、图形寓意、大小和比例的一致性,确保标识导向系统、标准化的实现。考虑到步行时线性思维特性,标识按照持续且单一的方式放置,会使人们较快地找到自己的道路。

地理信息系统的含义篇10

 题   目  浅论会计电算化下的企业内部控制         

 

目录

标题:浅论会计电算化下的企业内部控制………………………………4

1.会计电算化和内部控制的含义……………………………………………………4

1.1会计电算化的含义……………………………………………………………4

1.2内部控制的含义………………………………………………………………5

2.会计电算化对内部控制的影响……………………………………………………5

 2.1内部控制形式的变化…………………………………………………………6

 2.2存储介质的变化………………………………………………………………6

 2.3内容控制的范围变化…………………………………………………………6

 2.4交易授权的变化………………………………………………………………6

3.当前会计电算化下企业内部控制存在的主要问题及原因分析………………7

 3.1兼容性差………………………………………………………………………7

 3.2系统内部衔接性差……………………………………………………………7

3.3数据保密性、安全性差………………………………………………………7

3.4财务网络化带来的问题………………………………………………………8

 3.5数据处理方式变化带来的问题………………………………………………8

3.6会计信息磁性化带来的问题…………………………………………………8

 3.7用户本身存在的问题…………………………………………………………9

4.加强和完善会计电算化下企业内部控制的对策………………………………9

 4.1制度控制………………………………………………………………………9

  4.1.1组织与管理控制…………………………………………………………10

  4.1.2系统日常操作管理控制…………………………………………………10

  4.1.3档案资料控制……………………………………………………………11

  4.1.4法规、准则制度控制……………………………………………………11

4.1.5监督机制控制……………………………………………………………12

4.2程序控制………………………………………………………………………12

4.2.1输入、输出控制…………………………………………………………12

4.2.2处理过程控制…………………………………………………………12

4.2.3系统安全控制…………………………………………………………12

4.2.4系统维护控制…………………………………………………………13

4.2.5强化风险意识…………………………………………………………13

4.2.6加强内部审计…………………………………………………………13

4.2.7人员控制………………………………………………………………13

4.2.8.网络的安全控制………………………………………………………13

参考文献……………………………………………………………………………15

 

【内容摘要】:由于计算机在会计信息系统中的广泛应用,它改变了会计数据的处理方法和存储方式,并且也改变了会计工作的组织。这样,传统的手工会计内部控制制度在多数情况下已不适用于新形势下的计算机会计处理系统,会计电算化的广泛应用,给会计数据的安全性造成了极大威胁,使会计电算化内部控制更加复杂化。企业为了保证会计数据的正确、完整和可靠性而制定的一系列制度、措施和方法,是保证会计数据处理质量的基础,也是会计电算化审计的前提。内部控制是单位为提高会计信息质量,保护资产的安全和完整,确保有关法规和规章制度的贯彻执行而制定和实施的一系列控制、办法和程序。内部控制制度作为企业受托者实现其经营管理目标,完成受托责任的一种手段,在企业内部管理监控系统中起着举足轻重的作用。建立和完善我国内部控制制度对提高企业管理水平、防止错误和舞弊、保护投资者的合法权益并保证资本市场有效运行具有重要的意义。近年来,我国十分重视对内部控制的,并了一系列规范和指导意见,促进了单位内部控制会计毕业论文的建立和完善。但是,会计电算化的发展又给内部控制带来了新的问题和挑战。本文主要分析会计电算化对会计业务内部控制的影响,并以此为基础探讨关于电算化会计信息系统环境下的内部控制建设问题,以确保企业实行会计电算化后,系统能够正常、安全、有效地运行。

 【关键词】会计电算化;内部控制;影响。

一.会计电算化和内部控制的含义

(一)会计电算化的含义

会计电算化是将以计算机为主的当代电子信息处理技术应用到会计中的简称,基本含义是指将电子计算机技术应用到会计业务处理工作中,应用会计软件指挥各种计算机设备替代手工完成,或手工很难完成,甚至无法完成的会计工作的过程。将计算机理论和技术、信息管理理论和技术与会计理论和实务相结合,用计算机代替手工记账、算账、报账,实现对会计数据收集、存储、传输和各种加工处理的自动化,以及辅助管理人员利用会计信息进行的管理、分析、预测和决策的全过程。

(二)内部控制的含义

1.所谓内部控制制度即指各级管理部门在本单位、本部门内部因分工而产

参考文献]

[1]杨公文;会计电算化内部控制存在的问题及对策[j];北方经贸;2007年09期

[2]刘春晖;基于会计信息管理的内部探讨[j];当代财经;2006年08期

[3]刘俊宇;网络环境下的会计业务流程重建[d];西南财经大学;2005年

[4]宰华东;刍议会计电算化的发展趋势及其完善[d];吉林大学;2005年

[5]李旻;it环境下会计信息系统内部控制机制研究[d];武汉大学;2004年

[6]吴军海;我国会计电算化的现状、问题及对策[j];长春师范学院学报;2004年02期

[7]周保军,王中兴,崔春玉;浅淡会计电算化存在的问题及对策[j];农业与

技术;2004年02期;147-148

[8]李军毅,范毅卿;会计电算化安全问题的探讨[j];科技广场;2004年1

-->1期;100-101

[9]潘东高;网络环境下会计理论和方法若干问题研究[d];武汉理工大学;2003