语言服务业概念十篇

发布时间:2024-04-25 20:01:45

语言服务业概念篇1

关键词关键词:制造资源;模型;概念;本体;网络本体语言

DoiDoi:10.11907/rjdk.162017

中图分类号:tp301

文献标识码:a:1672-7800(2016)008-0004-02

0引言

当今信息化浪潮中,以计算机技术、自动化技术和互联网技术为代表的信息技术在制造行业应用广泛。制造技术与网络技术、智能技术不断融合,制造模式呈现智能化、网络化和协作化趋势。制造业全球化使得制造企业更迫切希望加强合作,共享制造资源。不同企业采用的制造资源描述方法不完全相同,使得制造资源数据呈现出分布性、异构性、多样性、复杂性等。在企业之间共享资源的需求下,传统的制造资源模型已经不能满足如此复杂多样的数据形式,需要建立一个统一的制造资源模型。本体具有很强的表达能力,能有效描述制造资源的概念以及概念间的关系,使用本体来描述统一制造资源可以帮助达到制造资源共享。本文主要研究制造资源本体建模方法。

1制造资源分类

制造资源可以分为狭义制造资源和广义制造资源,狭义制造资源主要指加工一个零件所需要的物质元素,是面向制造系统底层的制造资源;广义制造资源是指完成产品整个生命周期的所有生产活动的物理信息及技术要素物的总和,包括设计、制造、维护等相关活动过程中涉及的所有软硬件元素[1]。制造资源的分类是构建模型的基础,须按照统一的标准和形式进行描述,将有共同属性的资源划分为同一类别。传统制造业将制造资源简单分为人力资源和生成设备两类,在当今科技日新月异快速发展的时代,人们对制造资源的认识和理解要复杂和深刻得多。本文按照制造资源的属性和应用方式,将制造资源分为8类[2](见图1),具体如下:①设备资源:产品生产环节中各种制造、加工和运输设备;②人力资源:生产活动中各类人员,如管理人员、操作工人和设计人员等;③软件资源:企业管理和产品设计生产过程中各类软件,如办公软件、pRo/e等;④服务资源:产品生命周期里各种相关服务,如物流服务、培训服务等;⑤知识资源:产品生命周期中涉及到的各种研究机构、专利和市场信息等;⑥计算资源:生产活动中使用的计算机等相关硬件资源;⑦物料资源:产品生命周期使用到的原材料、能源等等;⑧除上述类别外的其它资源。

2制造资源建模方法

有研究使用状态图来描述制造资源,方法描述能力有限,没有被推广使用。面向对象的建模方法使用较多,该方法将客观世界中的事物抽象为对象,使用对象的属性来描述对象,属性的取值范围定义作为值域,用类的操作描述对象的功能[3]。基于本体的建模方法和面向对象的方法有一定相似之处,但本体更便于描述某领域中的概念和概念之间的关系,并且能够处理制造资源中具有逻辑关系的概念,所以本文采用基于本体的建模方法。

3本体建模

3.1本体的定义

本体(ontology)指事物本身,原来是哲学上的概念。目前被广泛认同的定义是“本体是共享概念模型的明确的形式化说明”[1]。包括以下几层含义:①共享:本体不是面向整体,其是共同认可的概念,是公认的知识的集合;②明确:本体中明确定义了使用的概念和概念的约束;③概念化:本体中的概念模型是客观世界抽象出来的,其与具体环境没有关系;④形式化:本体是计算机方便处理的。

本体可以定义为一个五元组o=(C,R,p,a,i),其中o代表本体,C(Concept或Class)表示概念或类别,R(Relations)表示关系,p(property)表示属性,a(axiom)表示公理,i(instances)表示实例[2]。

3.2本体描述语言owL

网络本体语言(webontologyLanguage,owL)是由w3C提出的一种本体描述语言,owL基于XmL/RDF等标准,并且与其它多种本体兼容,具有很强的语义表达和推理能力。另外,owL可以利用流行的本体描述工具protégé来描述制造资源本体,使用非常方便。owL定义了3种表达能力不同的子语言:owLFull、owLDL和owLLite,其中owLFull的表达和推理能力最强,owLDL适中,owLLite最弱。owLDL中的DL指的是描述逻辑(DescriptionLogic),其知识库是基于知识表示的一阶谓词逻辑的可判定子集。而DL与owL之间有着对应关系,如DL中用于描述概念关系的公理集tbox和描述个体实例的断言公理集abox分别对应着owL中的公理和事实,DL中的概念和角色分别对应owL中的类和属性[3]。owLDL已经能够完成制造资源本体需要的语义表达和推理服务,因此owLDL已经成为制造资源表达的首选语言。不作特殊说明情况下,以下提到的owL语言均是指owLDL语言。

3.3本体建模步骤

本体建立主要包括以下几个步骤:①明确资源本体要覆盖领域的范围;②收集资源本体领域范围内的知识(定义、术语、属性及关系),并对制造资源概念划分类别与层次,形成资源本体框架,使用本体建模语言对本体形式化描述[1];③初步评价构建本体模型的一致性、完备性和清晰性;④检验和完善本体模型[4]。

4owL实例描述

4.1机械零件分类

本文以机械零件资源为例构建一个基于owL的资源本体,如图2所示。第一层次:按照机械零件的功能、用途分为模具行业零件、能源机械零件和机械标准件等;第二层次:按照机械标准件的属性和功能分为传动件、紧固件、轴承和法兰等;第三层次:将轴承功能及工作原理分为滚动轴承和滑动轴承;第四层次:将滚动轴承的结构特性分为推力球轴承、深沟球轴承和向心轴承等。如此划分层次清晰,结构完整,便于下一步概念本体模型的构建。

4.2制造资源概念本体模型构建

制造资源属性是描述其概念本体的重要信息,根据资源的属性特征抽象出描述制造资源的概念信息。图3是双列深沟滚动轴承的属性信息图,可将其属性进行分类,以更清晰描述概念。图4描述了双列深沟滚动轴承的属性和部分概念间的关系。

4.3基于owL的表示实例

以“双列深沟球轴承”为例,基于owL描述制造资源的方法。

(1)定义双列深沟球轴承类

上面代码用subClassof表示继承关系[5],这里描述“双列滚动轴承”是“深沟球轴承”的子类,二者有继承关系,图形上看是一种层次结构。

(2)定义数据属性。

以上代码用Dtatypeproperty表示了“生产厂商”是“双列深沟球轴承”的一个属性,其数据类型为string。

5结语

本文按照制造资源的属性和应用方式,将制造资源分为8类,简要分析了制造资源的几种建模方式,指出基于本体的建模方式的优势。介绍了网络本体语言owL,并以机械零件中的双列深沟球轴承为例,使用owL构建本体模型。建立的本体模型能有效描述制造资源,为优化企业内部资源结构以及企业间共享制造资源奠定了良好的基础。

参考文献参考文献:

[1]魏军英,钟佩思,郭春芬,等.基于owL的制造资源本体建模[J].山东科技大学学报:自然科学版,2011,30(1):58-61.

[2]朱李楠.云制造环境下资源建模及其匹配方法研究[D].杭州:浙江工业大学,2014.

[3]党亚洲.基于本体的机械零件资源库语义检索研究与应用[D].乌鲁木齐:新疆大学,2015.

语言服务业概念篇2

关键词:翻译产业;前景;上海世博会

中图分类号:H059文献标志码:a文章编号:1673-291X(2012)16-0244-02

一、翻译产业概念

对于“翻译产业”的概念及范畴目前还没有一个明确的标准。朱宪超(2005)认为,广义的翻译产业指“与翻译相关的经济活动的总称”,狭义的翻译产业指“以翻译的语言、文字或手势为载体的服务或产品”,即“翻译服务产业”[1]。

从经济学角度上说,翻译产业(translationindustry)是“翻译+产业”的结合体,它既具有“产业”概念,又具有翻译行业的特点。参照中国对产业的划分(即第一产业、第二产业和第三产业),翻译属于服务产业,属第三产业范畴。尽管国家统计局印发的《文化及相关产业分类》未将翻译列入其中,但已将文化及相关产业概念界定为:为社会公众提供文化、娱乐产品和服务的活动,以及与这些活动有关联的活动的集合。对照这一定义,“翻译产业”可以定义为:为社会公众提供语言或文字翻译产品和服务的活动以及与这些活动有关联的活动的集合[2]。

二、翻译产业范畴及结构

“翻译产业”不仅包括翻译公司提供的翻译服务(含同声传译、翻译培训及翻译技术等),还包括文化产业与信息产业中以纸质、网络或影音等为媒介的对外文化交流或对外信息内容传播等。广义上翻译产业的范畴是开放的,其内涵或外延会随着社会的进步,特别是新技术革命的到来而不断地延伸。狭义的“翻译产业”指翻译公司所提供的翻译服务产业,以翻译活动在社会经济中的价值得到了体现为标准,以译出的服务或产品为载体,主要包括口译(同声传译和交传)、笔译、手语翻译、计算机辅助翻译和机器翻译等。

翻译产业可以分为三个层次,即核心层、边缘层及相关层。核心层指的是传统的人工翻译服务,它包括笔译、口译和手语翻译;边缘层即指以翻译服务为主体或目的,需要借助于计算机技术来实现的产业,也称人机结合,包括软件和网页的本地化、计算机辅助翻译和机器翻译等。翻译产业的相关层指其他与翻译相关的活动,如翻译培训,图书翻译,影视作品翻译,翻译软件或翻译机器的研发、生产或销售,多语言语音技术相关产品的研发、生产或销售等以研发、生产或销售其他产品为主导的一系列活动。

翻译是在人类互动过程中,将口语或文字在不变更原文意思之前提下,将自然语言转换成另一种自然语言的活动及过程,由此衍生出四种翻译活动形态,即口语翻译(包括同声传译),文字翻译,手语翻译和机器翻译。这四种翻译活动的最终产出为以语言或文字形态呈现的翻译服务,参与翻译的最终产品及其相关产品的生产者,翻译公司和同声传译构成了翻译产业的主体。

三、中国翻译产业发展现状

在全球经济一体化的时代、尤其是随着国际国内市场交流与融合步伐的加快,中国翻译市场正以前所未有的速度迅猛发展。根据aBi(alliedBusinessintelligenceinc.)的统计报告,2003年全球年翻译产值超过130亿美元,亚太地区占30%,中国大陆市场约为127亿元人民币。2005年世界翻译市场的规模达到227亿美元,中国大陆翻译市场规模为210亿元人民币,中国翻译市场需求正面临着急剧膨胀的趋势,翻译产业正作为一支新兴的生力军登上中国的经济舞台。随着中国改革开放的不断深入,中国与世界各国在政治、经济和文化上的交流正变得日趋频繁,同时,国内基础建设和投资环境的不断改善,大批外国投资商将目光转向中国,使中国的对外经济合作达到了前所未有的高峰。特别是中国加入wto,成为国际经济大家庭中的一员,2008年北京奥运会和2010年上海世博会的成功举办,为翻译产业的快速发展注入了新的动力,同时昭示着中国翻译产业迎来黄金发展期。据有关部门统计,中国有各种经济成分组成的翻译公司近3000家。以咨询公司、打印社等名义注册而实际承揽翻译业务的公司更有数万家之多。以北京为例,根据北京市工商局企业登记注册处资料显示,全市1998年以前以翻译公司、翻译中心或翻译社的名义注册的企业有109家,1998年以后注册的公司79家。而实际上北京现有400多家公司从事翻译业务,同时涉及旅游、公证等咨询服务领域。目前国内(除台湾、香港、澳门)有注册翻译公司263家,其中在北京的约占37%,在深圳的约占14%,广州、上海各占6.4%左右,南京的约占4.6%[3]。

翻译公司的服务种类和方式日益繁多,包括人工翻译、机器翻译、翻译软件以及网站点的地方化等。如今,翻译行业得到了许多知名企业的关注,形成了规模化的发展优势。翻译服务市场年产值迅速攀升,2003年为110亿元,2005年为200亿元,2007年则达到300亿元,2009年则达到400亿元。

近年来,翻译已经从原来的政府和事业单位、科研机构的工作发展成为专门职业。翻译服务作为新兴的现代服务产业,正成为文化经济中仅次于教育行业的第三大文化产业。

四、上海世博会给翻译产业带来巨大发展机遇

语言服务业概念篇3

摘 要:词性作为划分词类的依据一直是信息处理中一项重要的知识属性。但是,词类更多地偏重于词语在句子中的语法功能,而忽略了词语意义对句子分析的作用,语言信息处理需要更有效、更细致的词语分类。为此,本文引入概念类别的信息,并且展示其在汉英机器翻译中的应用。通过具体描述给出概念类别及其与词性的对应关系,指出概念类别可划分为抽象概念和具体概念两大类型,抽象概念中又包括动态概念、静态概念、属性概念和逻辑概念,并对概念的所指及应用做出了描述。随后,本文对概念类别与词性的关系和差别做出了解释,并给出了概念类别与词性的对应关系。最后,本文描述了概念类别信息在汉英机器翻译中的具体应用,指出概念类别在汉英机器翻译的分析模块和转换模块(如小句转换、eg识别、格式转换和辅块识别等)中均发挥着重要的作用。

关键词:词性概念类别机器翻译

一、引言

词性作为划分词类的依据一直是信息处理中一项重要的知识属性。在词语处理乃至句类结构分析中占有重要的地位。不过,词类更多地偏重于词语在句子中的语法功能,而忽略了词语意义对句子分析的作用,并且词类划分的标准过于粗略,未能从细节上对词语进行描述和区分。在语言信息处理中,对语言现象的分析和研究需要更有效更细致的区分,为此,HnC引入了词语的概念类别的信息。在概念类别中,不仅包含了词类的信息,同时还融入了语义的分类信息,并且构建了汉语词语知识库,对概念类别信息进行了标注。

在汉英及其翻译中,我们对概念类别与词类进行了对照,在源语言(汉语)分析阶段采用词类信息,并将词类信息中的关键类型LV概念作为句子分析的激活点,辅以相应的分析规则,完成目标语的分析。在目标语(英语)生成阶段,由于英语的形态特征比较明显,我们使用词性作为生成的依据,辅以相应的转换生成规则,完成目标语的转换与生成。

本文的工作已经应用于汉英专利文献机器语义翻译引擎中,作为语义翻译引擎的重要基础,发挥着支撑作用。经过测试,语义翻译引擎在小句转换、eg识别、格式转换、辅块识别、并列结构识别中都有很好的应用效果,使得这些部分分析处理的正确率能够达到80%以上。

二、相关工作

概念层次网络理论[1]是一种服务于语言信息处理的关于语言的语义处理理论,自该理论产生之初,就已经提出了概念类别的划分方法,用以丰富单纯以词性作为划分词语的标准。

《HnC理论(导论)》[2]中,列出了概念类别划分的具体类型,并配以实例说明。但是概念类别的表述过于繁琐,且未对概念类别进行广义和狭义的区分。

长期以来,基于HnC理论的研究一直将概念类别作为重要的知识属性加以利用,在句类分析系统中,LV概念已经作为句类分析的激活点服务于句子结构的判断和语义块边界的辨识[3]。例:但这些信息未能直接在应用系统中进行检验。

概念关联知识是指概念节点、概念集群、概念类别之间关联性的各级类别表现。这是一张非常烦琐而脉络分明的关系网,其内容构成了概念关联知识库。

这些研究和应用都是在一种语言范围之内,尚未涉及到两种语言之间的对应问题。

张克亮[4]基于HnC理论开展了面向机器翻译的汉英句类及句式转换研究,探讨汉英句类及句式转换的一般性规律。李颖[5]研究了HnC机器翻译中语义块构成变换问题。

这些研究也仅停留在理论研究和构想阶段,对概念类别的描述仅是理论层面的,而且是片面的。对概念类别和词性之间的关系并未做具体的考察和对应,也未能对概念类别和词性两种信息在实际应用中的表现做出清晰的比较和判断。

本文集中于语义知识库中概念类别知识属性的研究,目前语义知识库已经包含了5万常用词语的知识,覆盖了500篇专利文献。另有30万专利领域词库,共计35万条词语。知识库服务的对象主要是汉英专利机器翻译系统。文本为说明概念类别而举的例子也都来自专利文献。

三、广义概念类别与狭义概念类别

本文的研究是建立在汉英机器翻译应用的基础上,所得的研究成果直接应用于汉英专利机器翻译的实际中。概念类别作为知识库中一项重要的知识属性,对其的标注直接得到翻译系统的检验,根据调试过程中反馈的结果对知识库进行修改和调整,做到知识库和翻译系统同步更新,极大地提高了翻译系统的性能。

概念类别是表述概念的语义类别特征的符号。概念类别是关于词语的概念意义和语用特征的最简明知识,是语句理解处理过程中首先要用到的知识,是进一步调用其他知识的激活信息。

我们根据词语在汉英机器翻译具体应用中的表现,对概念类别进行了重新的调整和分类。首先,我们把概念类别划分为广义和狭义两大类,以服务于不同层面的语义分类需要。

(一)广义概念类别

广义概念类别是对词语语义信息的广义概括,可以看作是对词语语义的一级分类。分为人(p)、物(w)、静态概念(G)、动态概念、属性概念和逻辑概念六大类型。

概念是思维的基本形式之一,是人类在认识过程中把所感觉到的事物的共同特点抽取出来,加以概括而形成的。HnC首先把概念分为抽象概念和具体概念。抽象概念和具体概念是概念的两大分野,这一划分对知识表示具有非常重要的意义。具体概念可以分为人和物两大类(对应于名词),抽象概念可以分为动态概念(对应于动词)、静态概念(对应于名词)、属性概念(对应于形容词和副词)和逻辑概念(对应于虚词)四类。这些概念类型共同构成了广义概念类别的整体。见表1。

在知识库中,语义知识属性表示为Feature[Value]的形式,Feature表示知识属性名称,Value表示属性的取值。广义概念类别用GCC表示,如人员的广义概念类别是人,则表示为GCC[p];提供的广义概念类别是动态概念,则表示为GCC[V]。

(二)狭义概念类别

狭义概念类别是对词语语义信息的具体分类,概念类别的基元经过组合,可以构成复合型概念类别。这样,广义概念类别就可以细化为很多具体的概念小类,用以解释概念之间的细微差别。在汉英机器翻译应用中,我们共定义了41种狭义概念类别,相比汉代汉语13种词性的分类[6],更加细化。

1.具体概念

在广义概念类别中,具体概念包括人和物两大类。在狭义概念类别(以下简称概念类别)中,我们把物又分为两小类:自然物ww和人造物pw。用以区分该物的形成是否有人类活动参与,这一信息对于句子中谓语动词的语义角色选定具有重要的限制作用。

2.抽象概念

抽象概念在广义概念类别中划分为动态概念、静态概念、属性概念和逻辑概念四类,每一类又可分为若干小类,这就是狭义概念类别(CC)。下面分别描述。

(1)动态概念

动态概念是抽象概念五元组特性之一。抽象概念需要从动态、静态、属性、值和效应五个侧面加以表述,这就是抽象概念的五元组特性。在狭义概念类别中,动态概念分为“v”和“vv”两小类。

“v”是一般意义上的动词,如“提供”“公开”等。

“vv”是动词中的特殊小类,用以描述后面须接动词的“v”,如“试图”“进行”“予以”等。这些词语本身具有动态含义,但在句子中不能单独作为谓语,必须在其后补充一个动词共同构成谓语部分,后面的动词才是谓语的中心。vv类词语作为谓语的一部分出现在句子中。

(2)静态概念

静态概念是相对于动态概念而言,我们可以把它看作抽象概念中的名词类。包括:静态概念g、值概念z、效应概念r、时间概念j1、空间概念j2、数j3、名量概念zz、动量概念zzv、综合概念s。

可以这样认为,g是一般的名词,而z和r是从名词中分离出来的。z表达的是概念的“值”,对值的表达是与数量密切关联的,因此把这个特性独立出来表达显然有利于联想脉络的建立。例如:

(1)厚度为0.3毫米的白色人造纤维布料(0.3millimeterwhiteartificialsilkcloth)

在这个短语中,汉语中“厚度为0.3毫米”是一个小句形式,作后面中心语的修饰成分,翻译为英语则是一个定中短语的形式。这种汉英结构上的转换只靠词性来区分是不够的,必须做进一步限定,汉语小句的结构是“z+为/是+j3+zz”,也就是说,在这个是字句中,主语由值的概念充当,宾语由数量概念充当。如果这样的小句结构做定语,那么转换为英语时,直接变为“j3+zz+z”的结构,也就是数量短语直接修饰值概念,放在值的前面。

g和r都是静态表达的名词,但分别代表因果两极。把两者区别开来,有利于概念的局部联想。

时间概念j1、空间概念j2和数j3都源自于基本概念语义网络,这些概念类别主要服务于时间短语、空间短语和数量短语的辨识。

综合概念s高度抽象的一类概念,主要服务于辅语义块后边界的辨识和包装句蜕的包装品(小句的部分)。如:

(2)含水涂料组合物可以通过浸涂或辊涂的方式来施加。(theaqueouscoatingcompositioncanbeappliedbydipcoatingorrollcoating.)(辅块)方法

(3)因玻璃渗漏或结构缺陷而失效的时间将推后。(thetimetofailureduetoglassleaksorstructuralweaknesswilloccurlater.)

例句(2)中,“通过浸涂或辊涂的方式”在句子中做辅语义块,“方式”一词位于辅语义块的末尾,作为辅块和其后面的特征语义块(谓语部分)划分的边界。静态概念的分类及与词性的大体对应关系可如下表:

(3)属性概念

属性概念是修饰限定成分。大体上对应于词性中的形容词和副词。属性概念与被修饰限定成分之间的对应关系更为具体明晰。依据被修饰限定成分的不同,可以进一步分为若干小类,将形容词类属性二分为修饰具体概念的属性x、修饰抽象概念的属性ug和可独立做谓语的u属性;将副词类属性二分为修饰动态概念的属性uv和修饰属性概念的uu属性。具体如下:

x:是具体物的物性,修饰限定名词性具体概念人(p)和物(w),对应于形容词。如:“白色”的概念类别是x,所修饰限定的成分一定是具体物。可组合成白色光(whitelight),白色颗粒(whiteparticles)等。

ug:静态概念的修饰性成分,修饰限定静态概念g、值z、效应r、综合概念s及时空概念等,对应于形容词。

u:独立的属性,用于描述可以独立作谓语的属性,也就是说,具有该属性的形容词类概念可以构成形容词谓语句。在英语语言中,也就是该类属性可以充当系表结构中的表语。这对汉英句式转换具有重要的指示作用。

uv:动态概念的修饰性成分,修饰限定动态概念v,对应于副词。

uu:描述属性的属性,修饰限定属性成分ug、u、uu、x等,也可以修饰限定动态概念。

属性概念的分类及与词性的大体对应关系可如下表:

(4)逻辑概念

逻辑概念是HnC语义网络中的一类重要概念。用于语言单位的组织与连接,大体相当于虚词。按语义及功用可分为语言逻辑、语法逻辑和基本逻辑。

1)语言逻辑

语言逻辑服务于语义块的整体辨识、语义块内部构成的分析及句间信息的提示和表达。具体如下表:

语言逻辑概念根据其在句子中所充当的作用及所处的位置,分为12小类。其中l0-l3服务于语义块的整体辨识,用来识别句子中主辅语块的前后边界。例如:

(4)使用者将某操作系统308安装到计算机310中。(auserloadsanoperatingsystem308intoacomputer310.)

这里“将”的概念类别是l0,由它把两个主要语块“使用者”和“某操作系统308”分开。

L4-l5作为语义块内部逻辑组合符号,服务于语义块内部构成的分析,用来连接词或短语片段,组成一个语块。例如:

(5)依照本发明的文档处理系统主要包括应用软件、接口层、文档库系统和存储设备。(thedocumentprocessingsysteminaccordancewiththepresentinventionincludesanapplication,aninterfacelayer,adocbasemanagementsystemandastoragedevice.)

这个句子中,“包括”的各对象之间通过顿号和组合符号14“和”连接,共同构成宾语。

同样道理,L6-l7服务于特征语义块的内部构成,l8服务于辅语义块的内部构成,l9指代逻辑服务于广义对象语义块的构成,la和lb分别服务于句内和句间信息的提示和表达。

这一组概念类别的设立就是为语义块感知和后续的语义块组分处理提供激活信息。

2)语法逻辑

“语法”概念用于描述语言使用的习惯。服务于语言表达方式的辨认(包括修辞)和特指语词的辨认。语言中(以汉语为例)一些句式的表达涉及到语言习惯问题,构成这些句式的特征词就用语法逻辑概念描述。例如:正反问句的表达需要特征词“是否”“是不是”,这些都归为语法逻辑类型。

尽管这些特征词在很大程度上相当于副词的语法功能,但这些词更可能是作为连句成篇的构成单位,而且不同语种使用的手段也会不同,所以,把它从副词中单列出来。

3)基本逻辑

基本逻辑概念涉及基本判断,用于判断命题的基本内容:是否和有无。此处的基本逻辑概念类别主要描述的是充当属性概念的基本逻辑,这类概念一般位于特征语义块的前面作为特征语义块的逻辑修饰语。服务于特征语义块的情态辨认。如“能够”“应该”“必须”等,大体对应于词类中的情态动词。

概念类别是关于词语的概念意义和语用特征的最简明知识,是语句理解处理过程中首先要用到的知识。对语言现象的描述有粗细之分,相应的概念类别也分为广义概念类别和狭义概念类别,用以匹配不同层级的知识特征。狭义概念类别是对广义概念类别的细化描述。在汉英机器翻译应用中,狭义概念类别的应用对语块的内部构成,语块边界的确定乃至整个句子的分析都具有重要的支撑作用。是知识库中一项重要的词语属性特征。

四、概念类别在汉英机器翻译中的应用

基于HnC理论搭建了面向专利文献的汉英机器翻译系统大体上包括预处理模块、源语言分析模块、过渡转换模块和目标语生成模块几个主要部分[7]。概念类别的知识在各个模块中都发挥着自己的作用。下面我们主要介绍概念类别在分析模块和转换模块中的应用。

(一)在分析模块中的应用

源语言分析模块主要依据知识库提供的各项知识与分析规则库对文本进行分析,得到句类分析树。

例如,在辅块识别中,对于辅块边界的辨识我们可以依据语言逻辑概念类别。对于辅块标志符我们可以用l1表示,在分析规则(0)LC_CC[l15]+(f){(1)LC_CC[l1h]}=>LC_tRee(L1,0,0)+LC_tRee[BK,0,1]+LC_tRee(L1H,1,1)$时,就主要利用了概念类别信息。“(0)”表示规则调用的起始位置,“LC_CC”表示在语块中词语所具有的概念类别信息,“LC_tRee”表示生成树节点。这条规则的含义是,如果在句子中找到一个词语的狭义概念类别为l15(辅块前边界标志符),且其后面还能找到一个狭义概念类别l1h(辅块后边界标志符),则将两个词语各自在句子中生成节点,且将其与中间的部分生成一个语块BK。这样,一个完整的辅块就可识别出来。

(二)在转换模块中的应用

过渡转换模块主要依据句类分析树以及转换规则库,通过各种调度操作,将汉语句类分析树转换为符合英文表达习惯的目标语句类树。

例如,在并列结构中,有标记名词性并列结构各并列成分的中心语在语义类上显现出一定的相似性,在我们的研究中更细化为词语的概念类别。我们可根据紧邻并列连接词前面的词的概念类别向后寻找相同概念类别的词作为后边界,根据紧邻并列连接词后面的词的概念类别向前寻找相同概念类别的词作为前边界[8],可描述为如下规则:

(-1)LCR+(0)CHn[、]+(f?){(1)CR}=>LC_tRee(anD_tH,1,1)+LC_tRee(anDmK,0,0)$

(b?){(-1)CR}+(0)CHn[、]+(1)RCR=>LC_tRee(anD_tQ,-1,-1)+LC_tRee(anDmK,0,0)$

其中“C”表示词语的概念类别(Category),“LCR、RCR”分别表示紧邻并列连接词前、后的词的概念类别,“CR”表示分别向前或向后找到的与LCR或RCR相同的概念类别。

五、结语

本文全面阐述了概念类别的具体内容并给出了概念类别与词性的对应关系,指出概念类别可划分为抽象概念和具体概念两大类型,抽象概念中又包括动态概念、静态概念、属性概念和逻辑概念,并对概念的所指及应用做出了描述。随后,本文对概念类别与词性的关系和差别做出了解释,并给出了概念类别与词性的对应关系。最后,本文描述了概念类别信息在汉英机器翻译中的具体应用,指出,概念类别在汉英机器翻译的分析模块和转换模块(如小句转换、eg识别、格式转换和辅块识别等)中均发挥着重要的作用。

下一步的工作是,继续扩大词语知识库的规模,在对目标语(英语)的语言特征进行全面细致把握的基础上,标注英语词语的概念类别信息,并结合英语词语丰富的形态变化特征,配合汉英机器翻译引擎的研发,完成英语生成模块的知识库资源构建,以提高翻译系统的生成效果。

(本文受到国家高技术研究发展计划[863课题,项目号:2012aa011104]、中国博士后科学基金资助项目以及中央高校基本科研业务费专项资金的资助。)

参考文献:

[1]黄曾阳.HnC(概念层次网络)理论[m].北京:清华大学出版社,

1998.

[2]苗传江.HnC(概念层次网络)理论导论[m].北京:清华大学出

版社,2005.

[3]晋耀红.HnC(概念层次网络)语言理解技术及其应用[m].北京:

科学出版社,2006.

[4]张克亮.面向机器翻译的汉英句类及句式转换.开封:河南大学

出版社,2007.

[5]李颖,王侃,池毓焕.面向汉英机器翻译的语义块构成变换[m].

北京:科学出版社,2009.

[6]胡裕树.现代汉语[m].上海:上海教育出版社,1995.

语言服务业概念篇4

随着云计算研究与应用的逐步展开和迅速普及,服务的数量增长速度也不断加快。在这样一个海量的集合上,通过服务发现和组合来满足用户的服务需求,其难度在不断增加。一方面由于服务具有分布、自治的特征,且数量急剧增长,在海量的服务资源中选择可互操作的服务候选者存在巨大困难;另一方面云计算环境中用户需求多变,业务流程日益复杂,服务资源无法即时适应其变化。计算要求面向用户需求,以服务为基本单位,通过服务的协同和交互快速构建软件系统,已经成为构建大规模分布式系统的主流计算方式,这就迫切需要发展一种新的服务发现框架。

传统的服务发现机制通常关注服务本身的属性和内在特征,而忽略了服务发现的宗旨是来尽可能满足用户的需求,这必然成为按需服务发现的瓶颈。要提高服务资源发现的效率和质量,需要以需求为引导,为需求者提供一种更好的服务表现形式,将需求者最关心的内容呈现给他们,而将服务实现的技术细节尽可能的隐藏起来,减少服务提供者和服务需求者对于服务理解上存在的鸿沟,让用户快速定位到自己真正需要的服务资源。

本体(ontology)是用于描述或表达某一领域知识的一组概念或术语,它可以用来组织知识库较高层次的知识抽象,也可以用来描述特定领域的知识,利用本体知识规则集的表现方式,聚类分析web信息在语义层次上的共享和交换,可以大大加强web的功能,使其成为自然语言处理,web信息检索,数据库和知识库的管理,异构数据集成,web页面语义研究,快速揭示海量信息资源中用户在语义、语用和知识上的需求。在越来越多的研究中开始利用本体解决特定环境下的语义搜索和标签聚类的需求,发现用户共同关心的需求等核心问题。

从现有知识源(如文本、词典、遗留知识库或本体、数据库模式等)获取领域知识、以(半)自动方式构造或改编本体,即所谓的本体学习(ontologyLearning),是开发本体的有效途径。人们已进行了许多有关语义web基础架构如本体语言owL、编辑器、推理引擎等方面的工作,在聚类搜索引擎的理论研究中,o.Zamir提出web信息聚类的StC(SharedtermClustering)方法,依靠共同词组进行聚类,以后缀树的层次结构作为类的层次结构,其中关键词组的发现没有考虑词组的稳定性和完整性,没有考虑语义的问题,不能适用于中文等语言,D.Cutting等人提出web信息聚类的Scatter/Gather系统,由于是采用传统的启发式聚类算法进行聚类,难以避免启发式聚类算法的种种缺点。Y.wang等人提出基于超链接(hyperlink)进行万维网信息聚类,这种方法需要下载并分析实际的网页,因此不可能做到在线聚类。

本文提出一种基于本体的web页面聚类系统,综合聚类方法和领域知识的优点,将用户提交的查询与领域本体匹配,提取背景知识来提供聚类的参数确定同时也增强了聚类结果的可解释性,通过将其应用到搜索引擎的背景下,大大方便了用户需求信息的查找,同时聚类用户需求,实现查询集合的优化。

二、本体的应用

internet上的信息资源具有海量、分布、动态、复杂、开放等特点,需求本体信息的发现,用户如何从这些海量的数据中查找自己所需要的有用的信息,自动地从web上发现、抽取和过滤信息,同时满足用户在特殊环境下的语义、语用和知识上的需求成为自动文本信息抽取的一个重要环节。文本信息抽取(textinformationextraction)是指从文本中自动抽取相关的或特定类型的信息。目前文本信息抽取模型主要有三种:基于词典的抽取模型,基于规则的抽取模型和基于隐马尔可夫模型(Hiddenmarkovmodel,Hmm)的抽取模型。采用Hmm存在的主要问题是没有考虑文本的上下文特征信息和文本词汇本身包含的特征信息,而这些信息对于实现正确的文本信息抽取是非常有用的。

面对快速增长的web信息,很多基于web的应用面临着相关领域本体缺乏的问题,因为许多的本体构建严重依赖于以专家为中心的方式实现的,这种以手工为主的构建不仅代价很高,无法进行大规模扩展,同时要促使大量的用户和领域专家为语义web来构建本体也存在相当的困难,因此研究自动的,通用的领域本体构建方法是解决这一问题的关键。

本体是共享概念模型的明确的形式化规范说明,它一方面可以帮助用户明确其信息需求,把未意识到的、未清晰表达的客观信息需求进一步显性化;同时让系统确定检索词在本体中的确定位置,从而帮助机器理解用户的检索意图,为用户提供更精确、更相关的知识和信息。web上的搜索引擎部分地解决了资源发现的问题,但由于它的策略是基于关键字的匹配,缺乏对web文档内容的全面把握和深层语义的正确理解,因此返回的结果远不能使用户满意。搜索结果中包括大量与用户需求无关的信息,从而使用户需要花费大量的时间去找到自己真正需要的信息,因此找到一种有效的方法解决这些问题具有重要意义。随着语义识别技术的发展,出现了多种基于web的本体描述语言,如RDF(ResourceDescriptionFramework),DamL+oiL,owL(ontologywebLanguage,参考Http://w3.org)等。owL作为w3C的推荐标准,是其所倡导的语义万维网(Semanticweb)的核心技术之一,意在提供一种语言,能够用于描述web文档和应用中因有的类和类之间的关系。它通过定义类和类的属性来形式化一个领域,声明和定义对象和对象的属性,以及在owL形式化语义允许的程度上对类(Class)和个体(individual)进行推进。在这些方法中,主要分为两大类:一类是脱机的聚类,主要是通过网络蜘蛛(Spider)采用一定的爬行策略从各网站收集网页,然后再对其聚类,比较典型的有根据包法来给出一种相似度量;另一类是联机的方法,这种方法主要通过对查询结果聚类,主要是以主体为依据进行聚类。比较著名的Vivisimo就是采用的这种方法,还有相关的如Grouper与Carrot等。这些方法都在一定的程度上取得了好的效果。但在本质上没有对用户查询的意图很好现解,在聚类的时候决定聚类的个数时不能很好地确定,从而使得最后的聚类结果的可解释性方面比较差。

 三、基于本体的web页面聚类的具体实现过程

基于本体的web页面聚类系统,主要分为四个部分,如图1所示:页面采集与预处理,本体的应用,页面的特征表示,聚类。

图1  模型结构

具体的系统模型结构和处理过程为:在模型中根据用户提交的查询返回一个结果集,同时解析用户提交的查询后将其匹配到一个领域本体,得到一个分类的背景知识,然后对结果集体进行分类区分为XmL或HtmL,然后分别对页面进行解析,再根据领域本体对解析后产生的特征向量进行降维,从而为下一步的聚类做好准备,然后在分类背景知识的启发下对页面的特征表示向量进行聚类,并用用户提交的查询与领域本体匹配得到的信息作为聚类结果的表示依据,这样的有效加快聚类的收敛速度,同时提高了结果的可解释性。

1.页面的收集与预处理

页面的收集主要采用网络蜘蛛根据一定的策略从网站上采集相关的网页,然后对这些页页进行预处理。

web数量预处理就是去掉web页面中与需要信息无关的其他内容,提取对分类和过滤有用的信息。主要分为两个过程:一个是对页面中控制符的分析,然后是怎样处理这些控制符。页面中控制符主要包括标题,即网页源代码中用(和[标记的文字;关键字;页面描述,跟关键字类似的,在网页的头部说明中可以使用

"description"content="..."/>的形式来描述页面内容;链接,链接元素用来描述两个文档或者文档和URL之间的关系;网页的正文部分:除了少数的专业网站外,大部分网站都是主要用自然语言书写。对于在HtmL文档中出现的各种控制符号没必要把所有的都考虑进去,在实际训练的过程中,为了简化分析处理过程,仅考虑下面的控制符:titLe(标题),meta(置标),HReF(链接)等。

在本文中挖掘时用到的本体侧重于一个较小的主题,对应于一个较小的领域应用。因此在此描述的是现实中的一个较小的领域应用,同时在应用中采用owL来描述。下面是一个计算机媒体owL本体,其中的一个类层次如图2所示。

图2  类层次

其中一个类的owL语言描述如下:

2.本体的匹配

将一个词汇的集合映射到一个领域本体时,希望得到一个公认的概念集,开始我们有一个集合o={o1,o2,…,on},通过将集合o与领域本体匹配后我们得到一个概念集C={C1,C2,…,Cm},这个领域本体用owL表示的本体有三种对象,制定四种不同的映射,具体如下:

(1)当集合o中oi(i=1,2,…,n)与本体中类可以直接匹配时,将匹配到的概念Cj(j=1,2…m)直接加入集合C中。

(2)当集合o中oi(i=1,2,…,n)与本体中类属性可以直接匹配时,如果还和别的类匹配或那个类的实例匹配时,则遵循类的优先性最高,实例次之,属性最低,则将该类或实例所属的类作为匹配的概念输出,否则,则将该属性属于的类加入到集合C中。

(3)当集合o中oi(i=1,2,…,n)与本体中某个个体匹配时,当不与其它的类或属性匹配时,则直接将其所属的类加入集合C中,否则根据优先级将其类名作为概念加入集合C中。

(4)当集合o中的元素与任何一个对象匹配不上时,则将其丢弃。

在语义相似度的计算中,在本文定义了一个新的计算概念之间的模型,具体的定义如下:一个概念C1和一个概念C2,它们各自在本体中定义的属性为C1={C11,C12,...,C1n}:C2={C21,C22,...,C2m},当{C11,C12,...,C1n}*C22,...,C2m}={p1,p2,…,pk},同时定义其中集合p={p1,p2,…,pk}中每个概念的权重分别为{w1,w2,…,wk},则可以得到两概念之间的相似性为:

Sim(C1,C2)=(w1+w2+…+wk)/k

通过将两个概念的属性的集合相交,得到一个集合,然后根据每个集合中每个元素的权重相加后求平均值,这样把这个值作为两个概念之间的相似度。

3.基于本体的VSm表示模型

通过对文本集进行一定的特征提取后,得到每个文档的一个特征向量,得到特征向量后,通过将每个特征项与领域本体匹配,然后得到一个与本体匹配的新的特征向量。

通过分词后,每个文档表示成di(t1,t2,…tn)(其中i=1,2,…m),将tj(j=1,2,…n)与领域本体匹配后得到一个新的向量ont_d1=(c1,c2,…cn)。在传统的VSm模型中,文本空间被看作是一个有一组正交词条表示的向量空间,每个文本表示为其中一个规范化特征向量V(d)=((t1,w1(d);t2,w2(d)…tn,wn(d)),其中t1为词条项,w1(d)为t1在d中的权重。tF-iDF是一种常用的词条权重确定方法。由于ti在文本中既可以重复出现又应该有先后次序关系,分析起来有一定难度,为了简化分析,可以暂不考虑ti在文本中的先后次序并要求ti互异(即没有重复)。这时可以把t1,t2,…tn看成一个n维的坐标系,而w1,w2…wn为相应的坐标值,因此一个文本就表示为n维空间的一个向量,我们称V(d=(w1,w2…wn)为文本d的向量表示或向量空间模型。其中每个词条的权重计算如下:

tfidf(d,t):=tf(d,t)×log(■)

其中D为文档集,d为任意文档,t为一个文档中的词,tf(d,t)为t在文档d中出现的频率,|D|为文档集的总数,tf(t)为词t在文档集中出现的次数,那么tfidf(d,t)就为词t在文档d中的权重。

由于现在的词条都是通过把以前的词匹配到领域本体上得到的一个概念向量,因此会得到新的一个计算权重的公式:

cwi■ptwk

其中cwi为概念c在表示文档di时的权重,twk为匹配前的词根据tF-iDF计算得到的权重,其中p为:

p=1 twk与概念cwi匹配0 twk与概念cwi不匹配

通过将所有的与概念匹配的词条的权重相加,那么得到一个新的表示一个文本的词义表示模型,每一个文本可以表示成V(d)=(cw1,cw2,…cwm)。

4.基于本体的K-means聚类算法

以此初步构建的本体结构复杂,冗余数据较多,运用K-中心点聚类算法对其调整,完成用户兴趣本体构建。选用该聚类算法,是因为其考虑了概念间关系,避免了文本聚类带来的语义信息丢失。在K-means中需要初始的聚类参数,也就是确定聚类点的数目,这对用户来说是很难确定的,在这里通过将用户的查询匹配到领域本体上确定一个聚类点的数目ont_k,然后再聚类完成后结果的展示也以匹配的概念来表示,这样很好地解决了传统方法中聚类的结果可解释性不强的问题。算法的描述如下:

(1)根据用户提交的查询的关键字匹配到一个领域本体上得到一个概念分类数ont_k,作为要生成的聚簇数目k;

(2)按某种原则选取k个初始聚簇中心,C(c1,c2,…ck),采用随机选取原则,设置初始迭代次数为r=1;

(3)对文本集合中没有分好类的每个文本di,依次计算它与各个聚簇中心cj的相似度sim(di,cj),这里将欧风里德距离作为相似度计算公式;

(4)计算新的聚簇中心,新的聚簇中心为这一轮迭代中分到该聚簇中的所有文本特征向量的均值,即

cj=■■d

其中Fi为聚簇cj的文本集合,nj为Fj中的文本数,d为文本特征向量;

(5)如果所有聚簇中心均达到稳定或者说准则函数收敛,结束;否则,r=r+1,goto(4);

(6)通过将中心点与概念类匹配,确定其对应的表示方式。

由此可知,该算法是基于迭代的过程。通常,初始点不同,聚类结果也不同。该算法运行速度快,时间复杂性为o(knr),其中n为总文本数,k为聚簇数,r为迭代次数。算法的缺点是必须事先确定k值,而在许多情况下,无法事先知道文本集合中的主题类别数目,在这里通过与领域本体匹配,确定了k的数目,大大提高了收敛速度。

四、多用户需求发现本体构建

多用户兴趣本体构建通过聚类调整得到更直观的用户兴趣本体,该本体概念由高频特征词组成,打破领域本体局限,实现多领域用户兴趣的挖掘。如果将有关联用户的兴趣本体合并,构建多用户兴趣本体,可发现用户潜在兴趣,其过程分为用户聚类和本体合并两步。

(1)用户聚类。从后台数据库中提取用户信息,包括性别、年龄、受教育程度、从事行业等维度。选用K-means算法对其聚类,找出关联客户。

(2)用户兴趣本体合并。将关联客户的兴趣本体用数据模型表示并按如下公式逐一合并,可得到多用户兴趣本体。用Ca,Cb分别表示a,B用户兴趣概念,Ra,Rb分别表示用户的分类关系集合,合并公式如下:

(Ca∪Cb)∩(Ra∪Rb)∩((Ca*Ra)∪(Ca*Rb))∩((Cb*Ra)∪(Cb*Rb))

由此,完成多用户本体的构建。

该本体由多个用户兴趣本体合并而成,合并后概念和关系数量迅速增加,可对其再进行一次无尺度图K-means聚类调整。

五、结束语

本文通过将领域本体与文本的聚类方法结合,在搜索数据返回的结果的背景下,对页面集进行聚类,根据用户提交的查询与领域本体的匹配,得到聚类参数和最后可解释的概念表述方式,在特征向量模型的构建方面通过将页面分词后的词语与本体匹配得到一个概念的向量模型,这样有效地提高了聚类的速度和增加了聚类结果的可解释性,并在一个引擎的环境下实现。

语言服务业概念篇5

关键词:信息化词汇翻译

语言是人类交流思想的工具,也是民族文化的载体,它传承着民族精神与灿烂文化,是连接一个民族历史和现实的纽带。语言的变迁从另一个侧面反映了一个国家、一个社会经济、文化等方方面面的变化,它与文明总是一脉相承的,与人类进步的脚步紧紧相随。在中华民族五千年光辉灿烂历史的长河中,汉语在其发展与丰富过程中,大量吸收了外来语系的精辟词汇与先进文化。今天,随着我国改革开放的进一步深化,信息化大潮开始席卷祖国大地,即使在一些偏远的村落,也可以听到老百姓谈论卫星电视、计算机、移动电话等与信息化应用有关的词汇。信息化已经成为人民改造社会、提高生活质量的有力武器。

由于发达国家在现代科技与先进管理方面的优势,在我国的信息化建设过程中,我们也不排斥这些人类文明的精华。然而,由于国家和社会制度及社会发展阶段的不同等多种因素,西方发达国家主要使用的英语与汉语在信息化应用方面,一些语言和词汇方面没有直接对应关系,在翻译方面产生不小的困难。如不探究其缘由、仔细推敲,不免失之随意,造成交流与沟通之间的障碍,严重的还可能引起误解,应该在细加辨析的基础上由相关学术界会同产业界对此现象专门进行研究。现仅举几个比较典型且常见的例子,作为抛砖引玉引起共同关注。

1.信息化

如果评选本世纪头五年中国最热门的100个词汇,信息化肯定会被列入其中。应该讲信息化概念是从社会进化的角度提出的,比较公认的讲法是“信息化”一词起源于日本,其相关思想见诸于1963年1月日本社会学家梅倬忠夫发表的《信息产业论》,但西方学者对与信息化有关社会现象的研究则至少可以追踪到二战期间。更加完整的“信息化”概念则是在1967年由日本科学技术和经济研究团体提出的,基本看法是今后的人类社会将是一个以信息产业为主体的信息化社会。我国使用“信息化”一词的历史至少可追溯到20世纪80年代,当时社会上相近的说法还有“知识化”、“智能化”等概念。

虽然“信息化”一词使用较早,但是其含义一直没有被统一的严格定义。随着中国社会的发展,不同的人群对“信息化”予以了新的含义。因为汉语中“化”有表示过程的意思,是个动态的概念,如“年轻化”、“专业化”。所以,普遍的观点是:这是向知识经济时代社会转化过程的一种现象,以现代信息技术在各行各业的应用及向社会生活各个方面渗透为标志。然而,“信息化”一词在翻译成英语的过程中遇到了麻烦。因为英文原文中没有一个现成的、完全对等于汉语“信息化”这样一个外延广泛的词,所以不同的地方和出版物采取了不同处理方法。商务印书馆2003年出版的《新华新词语词典》、机械工业出版社2002年出版的《英汉信息技术词典》、大连理工大学出版社1997年出版的《最新汉英词语词典》上说法不一;在金山词霸之类的电子词典上甚至没有作为一个词或词组单独列出;在代表中国官方且国内发行量最大的英文报纸ChinaDaily上,在不同的时期翻译“信息化”一词时先后至少使用过四种译法:1.informationalization;2.informationization;3.informatization;4.informationtechnology。

从单纯的语言学角度来看,语言是“音-义”的结构,也就是说,“凡具有一门语言知识的人,都以一种特殊的方式内化了联结音义的一套规则系统”。由于informatization源于法语,比较简洁且有溯源,在国内似乎已渐趋公认,尤其被用于许多官方正式场合。

2.电子政务

电子政务是具有中国特色的自造词,具有中国特色的电子政府的理解和实践,包括办公自动化、政府上网、政务信息化等从低到高的各个发展阶段在内。电子政务的直译应该是electronicgovernmentaffairs,electronicgovernance。自80年代中后期以来,不同的政府部门、不同的地方政府、不同的行业及普通的百姓,在不同时间或者同一时间使用不同的概念描述it技术和网络技术在国家机关特别是政府中及政府对企业、社会团体和公民个人的服务中的使用。2002年7月国家信息化领导小组讨论通过《关于我国电子政务建设的指导意见》,之后中国官方文件基本统一使用电子政务这一提法,但是在对国外报道时则比较一致地使用e-government。如ChinaDaily在人代会期间报道《政府工作报告》时电子政务即译为e-government。

电子政务国际上通用的讲法是e-government(电子政府)。e-government在西方的意思是非常清晰的,多限于政府公共管理领域的信息化应用,包括政府间的电子政务(GovernmenttoGovernment,即GtoG)、政府对企业的电子政务(GovernmenttoBusiness,即GtoB)、政府对公民的电子政务(GovernmenttoCitizen,即GtoC)。《信息化建设》杂志社的“信息化字典”对电子政务的定义是:“利用计算机网络技术作为新的服务手段,实现政府对居民和企业的直接服务,提高政府的工作效率。其主要内容有:(1)网上信息;(2)部门内部办公自动化;(3)实现网上交互式办公;(4)各部门资源共享、协同工作。”对电子政府的定义是“信息高速公路五大应用领域(电子政府、商子商务、远程教育、远程医疗、电子娱乐)之一。电子政府包括:(1)政府信息服务系统,包括办公电子化、政府机关联网化。(2)国家公安与执法网络。(3)政府的电子邮件系统。(4)用电子方式提供政府福利”。可见,它区分了电子政务与电子政府。然而,根据中国的政治体制,涉及公共事物管理与服务活动的公共部门不仅仅限于政府行政部门的范围。事实上,各级党组织、人大、政协,一些公共服务机构和军事等部门也不同程度地参与其中。在信息化工作先行一步的地区正在酝酿的网格化管理思想中就比较全面地体现了这种具有电子民主倾向整体管理和服务理念。因此,笔者认为,从这个意义上讲,我国电子政务实质上包含其他国家定义的电子政府和部分具有我国特征电子民主范畴。

3.信息产业

信息产业多被译为informationindustry,实质上是信息技术生产业,informationtechnologyproduceindustry,包括与信息技术相关的电子产品、系统制造(infrastructure)、软件(software)及服务(service)等。然而遗憾的是,不论在国际上还是在国内,至今对于信息产业都缺乏一个权威的和统一的定义。国际上比较公认的说法有三种:一是由美国、加拿大、墨西哥三国在1997年联合制定的产业分类标准――《北美产业分类体系》(naiCS)中的表述:作为一个完整的部门,信息业由下列单位构成:生产和信息和文化产品的单位;提供方法和手段、传输和这些产品的单位;信息服务和数据处理单位。具体包括四部分:出版业、电影和音像业、广播电视和电讯业、信息和数据处理服务业。值得注意的是,naiCS中的信息业,侧重于信息的传播和服务,不包括电子通讯产品的生产、销售和租赁。二是经济合作与发展组织oeCD定义的是信息和通讯技术业,即iCt(informationandCommunicationtechnology)业。它包括naiCS分类中不包括的电子信息设备、元器件和其他材料的制造,但不包括na-iCS分类包括的出版、电影和音像、广播电视制作、新闻机构、图书馆、档案馆等服务。三是美国商务部在其的《数字经济2000年》中的定义,认为信息业由硬件业、软件和服务业、通讯设备制造业、通讯服务业四部分内容组成。其中硬件业除了包括计算机、办公机器、电子元器件测量和实验分析工器具的制造外,还包括计算机及其设备的批发和零售;在软件和服务业中,除了计算机和有关的服务外,还包括软件的批发和零售。由此可见,美国商务部和oeCD对信息产业的范围界定大体系统,比较侧重于与电子技术相关的活动。

国家统计局《统计上划分信息相关产业暂行规定》(国统字[2003]83号)确定的信息相关产业主要是指与电子信息相关联的各种活动的集合,包括电子通讯设备的生产、销售和租赁活动、计算机设备的生产、销售和租赁活动、用于观察、测量和记录事物现象的电子设备、元件的生产活动、电子信息的传播服务、电子信息的加工、处理和管理服务、可通过电子技术进行加工、制作、传播和管理的信息文化产品的服务。信息产业部的三定方案认为的信息产业则包括电子信息产品制造业、通信业和软件业等,而信息产业部有关文件上通常使用电子信息产业一词的频率则是最高的,如“电子信息产业经济运行分析”。

同样,我们快速发展的信息化建设也会产生许多具有中国特点的词汇,在翻译成外文时同样可能遇到困难。比如近期信息产业界内提到比较多的一个词汇――整机联动就是一例。这个词实质是整机与芯片连动短语的建成,但是翻译成英语时“整机”是译成“consumerelectronicsandaccessories”,“system”还是“electronicproduct”好呢?考虑到这个词汇中“整机”是与“芯片(chip)”(实质是芯片设计)对应的,因此似乎以后两种说法中选一为妥,这也要由当时的语境来决定。这样的例子还有“平台”,中文的平台到底是指什么呢,英文是直译成“platform”吗?是只是满足某个功能的一系列软、硬设备的集成吗?这始终是一个充满争议的词汇。

概而言之,缺乏统一的定义、东西方表达差异、时间、场合的不同及事物的不断发展变化等诸多因素,使得信息化应用中有关词汇与术语的汉语与英语及其他语言间相互交流中存在大量值得研究的问题。作为信息化方面学术工作者和信息产业相关人士,我们对这种几乎每天都能碰到问题应当重视与研究。对于这种信息化应用中文和英文中常用的词汇、词组并没有简单的对应,而又需要具体翻译的时候,便要根据整体的意思安排适当的表达方式。这种差异后面或许反映了更深层的文化差异,或者事物层次结构的不同而有待进一步认识。总之,勤思考、多探讨,忌随意、戒当然,是我们解决这类问题的正确方法和有效途径。

参考文献:

[1]李建军.新编英汉翻译[m].东南大学出版社,2004.

[2]毛荣贵.翻译美学[m].上海交通大学出版社,2005.

语言服务业概念篇6

[关键词]本体 评估 指标体系

[分类号]G354

面对众多已构建的本体,如何将其选择重用与共享是许多研究者所面临的问题。从某种层面上看,本体评估的意义在于保证本体的构建质量,实现对本体的有效管理与维护,从而为本体构建者提供参考依据,为本体使用者提供选择依据。从国内外本体评估研究看,目前主要采用基于用户、基于任务、基于原则、基于应用、基于黄金标准、基于语料库等评估方法,基于不同的需求目的,每种方法均存在其各自的特点与不足。总体而言,这些评估方法更多地注重结果评估,对本体所拥有的概念及概念关系、应用状况等进行评价,而忽略过程评估,如缺乏对构建规划、构建过程的评估。因此,本文基于本体建设的生命周期阶段,即原模型阶段、模型阶段、应用阶段来构建本体评估指标体系,旨在确定一套科学、合理、全面、客观的本体评价体系,可用于本体建设不同阶段的参考与评估。

1 本体评估内容

评估内容的多元化是评估本体的核心。就评估内容而言,多元评估要求既要体现其共性,更要关注各自本体的个性;既要关注结果,更要关注过程。即以多维视角的评价内容和结果,综合衡量本体的发展状况与水平。本体的评估内容可概括为以下几个层面:

1.1 本体概念层评估

概念是本体的最基本单元,概念表达的准确性、完整性、概括性、抽象性等对于本体的质量有着决定性的影响。

1.2 本体结构层评估

主要包括本体概念体系的结构化及本体表示体系的结构化。本体概念体系的结构化表现为本体概念结构的灵活性及易于扩展性;规范化、结构化的本体表示语言为本体在不同系统之间的导人和输出提供标准的机器可读格式,利于被计算机存储、加工、利用,或在不同的系统之间进行互操作,为本体表示体系的结构化提供了前提条件。

1.3 本体语境层评估

本体语境层表示为本体之间的关联度,通常情况下,本体之间通过建立映射、互相参考引用等方法建立概念间的语义关联,以实现本体之间概念及概念间关系的重用与共享。可通过链接或引用程度不同给予不同的评估值。

1.4 本体应用层评估

以本体的应用领域作为评估对象,涉及本体系统的存储与检索、基于语义网知识层的共享和重用、基于本体的标引与语义检索、文本数据的推理研究等。本体应用层相对于其他层面,影响较小且具有间接性,因此评估难度较大。

2 本体评估指标的构建

本体从构建到应用要经历整个生命周期的三个阶段:原模型阶段、模型阶段、应用阶段:①原模型阶段是本体构建前整体规划及原材料的预处理过程,包括构建本体的参考本体及可行性评估、流程设计、数据库设计、整理网页、挖掘文本语料库等;②模型阶段是本体构建过程,包括概念及概念间关系确定、本体构建的方法和工具选择与应用、本体与其他本体的映射、本体描述语言的选择与应用、本体之前的训练和测试;③应用阶段是本体构建完成后的本体应用状况,主要是运行中本体的监测活动,如知识工程、信息标引与检索、语义web、异构信息集成、本体推理等众多领域。

为实现对本体的整体性及动态性评估,需要对本体建设生命周期三个阶段的关键要素进行提炼,形成一套科学、合理、系统化的评估指标体系,这样既能测度本体构建水平又能评估其运行情况和发展潜力。本体评估指标体系,如图1所示:

2.1 原模型阶段

本体的原模型阶段评估的主要内容有:确定构建目的、构建规划、可行性评估、原材料预处理及选择参考本体。

2.1.1确定构建目的确认所构建的本体是否有明确的符合学科建设的发展定位,是否有明确的符合知识组织、知识服务的建设理念,是否有总体建设目标与中长期发展规划,是否有实现目标的方法和措施。

2.1.2构建规划包括:①用户需求分析。确认是否有明确的应用需求,是否有可操作的调研计划,是否有详细的调研方案,是否有成文的调研报告,是否了解学科资源状况,是否掌握用户需求及特点,并评判服务模式是否有明显优势,建设效益是否显著。②方案设计。检测构建本体的具体内容,包括确定项目的进度,规划实施方法,评判项目的可操作性,标准本体模型实现计划等。③团队建设。主要是明确构建本体的人员配置,要求有稳定的团队,并且应熟悉掌握知识组织的理论和方法,另外还应配备技术支持人员和领域专家。④经费管理。此阶段应该有经费预算和时间预算,经费应按预算分阶段地持续投入。⑤人员合作。在本体构建的全过程都需要本体开发师(负责构建本体)、本体工程师(重用本体)、项目负责人、领域专家、行业分析家及用户进行合作共建。

2.1.3 可行性评估 可行性评估的目的是确定是否能够用最小的代价在尽可能短的时间内解决问题。它并不是解决问题,而是确定问题是否值得和能够去解决,包括:①技术可行性,即使用现有的技术是否能够实现构建目标;②经济可行性,即本体的经济效益是否能够超过其开发成本;③操作可行性,本体应用系统的操作方式在本体的用户组织内是否行得通。

2.1.4 原材料预处理预处理是由本体工程师在构建本体前对构建本体时所需的原材料进行收集与预处理,包括流程设计、网页整理、文本语料库的挖掘及对参考本体的资料获取等。在这些收集好的材料被使用之前,本体工程师还要对其质量进行评估。

2.1.5 选择参考本体 包括对本体构建所参考的其他本体的质量进行评估,并对所构建本体与参照本体的相关性进行评价。

2.2 模型阶段

2.2.1 本体概念构建的评估本体概念来源于文本语料库和专家的参与,以定义新概念、复用且修正参考本体中的概念等。本体概念的评估包括:①概念的完整性评估。本体的概念完整性表现为尽可能包括学科或领域的全部概念,尽管很难达到,但应包括学科领域的基本概念和重要概念、反映学科的新概念和专用术语、体现交叉学科与边缘学科的所有概念。并在此基础上,参考用户的特点与需求,使其达到最佳使用效果。②概念的正确性评估。本体中的概念术语应明确、清晰、无歧义定义,一词一义,词型简练,稳定性强。③概念共享性评估。是指本体中术语所表达的概念与观点应具有普遍性,能够被整个群体所接受。④概念可扩充性评估。概念可扩充性主要表现为在本体的发展及应用过程中应该能加入新的概念。良好的可扩充性使得本体能够随着概念的逐渐增加而不断完善,同

时这样的本体也很容易对其进行概念的修改和删除。⑤概念抽象性评估。是指概念主要体现为基本的、普遍的、抽象的和哲学上的概念,通常顶层本体概念的抽象性更高一些,领域本体是从顶层本体的抽象概念中衍生出具体概念。

2.2.2 本体概念间关系的评估 概念间关系形成的概念网络体系,使各个概念之间建立起语义关联,为其在自然语言理解应用方面奠定了一定的基础。本体概念间关系评估的内容主要包括:①一致性检测。本体系统中概念、断言以及其他各种概念间的关系,前后定义是否具有语义冲突,需进行概念间关系的逻辑一致性检测。②完整性评估。概念间关系是否囊括了学科所有概念的概念间关系及其类别是否完整。③可扩展性评估。本体概念间关系应具有可扩展性,以便在本体应用或后及时增加与修改。④唯一性评估。本体概念间关系应具有唯一性,即概念与概念之间只存在一种关系。

2.2.3 本体映射评估 一般情况下,本体映射是基于概念定义的方法,即在映射时主要考虑本体中概念的名称、描述、关系、约束等。本体映射评估包含:①本体间的互操作性。主要针对本体间映射时的接口进行评估。一般情况下,如接口衔接率高,即需要人工进行概念扩充与整合的接口比较少,则说明两者的互操作性高。②重用性。重用的内容包含两个本体的概念、概念关系、属性限制等,通常重用率越高,映射的效果越佳。

2.2.4 本体表示评估 本体开发中,本体表示是对概念及概念之间的关系进行明确定义,选择合适且适用的本体语言,如DL、RDF、RDFS、ontolingua、oKB、Loom、DamL,DamL+oiL、CycL、owL等进行形式化描述。评估内容包含以下方面:①语言规范性。所选择的本体表示语言对本体知识的主要元素、概念、分类体系、关系与函数、实例、公理、产生式规则进行定义时,其语言结构是否规范,语言的推理机制是否合理。②逻辑错误检查。确认是否有逻辑错误的检查能力及检查其结果如何。③语言错误检查。确认是否有语言错误的检查能力及检查其结果如何。④语言的适用性。确认所选择的本体表示语言是否适用于表示目标本体,它对知识主要元素的定义能力如何。

2.2.5本体构建工具评估目前较为成熟、知名度较高且常用的本体构建工具主要有:DamHmp(api)、Kaon、oiled、ontoedit、openCycServer、protege-2000、RDFauthor和webonto等。判断一种工具性能如何,主要是判断其是否具有较高的使用效率和是否便于用户使用:①可视化程度。本体构建工具是否提供可视化的本体表达视图,提供的用户界面是否便捷并使用户满意。②共享性。本体构建工具是否可供用户免费使用、下载或在线使用,提供免费软件下载的官方网站是否具有多种语言的版本。③适用性。本体构建工具是否支持Unicode字符集,工具在使用时其输入和输出格式是否支持XmL或其语法是否基于本体标记语言XmL以及w3C、iSo或ieee等其他国际组织的相关推荐标准。

2.2.6 本体整体评估 本体整体评估主要是针对本体的构建过程作出整体全面的评价:①开放性。开放性有助于促进本体与其他本体信息的共享及互操作性。完全开放意味着本体可以被自由使用或者扩展,而不加任何限制。一定程度的开放意味着本体提供者要求本体使用者遵循一定的使用条款及许可条件,实现限制条件下的部分开放。②成熟度。主要指本体目前发展的稳定性及其与其他本体的相关性。它通常与一些量化指标有关,如本体的建立时间、更新时间、发展状态及被其他本体引用的程度等。③阶段评估。本体是否进行了阶段性评估,评估的结果如何,阶段性的问题是否解决,有没有对本体进行阶段性训练和测试。④时间成本。本体的构建时间是否在预期时间内完成。⑤费用成本。构建本体的费用是否在预算费用之内。⑥本体管理。包括本体的进化管理、版本管理、存储与交换管理。要求有本体专门维护机构,有科学的理论依据与实践依据,并依据学科发展和标注实践制定了本体概念与概念关联的增、修、删的原则与标准。本体有不断更新的版本以及现实本体的稳定运行、本体存储方式、高效的存取性能、遵循有关标准协议、能够实现不同本体间数据的相互交换。

2.3 本体应用阶段

本体的应用评估主要包含:本体系统辅助功能、语义标注功能、语义检索功能及文本推理功能。

2.3.1 本体系统辅助功能 本体系统辅助功能主要指该本体所提供的服务功能。主要包括以下内容:①与用户的交互。是否提供了与用户的交互机制,提示信息有效、直接,交互语言友好,可视化结果直观、易懂,能够为用户的操作提供适当的引导。②开放性。与本体管理工具和本体应用系统连接的难易程度以及对用户来讲是否容易使用与操作,是否可以免费获取,获取的方式是否快捷等。③个性化服务。所构建的本体应该提供信息定制服务与信息推荐服务,要有清晰的整体说明、详细的功能使用说明与信息注解、帮助信息,并可根据用户关注焦点来选择个性化服务。

2.3.2 语义标注功能语义标注实为运用本体的词汇来标注语料库与web资源,通过添加语义元数据,使其内容被人或机器所理解。语义标注所要评估的内容是覆盖率、标注工具的效用性、标注结果的准确率。①覆盖率。覆盖率是指本体中描述应用领域的概念在语料文本词汇中所占的比例。覆盖率越高,说明本体描述领域内概念的广度越高,全面性越好。②标注工具的效用性。检测标注工具是否支持各种类型、各种介质资源的自动标识,是否提供了本体概念和关键词标注,是否描述了元数据的标准与通用性,标注流程是否方便,且对于应用用户是否适用。③标注结果的准确率。是指正确的标注结果数占标注数量的比率。准确率越高,语义标注功能越强,可以为进一步的语义检索奠定基础。

2.3.3 语义检索功能 基于本体的信息检索,旨在利用本体中的概念实现对用户信息需求及资源的语义理解与分析,实现概念层面的检索,提高查询的精确率。其功能评估包含以下内容:①查准率。指系统所检索出的术语中有多大比例的术语是相关的,而不考虑它没有检索出的相关术语。精确度越高,就越能有效地确保系统已识别的术语是正确的。②召回率。召回率是系统检索出的相关术语占总相关术语的比例,即检测有多大比例的术语是系统应该识别而实际上识别了的,而不考虑有多少不合格的识别术语。召回率越高,就越能确保系统没有错过正确的术语。③自然语言处理能力。检测系统识别用户检索语言的能力,即问答系统根据上下文的语义联系具有深层语义理解的能力。比如,对一词多义现象的处理,对开放域的答案抽取水平,所涉及的词法分析、句法分析、语义理解等基础处理能力。④用户满意度。是指用户对输出端结果的满意程度,即输出的结果是否为用户所提问题的答案,涉及答案的详细程度、输入端与输出端的时间间隔及人机界面操作的便捷性等。

2.3.4 本体用于推理本体描述语言起源于人工智能领域对知识表示的研究,因此本体的描述语言不仅仅需要具有良好定义的语法和语义与充分的表达能力,更需要有效的推理支持:①工具的有效性。推理工具是否支持多版本的语言规范,是否可以方便地访问标准语言的类及属性,是否支持基本的对list的处理,是否可以实现类的层级访问和使用,是否可以实现自动或半自动推理等。②概念的可满足性。是否存在相应的解释使得概念成立。③实例检测。是指检测某个概念所对应的所有实例的集合。

语言服务业概念篇7

但凡上过网的人,在浏览网页时,在网上会看到一张女孩子的照片,身材肥硕,动作夸张,明为丑女却自称天下第一美女让任何男人一眼看到就要流鼻血,后面跟着一大堆有伤风化的留言,不用问,那一定就是芙蓉姐姐。

芙蓉姐姐在网络中能够迅速走红是一个客观的存在。我们可以比较一下,在此之前,也有木子美的网络泛滥,差点就挤垮了“博客中国"的几台服务器。但是,木子美付出了多大的代价,要承受多大的压力?至于芙蓉姐姐,只要脸皮厚一点就可以了。芙蓉姐姐在网上的泛滥,说明她满足了网民的某种需求,这就是一个概念,无聊的网民不但需要审美,也需要审丑,需要那种有伤风化的言语发泄——这就是一个概念,离开了这个概念,“芙蓉姐姐"就会还原成一个无人问津的丑女。

事件营销的概念策略就是要企业为自己产品或服务所创造的一种“新理念”、“新潮流”,让消费者易于接受,并产生消费冲动。与普通营销相比,普通的营销可能是消费者需要什么,我就生产什么来满足消费者的需求。概念营销恰恰是引导消费者去消费什么,概念营销不仅着眼于消费者现在的需求,更加重视消费者的欲望和潜在需求。

事件营销的概念策略在商业领域中最典型的应用是农夫山泉谋杀纯净水的案例。凭借着“农夫山泉有点甜”这句暗示性极强的广告语,农夫山泉自1998年杀入水市场之后,在全国纯净水行业市场占有率中位列三甲之中。2000年4月随着与娃哈哈与乐百氏竞争的加剧,农夫山泉越来越感在资金和管理方面前所未有的压力。与此同时,其奥运推广策略也受挫。怎么办?破立结合,先把纯净水毁了!4月24日农夫山泉宣布停止生产纯净水,只出品天然水,大玩“水营养”概念,从而引发的一场天然水与纯净水在全国范围之内的“口水战”,招至同行们的同仇敌忾,但农夫山泉正是借此树立了自己倡导健康的专业品牌形象。类似的案例还有电子行业的商务通当年也是通过引领掌上电脑消费新潮流,一举创造了销售神话;家电行业的海尔空调推出“氧吧空调"概念,在那个“非典”“凉夏”的季节依然获得高利润。

在医药行业中广州诺贝华乐制药有限公司推出的“一元感冒药”,迅速搅动了全国市场。维C银翘片、速效感冒片、速效伤风胶囊、小儿退烧片、午时茶、三黄片等在连锁药店门口的堆头上摆放极为醒目,且每种产品外包装上打着醒目的“1元”标志。这种冲击波逐步蔓延全国各大城市。各种声音开始传递,有市民争相排队大量购买,也有部分药店抵制销售,一时间众说纷纭,"有赞有弹"。但不管怎样,到目前为止,销售额已达1千万元,也就是说,这么些个"一元"一包的感冒药,已卖掉了1千万包。

记得国内就曾有一位企业家提出过:理论市场和产品市场同时启动,先推广一种观念,有了观念,市场慢慢就会做好。的确,概念策略的做为一种战术就跟美国的反恐战争一样提倡“先发制人”,在产品概念上从特定的角度创造消费者非买本产品非买不可的理由来最大限度的打击竞争对手。

让我们成为“概念领袖”!

从市场上众多的概念策略应用案例上,我们似乎感觉到这种方法多在单一产品上应用,但对连锁药店而言,因每一个店门经营的产品众多,如应用就不可能针对单一产品来做,那么应该怎样做呢?

1.“多走一步”的家庭药箱概念

家庭药箱尽管每个家庭都有,平时的一些头疼脑热,用其药来简单快捷,但消费者由于普遍缺乏管理药品的知识,将不同的药品混放,时间一长,过期、变质的现象时有发生,媒体关于这方面家庭药箱使用不当的危害时有报道。其实消费者对药品安全储藏管理知识到还是次之,安全用药知识才是大事。因而家庭药箱的设计是连锁药店在概念策略中应用重点要考虑的问题。

连锁药店设计家庭药箱时,可依据药店信息系统提供的消费数据进行分类,按照每个会员消费的频率、品种等要素,分析会员工作与生活情况,然后进行规类整理。由量化的数据分析比较后得出非量化的结果,使我们在家庭药箱的概念设计上有了依据。如针对经常出差的商务人士,可将乘晕宁、阿司匹林、黄连素、创可贴、速效伤风胶囊等药品组合成体积小且便于携带的商务药箱,在药箱的内部还应装有详细的用药说明、紧急外伤处理、饮食注意等知识手册;针对上班族的工薪阶层,可将安定、甲硝唑、复方新诺明、牛黄解毒片、云南白药、碘酒、风油精、纱布等药品组合成家庭经济药箱,在药箱中赠送健康生活指南等书籍。类似的还可以组合很多的家庭药箱:男士专用药箱、淑女专用药箱、节日礼品药箱、户外旅游药箱等。

这些家庭药箱新概念的推出,可以从一定程度上,提升药店的客单价,同时连锁药店对此销售记录可进行进一步的追踪,为日后提供个性化服务打下良好的伏笔。尤为重要的是对消费者而言,在享受到方便的同时,给消费者实实在在的感觉,情感诉求改善了买与卖相对矛盾,将药店的美誉度提升上到一个新的层次上。

2.“多走一步”的特色服务

但凡说到连锁药店的特色,人们都会想到如实行送药上门,只要一个电话,所需药品就可在规定时间内送上门;代客煎药,解决了现在许多家庭没有熬药工具的后顾之忧;提供体贴周到的药学咨询,聘请药剂师在药店坐堂,随时解答顾客的问题,从很大程度上避免了盲目用药而引发的不良后果;利用多年经营的优势,紧抓老顾客,建立会员卡,对长期购药的老客户采取优惠政策等。这些服务如果真能贯彻的好,的确也是药店的一个特色。但是这些服务毕竟是“座商”服务。能不能将这些服务走出去,这是我们在连锁药店服务营销中打的一张概念牌。

凡是座落在社区的药店,所辐射的区域都是周围的社区,在这些社区中,要知道还有一些人因病住在床上或者是刚出院的患者,对这部分人进行服务,不能要求人家到药店来,只能到这些患者家去,那么既然生活在同一个阳光下,我们就要让这部分人群感到药店的特性化服务。连锁药店可利用药店的执业药师到这些患者家中,为他们提供如用药指导、康复生活保健、营养饮食配餐等服务。试想如你的家中恰巧有这样的病人,你需不需要这样的服务呢?

语言服务业概念篇8

一、文献回顾

Hymes(1972)首次提出交际能力这一概念。他所指的交际能力包括语言能力和语法知识,还包括可行性和恰当性,这些属于语言使用范畴的概念。首次提出交际策略概念的是Selinker(1972)。他认为交际策略是一种语言使用策略,是学习者在对第二语言或外语掌握有限的情况下,为达到交际目的,弥补其语法或词汇的贫乏而采用的方法。tarone(1981)对于交际策略进行了分类。Canale和Swain(1983)的交际能力理论指的是,人们在实际交际活动中运用语言知识和技能的能力,他们的能力理论涉及4个方面:语言、社会、语篇、策略。其中策略能力即交际策略能力。Faerch和Kasper(1992)把交际策略分为两大类:如果学习者绕开障碍回避困难,他使用的就是减缩策略;如果他寻找办法解决问题,那么采用的就是成就策略。成就策略包括以第二语言为基础的替代(substitution)、直译(literaltranslation)和转述(paraphrase)以及非语言(mime)等策略。减缩策略是交际者放弃交际目标而采取的策略,例如回避策略。Faerch和Kasper对减缩策略的界定与tarone对回避策略的界定大致相同,而Faerch和Kasper对成就策略的具体描述实际上是在Canale和Swain理论基础上对tarone模式做的进一步解析。但有研究者对Faerch和Kasper的理论提出了异议,认为交际策略的话语功能是使本族语使用者能帮助外语学习者正确表达他所想的内容,所有的交际策略都能起到扩充语言手段的作用(束定芳,1996)。实际上,一个英语为非母语的学习者在用英语进行交际活动时都会适时分别使用交际策略,以补救交际的失败或提高交际的有效性。具有较强的策略能力能使语言交际更少地受交流障碍带来的负面影响,也就是说,一个外语学习者口语水平跟交际策略的使用有密切关系(Dornyei)(Cohen,1998)。基于以上理论及其未涉及的空白,本文将探讨交际策略与公共旅游英语教学之间的有机联系及作用,提出在公共旅游英语教学中渗透交际策略的学习,促使学生在语言资源有限的情况下,通过语言或非语言的途径克服交际中的障碍,发展语言技能。本文认为,用交际策略的概念来生成和促进学生的公共旅游英语学习,是比较客观的,也是具有可操作性的。

二、交际策略与旅游专业学生的英语学习

旅游专业学生大多从事酒店对外接待与服务、涉外导游以及旅游市场的开发与管理等方面的工作。他们的学习内容是英语加上旅游专业知识,即公共旅游英语。公共旅游英语学习的目标直接指向旅游服务行业,训练内容偏重口语能力。因此,要求学生具备较强的英语交际能力,掌握英语交际策略以提高交际能力,从而符合旅游服务行业的要求。

三、交际策略的学习内容

本文主要从以下方面评价学生的英语交际能力:有明确的交谈目的,内容清晰,积极回应,紧扣主题以及目光的交流和身势语的恰当使用。本文认为,结合旅游行业进行有针对性且具体化的交际策略学习可以提高学生的英语交际能力。即可以根据交际策略的概念和分类,以学习交际策略为桥梁,构建学生的旅游专业英语知识体系,逐步生成符合旅游行业特点的英语交际能力。

(一)关于回应探讨交谈时,根据对方的话语作出积极的回应,这是交谈的礼貌。在训练学生酒店前厅服务用语时以完成得体、礼貌的接待任务为学习内容。为客人预订房间、入住登记、结账,接受客人的咨询和投诉,学生学习使用各种停顿词、感叹词,以表示在注意倾听对方,并同时表达自己的感受,从而实现有效的和谐的交际,提升服务质量。用“Yeah”、“Great”等表示同意、附和;用“pardon?”请求对方重复;确定自己完全理解对方的话语则用“Youmean……?”,“Soyouaresay-ingthat……?”等句型。

(二)关于转述探讨Bialystok(1983)就“何人何时使用何种策略,效果如何”的课题展开了调查。实验的重点在于弄清学习者在缺乏词汇时采用何种策略,经数据统计得出的结论是:最有效的是以第二语言为基础的策略,善于将第二语言水平与灵活地选择策略的能力结合起来的学习者为最佳策略使用者。Hasstrup等人(1997)的研究成果证实了Bialystok的结论,他们认为,转述是最成功的策略[1]。转述策略是建立在学习者外语水平之上的一项成就策略,是积极的英语交际方法。它要求学生运用自己储备的词汇和语法知识,通过解释和举例将意思正确清楚地表达,从而避免语言的错误,使交际正常进行。显然,转述策略在提高语言的流利性和意义阐释等方面有积极的作用。因此,在学生进行导游训练的过程中,交际策略中转述策略的学习应成为重点。1.释义众所周知,由于不同的文化背景,我们无法在两种语言中找到一一对应的词,或者在我们的语言环境下有些词无法直接翻译,那么使用释义的方法把想要说的意思表达出来不失为很好的选择。在导游服务中,对成语和古诗词的翻译就可以使用转述策略进行释义,尽量把诗词和成语的神彩和韵味传递出来。在英语导游中,常常提到唐朝王之涣的这两句诗:“欲穷千里目,更上一层楼”。中文重意合,强调依靠悟性来达到理解的高度,英语重形合,用逻辑严密的语言结构来表达意义。根据这一特点我们采用这个翻译:Gofurtheruponeflightofstairs,andyou’llwidenyourviewathousandLi.译语按照因果关系,把原文的顺序进行了调换,通过释义的手段对古词进行处理,很好地反映了中文的本意。还有,我国各地都有讲求吉利的习惯,大家熟悉的“开门红”这个用语不能按照字面意思译成英语,应释义为tobeginwell,tomakeagoodstart,表示一开始就取得好成绩,释义使外国游客也能理解“开门红”的真正含义。2.替代在必要的时候我们借用一些词语或惯用语来翻译替代一些专有名词。湖南省常德市西部有个古郡叫“武陵”,境内一风景区因东晋陶渊明《桃花源记》而得名桃花源,“武陵”实为桃花源,将其替代为“peachBlossomStream”既具体,又可以增加上下文对美的遐想[2]。2006年,桂林市政府向全国征译“桂林山水甲天下”一语,英译状元广东吴伟雄的译文为eastorwest,Guilinlandscapeisbest,这是借用了英语俚语eastorwest,homeisbest,曾任的翻译唐闻生归纳道,译文既能准确表述“桂林山水甲天下”的涵义,也易于英语受众传颂和流传,这样翻译,宣传旅游比较合适。这种通过采用交际策略,解释涵义或借用他词而让游客接受并理解导游解说词的学习能让学生在自然真实的语言环境中拓展语言的思维空间,丰富语言储备,克服交流障碍。

(三)关于直译探讨旅游活动涉及到的很多地名或菜名都糅合了文化、历史事件、人名轶事等,对于那些带有浓重的中国特色和地方特色,尤其是需要具备相关的背景知识才能理解的词语,最好采用逐字地按照母语翻译的直译方法;另外,旅游翻译以口译为主,往往没有更多的时间进行“字斟句酌”,直译直接传递语言的意义。例如闽系名菜佛跳墙就用拼音译成Fotiaoqiang,这道菜不仅和一个故事有关,还涉及到宗教的内容,要让外国游客理解我们宗教的传统,需要进行更详细的介绍。这种处理方法不仅原汁原味地表现了我们的语言,还能提供相应的文化参考信息,促进文化的传递和交流。实际上,旅游活动中英语交际的实质内容之一就是采用我们文化所特有的形式直接而迅速地表达,直译的概念就是立足于这种文化交际的理念之上。

(四)关于回避探讨就理论而言,采用成就策略就是采取不回避措施的学习行为,这比采用减缩策略即回避困难的学习要好,因为采用转述、直译、替代等表达方法能传递更多的语言信息,丰富语言交际。但是在导游实务中,往往不得不采取回避的策略,以避免给游客带来不必要的理解障碍和困惑。据说,当年岳阳楼修起后,在三楼木壁上发现三个隐约可见的字:“一”、“虫”、“二”。人们不解其意,以为是仙迹。一日,李白来游,有人向他请教,李白一看,说:“这是一副对联。‘一’字是水天一色;‘虫’字和‘二’字是風月无边的意思。‘風’字没有边,只剩下‘虫’字,‘月’字没有边,只剩下‘二’字”。人们恍然大悟[3]。这个典故对于岳阳楼的旅游价值是不言而喻的。对于不懂汉语的国外游客来说理解的难度也是显而易见的。如要完整地表达这个典故,那就要详细介绍汉字的字形笔画结构。我赞成有些人的主张,对于这种具有中国特定文化意义的词语,外语只能解释它的意思,即使做了解释,游客也未必明白,对此,我们只能略而不译。事实上,文化因素时时刻刻在交际中参与着,只不过在什么阶段、什么层次、什么场合以何种方式参与交际而已。采用回避策略,只是考虑到在旅游活动中,游客的目的是休闲和了解异域文化,这有别于考古、科研等讲求探究到底的学术活动,采用这种交际策略恰好是顺应了在旅游活动背景下所形成的特有的语言使用环境。

(五)关于形体语言探讨在语言交际中,交谈的双方不仅通过语言得到对方的反应,还有很多的信息是通过点头、微笑甚至耸肩等非语言手段来传递的。表情、动作、手势时时刻刻都在传递着丰富的信息,成功的语言交际离不开传情达意的形体语言,而形体语言往往也能弥补语言上的不足。人们常用搓手表示为难,双手拍脑袋表示后悔,还有伸出两手指做“V”字状表示胜利以及表示oK的手势也是大家都很熟悉的。表示吃饱了的动作就是平铺手掌在喉咙或胸部示意一下,“看,都到这了”,说明已经不再需要食物了。形体语言除了有一定的通用性,又有它的特殊性。不同的形体语言在不同的民族文化背景下,往往又被赋予了不同的含义。在中国我们可以用手指点地向朋友介绍遇到的熟人,然而,俄罗斯人则认为用手指点人是极不礼貌的。可见,在利用形体语言进行交际时要注意民族价值观和审美观的差异。正确使用形体语言能够给英语交际带来很好的辅助作用,也能给旅游活动增色不少。

语言服务业概念篇9

关键词:译者;信息素养;信息全球化时代;信息需求

一、引言

翻译是一门学科,也是一门科学。翻译作为信息交换和信息共享的重要手段之一,为信息全球化发展搭建了桥梁。在信息全球化的时代背景下,翻译市场规模迅速膨胀,翻译行业表现出前所未有的社会可见度和发展势头。翻译业务范围不断扩大,以翻译服务为核心,涵盖本地化服务、语言咨询、语言培训和其他业务形式,促使传统的翻译行业逐步向语言服务行业转型(王少爽,2017:55)。我们身处信息社会,而在这个社会中的信息量是呈几何级数增长的,信息产业早已成为社会核心产业之一,这不仅意味着翻译需求量的增加,也代表着翻译的复杂程度有所提升。在这一环境下,翻译从业者的工作模式发生了巨大的变化。这不仅体现在从业人员数量、翻译服务内容、应用范围等方面,在翻译的实现方式、翻译工具、翻译材料交付等方面也发生了重要变化。在向语言服务行业转型的过程中,翻译行业对译者提出了新的要求——信息素养的形成,国家迫切需要具备优秀信息素养且熟练运用现代化信息技术的译者,而他们也更能适应时代的需求。信息素养的本质是译者在信息全球化时代所需要的基本能力。传统的信息素养研究主要局限于图书馆领域,其概念的阐述始于图书检索技能的发展。美国信息产业协会主席paulG.Zurkowshi于1974年首次提出了信息素养的概念,并将其解释为:利用大量的信息工具及主要信息源使问题得到解答的技能(Zurkowski,1974)。信息素养的概念一旦被提出,便得到了广泛传播和应用。世界各地的研究机构对如何提高信息素养进行了广泛的探索和深入研究,并对信息素养概念的定义,内涵和评价标准提出了一系列新的见解。1989年,美国图书馆协会的信息素养总统委员会在其年度报告中对信息素养概念的定义得到普遍认可:一个具有信息素养的人须能识别信息需求,还应具备定位、评价并有效使用所需信息的能力(aLa,1989)。20世纪90年代初期,Doyle在信息素养论坛的最终报告中重新引入了信息素养的概念。一个具有信息素养的人只有在确认了准确和完整的信息之后,才能在此基础上做出进一步的合理判断。依据信息需求形成问题并确定潜在的信息来源,开发成功的搜索程序,包括基于计算机和其他信息源获取信息、评估信息、实际应用组织信息。将新信息与原有的知识体系进行融合,并在批判性思考和解决问题的过程中使用信息(Doyle,1992)。信息的全球化发展为翻译提供了极大的便利,译者可以利用网络资源来解决翻译实践中遇到的各种翻译难题,甚至可以直接找到相应的已有译文作为参考以验证翻译的真实性,从而大大提高翻译的效率和准确性。从广义上讲,信息技术是指以网络通信技术为代表的多媒体(数字、图形、图像、声音和其他的媒体组合)和数字通信技术。今天的社会是一个信息高度发达的社会,信息技术发挥着越来越重要的作用。本文从信息全球化这个大背景出发,通过分析译者的信息需求,认为译者需要从语言基本功、广博知识和信息素养这三个方面全面提升自身综合素养,只有这样才能够真正成为国家需要的优秀翻译人才。

二、译者在信息全球化时代背景下的信息需求

信息需求是人们的基本需求,是人们为了解决从事各种实践活动过程中遇到的各种问题而缺乏信息和立足感。用户的信息需求不是一个形而上学,而是一个等级化的有机整体。娄策群(1999)将用户的信息需求分为三个层次:表面的信息需求,中间信息需求和深层的信息需求;岳剑波(1999)将其分为信息需求,感知信息需求,表达信息需求以及信息服务供给需求。这些理论具有鲜明的时代特征,无疑促进了对当代用户理论的深入研究。在信息全球化时代背景下,翻译过程涉及到多方主体和要素,致使译者受到诸多的繁琐问题的干扰,进而产生了多样化的信息需求。根据问题属性,可将译者的信息需求划分为五个主要层次:语言信息需求,这主要体现在译者自身的语言基础与翻译任务所需的语言知识不匹配,也可理解为前者理解导向的信息需求和后者表达导向的信息需求;专题信息需求,源于学科知识的细分使得翻译服务的交付需要译者具备一定的专业知识;技术信息需求,计算机辅助翻译工具的使用使得译者会更多的关注技术层面的问题;项目信息需求,翻译项目的委托方在提供项目信息时,由于各种因素的影响,可能会有误差,这就要求译者通过适当的方式填补信息差额来保证翻译项目的有序开展和顺利交付;行业信息需求,译者应密切关注行业动态,由于翻译与语言服务行业的相关制度、规范的尚不完善,多参与行业内交流活动才能不断提升职业认知与素养,做好职业规划和促进自身发展。译者的信息需求特点表现如下:第一,需求的信息范围之广、内容之多都是前所未有的;第二,需求的信息不再是单一语种,常常是要用两三种语言甚至更多去检索信息;第三,过多的信息需要译者对内容进行甄别以保证质量;第四,为保证翻译任务的顺利交付,获取信息的速度和效率要快;第五,不再局限于单一途径获取信息,更多的是互联网与实体相结合的方式。

三、译者在信息全球化时代背景下的信息素养

当今世界是信息全球化的时代,无论政治、经济、军事、文化、教育,均和信息息息相关,在对全球二十四个经济体和五个国际组织的21世纪核心素养框架进行详细分析以后,世界教育创新峰会(wiSe)与北京师范大学中国教育创新研究院共同的研究报告,结果表明信息素养被列为核心素养,排名第二。信息素养是一个综合的概念,不仅包括有效获取信息资源的能力和信息工具的使用,还包括信息的获取和筛选。处理、解释、传递、创造信息的同时,更重要的是保持独立自主学习的态度和掌握高效的方法﹑批判精神以及强烈的社会责任感和参与意识,并在解决实际问题的过程中充分运用它们。从理论上讲,信息素养应包括三个方面:信息意识、信息技能和信息伦理。具体而言,信息素养的要素应该包括信息知识、信息意识、信息能力和信息伦理。它是一种理解,收集,评估和使用信息的知识结构,其特点是能够高效,高效地获取信息,并能够熟练和批判地评估信息,准确和创造性地使用信息,追求与个人兴趣相关的信息,欣赏创造性地表达信息的作品和其他内容,努力做好信息查询和知识创新。翻译是一种不断产生信息需求的专业活动,译者如果想做好翻译工作,学会运用恰当的方式去理解、组织和管理繁复的信息是必不可少的。由此可见,信息素养与翻译能力对于任何一个翻译从业者都是不可或缺的。在翻译的过程中,译者在自身原有翻译知识和经验的基础上,为了解决实践过程中出现的问题就产生了对信息的需求,接下来就要使用各类检索工具在众多信息中搜集对自己有帮助的信息,有效获取、筛选信息,处理、解释和评估、使用信息。这一系列过程使得译者自身原有知识与检索得来的外部信息交互集成,有助于技术创新与知识共享,为日后解决其他翻译相关问题提供了有益支持,对个人和整个翻译行业的发展都是大有裨益的。要想成为一名具有良好信息素养的译者,在面对实际翻译问题的时候仅能够提出信息需求是远远不够的,在检索到信息之后,还要进行筛选、比较、评价等过程,最终选取最有利的信息进行整合与使用来解决在翻译过程中遇到的问题。当然,还需要有独立的自学态度和方法,树立终身学习的意识,不断更新完善自己的知识体系,这样才能提高作为译者的综合实力与竞争力,促进自身可持续发展和实现人生价值。翻译工作被认为是一项极为复杂的人类活动,著名的英国文学理论评论家Reciaz曾指出,“语际交流可能是迄今为止整个宇宙演变中最复杂的活动。”(张保红,2011:5)。在信息全球化时代背景下,译者需要获取、处理和使用海量与实际问题解决方案相关联的信息,翻译工作无疑是一种复杂的信息实践活动,因而译者需要从语言基本功、广博知识和信息素养这三个方面全面提升自身综合信息素养,只有这样才能够真正成为国家需要的优秀翻译人才。(一)译者扎实的语言功底。翻译是一种复杂的语言活动,需要翻译人员掌握至少两种语言,这是翻译的基本前提,否则翻译是不可能的。译者的翻译水平首先取决于阅读和理解原创作品的能力。作者认为,译者有必要阅读大量的书籍,阅读大量的双语语言材料,甚至背诵经典的双语章节,以锻炼其敏感而准确的语感。此外,译者还需要大量的翻译培训,以不断提高灵活处理双语语言材料的能力。(二)译者广博的杂学知识。译者需对杂学知识有广泛的了解,这是一个永恒的话题。在信息全球化的时代背景下,翻译不可能孤立存在,必然会与人文、经济和美学等各个领域的知识密不可分。只有积累了充足的杂学知识,译者才能在翻译的道路上走得更远。(三)顺应时代要求的信息素养为了应对信息全球化带来的信息需求,译者需要具备良好的信息素养。(1)文献检索能力是译者信息挖掘能力的重要体现,例如pB报告、aD报告、naSa报告等可提供专业主题知识,为科学和工程以及高科技领域提供信息支持。译者需要在长期翻译实践中以科学有针对性的方式寻求合适的专业检索工具,并合理使用。(2)利用搜索引擎获取识别译者所需的信息,如若合理使用,则可以帮助译者提高翻译效率并提供可以参考的有效信息。然而由于精度较低,译者的批判能力尤为重要。(3)计算机辅助翻译(Cat)软件系统的应用提高了译者的翻译速度,译者在同一平台上运作并生成翻译,以确保术语和内容的一致性。因此,译者在信息全球化的背景下必须掌握计算机辅助翻译软件,以便根据自己的工作最大限度地利用信息技术产品。

四、结论

语言服务业概念篇10

关键词:数据服务;领域本体;语义标注

中图分类号:tp319文献标识码:a文章编号:1009-3044(2017)06-0172-02

随着“互联网+”理念的涌现,越来越多的企业或个人加入到互联网中来,互联网中的信息也越来越多,为了方便信息的传递和分享,一些企业或个人以服务的形式对外自己的数据,为用户提供服务,这种方式被称为数据服务。然而,数据服务者存在不同的领域或行业背景,造成数据服务在描述上存在语义异构性,导致无法准确的匹配所需的数据服务,从而带来资源的浪费。传统的数据服务是数据密集型的web服务,已有研究对数据服务的描述大多采用ReStapi方式或者wS-DL式的web服务,然而这类web服务缺乏语义信息,在自动服务组合等方面存在不足。owL-Sfontologyweblanguageforservices)实现了web服务属性和功能明确的形式化表示,使得服务的描述具有了语义。但owL-S对服务的动态信息描述不足,不支持服务的动态复合。本文在语义标注概念的基础上,结合领域本体及语义标注技术,提出来一种基于领域本体的数据服务语义标注方法,为后续的数据服务发现、调用提供基础。

1领域本体

本体(ontology)起源于哲学,即概念的明确规范说明,是对世界上客观存在物的系统描述。近年来,人们将本体的概念引入人工智能、知识工程和图书情报领域,用于解决信息提取、知识概念表示和知识组织体系方面的有关问题。

由于应用领域的不同,对本体研究的侧重点也有所不同。涉及特定学科领域的本体,被称为领域本体(Domainontolo-gy)。领域本体是领域术语集和领域知识集的总体,是领域的概念化详细说明,可用本体语言将其详细说明。领域本体的目标是捕获相关的领域知识,提供对该领域知识的共同理解,确定该领域内共同认可的概念,并从不同层次的形式化模型上给出这些概念和概念之间相互关系的明确定义,提供该领域中发生的活动以及该领域的主要理论和基本原理等。

由于本体工程到目前为止仍处于相对不成熟的阶段,还没有一个标准的本体构建方法。领域本体的建设还处于探索期,构建过程中存在着很多问题,主要问题分析如下:1)需求不充分和无计划性;2)建设过程缺少规范性;3)成果没有评价标准;4)忽视本体的共享和重用。用。

2基于领域本体的数据服务模型

由于数据服务描述中wSDL的语义缺乏性以及owL-S存在着对服务动态信息描述不足、不支持服务动态复合的限制。本文将空间向量模型VSm引入进来,设计了一种基于领域本体的数据服务模型。使得数据服务兼具数据特征和语义双重优势,并能很好地进行服务组合及规划。

将数据服务中的wSDL文档中元素属性值进行解析,获得表示该数据服务描述文档的特征词集合。利用特征词向量之间的相似度和K中心算法对数据服务进行聚类,依据聚类的结果和相关领域信息构建相应的领域本体,即通过基于owL-S将各个数据源的数据模型映射到一个全局共享语义本体上,实现跨领域用户对数据服务语义的理解。结合构建的领域本体,计算每个特征词的权重,将特征词集合及其权重依据本体的空间向量模型VSm进行存储,把含有这些特征词的wSDL文档与相应的特征词进行关联,从而数据服务描述文档与领域本体之间的概念相互关联,即可基于领域本体实现数据服务建模。

3基于领域本体的数据服务语义标注方法

为了解决web上的数据服务之间存在的语义差异,本文结合构建的领域本体库,提出一种新的数据服务语义标注方法,对数据服务进行语义标注,解决异构数据服务之间的语义差异问题。

对所有的wSDL描述文档的特征词构建空间向量模型(VSm),wSDL描述文档以VSm特征项作为其表示的基本单位,所有特征项组成的一个n维特征空间向量:D=(t1,w1;t2,w2;ti,wi)表示一个wSDL描述文档,其中wi为第i个特征项ti在wSDL描述文档特征词中的权重。fij表示特征词i在第i个wSDL特征词文档中出现的频率,n表示所有wS-DL特征词文档的总数,ni表示出现有特征词i的wSDL特征词文档的个数。权重的计算方法为权重计算公式(1):

由D2可以看出,与领域本体库相关的特征词,特征词在对应的特征词文档中的权重发生了变化,“travel”特征词在wS-DL特征词文档DS1中没有出现,“travel”特征词在wSDL特征词文档中的权重为0,但是结合领域本体改进权重计算公式之后,由于本体中与“travel”相关的概念在wSDL特征词文档DS,中有出现,利用改进的权重公式计算,“travel”关于wSDL特征词文档DS,的权重变为0.1789而不是0,而与本体无关的“ip”的相应权重则不变。这样当服务请求者以“travel”来查询服务时,与“travel”相关的概念在wSDL特征词文档DS,中出现,即使“trav-ez”没有在wSDL特征词文档DS1中出现,wSDL特征词文档DSl相对应的数据服务也能被检索出来为数据服务请求者服务。