教育测评概念十篇

发布时间:2024-04-29 07:40:30

教育测评概念篇1

作者简介:黄小平,华南师范大学公共管理学院博士研究生,助理研究员;胡中锋,华南师范大学公共管理学院教授,博士生导师,副院长。(广州/510009)

*本文系2012年广东省软科学研究重点项目“广东省科技创新型人才素质结构与评价标准研究”(项目编号2012B070300050)资助成果。摘要:教育评价效度的主要问题是将教育测量的效度概念框架系统照搬至教育评价的效度概念系统,适合于教育评价理论与实践需要的效度概念系统尚未真正建立。本文依据教育评价自身的内在属性特征建构了8个教育评价的效度概念:目的效度、建构效度、内容效度、交叉效度、主体效度、过程效度、功能效度、结果效度,并对其依据及其内涵进行了阐述。

关键词:教育评价;效度;构建一、问题的提出

教育评价是根据一定的教育价值或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。[1]在教育评价实践中,一般要考察教育评价的结果多大程度上实现了既定的教育价值或目标;在具体评价时要考察教育评价指标反映教育目的的实现程度;在搜集各类教育评价信息时,特别是在运用评价工具和评价方法时要考察其能在多大程度上有效实现了对教育对象的测评;在实施某一评价活动时,如何控制影响评价结果有效性的各种误差变量,进而保证评价的内在效度;做教育决策时多大程度上可以将教育评价的结果推广至更大的被评价对象的情境、范围和领域,从而保证教育评价的外在效度等等诸如此类问题。从根本上说,一切教育评价活动的实现程度都必须通过教育评价的效度(validity)来进行评估和检验,并以此来判断教育价值或教育目标的实现程度。

二、教育评价效度的问题概述

(一)将教育测量的效度概念系统照搬至教育评价的效度概念系统

教育测量是对教育中的各种客体在某个或者多个属性上的特征的描述。其独特性在于测量是一种量化的描述,即运用数字系统对教育对象的属性的量加以刻画。在教育测量学的概念系统中,效度(validity)的经典定义是“指人们测量到了所想测量的东西的程度”[2]。因此,研究者在考察教育客体的效度类型时通常非常强调四种效度:结构效度(constructvalidity)、内部效度(internalvalidity)、统计结论效度(statisticalconclusionvalidity)、外部效度(externalvalidity)。概括而言,结构效度表示的是实际测量到的结构与预设的理论或构念(construct)相吻合的程度;内部效度表示的是变量与变量之间的确定性关系的程度;统计结论效度意指结论能够被解释并反映事物属性的程度;外部效度意指测量的结果能够被推广到其他情境的程度。

而教育评价是在某种标准(目标)之下对教育对象的价值或者特征的评判。价值在教育评价中不仅可以成为评价的对象,如考察某个教育对象的价值,还可以成为教育评价的标准,如评价标准的选择和确定。因此,从这一点而言,教育评价在评价中具有一定的主观性,是主观估计与客观测量的统一,而且教育评价活动往往比教育测量活动要复杂得多,从教育评价构成的系统要素而言,一项评价活动包括了价值目标和标准、组织机构和人员、评价方法与技术、评价对象与评价人员的心理调控等。从教育评价的客体(教育对象)以及关注的评价内容要素而言,教育评价远比教育测量关注的内容维度、评价方法、判断依据、价值判断等方面要丰富和复杂得多。因此,在考察教育评价的效度评价时我们不能忽略了教育评价与教育测量两者的联系,但同时更应当看到两者之间的区别,在实际应用时不能将教育测量中的效度概念移用至教育评价的效度概念体系当中。另一方面,应根据教育评价的研究对象及自身属性特征来确立其内涵及其概念,并建立教育评价特有的效度概念体系。

(二)适合于教育评价理论与实践需要的效度概念系统尚未真正建立

建立教育评价的效度概念系统是教育评价理论和实践发展的需要。在国内,少有研究者对教育评价的效度理论进行专门系统性的研究,较有代表性的研究有顾志跃[3],他从提高教育评价质量的角度出发,详细考察并分析了影响中小学教育评价质量的三个效度因素:外在效度,表现为评价结果与目的分离;内在效度,主要表现是信息与事实的之间存在偏差;结构效度,主要表现为指标体系与评价对象的非同构现象。这些效度概念仍然是建立在教育测量学的概念体系范畴之内,并未对教育评价的效度概念和体系做出更大程度上的拓展和建构。某种程度上而言,对教育评价的效度概念关注的甚少影响制约着我国教育评价理论朝着纵深方向发展。

而国外尤其是美国的研究者对效度理论的研究非常丰富,在教育测量与评价领域内,现代意义上的效度理论已经完全不同于传统的效度理论,如:(1)现代效度理论被定义为不是测量工具本身的属性,而是对测验分数进行解释和使用的支持程度。(2)messick[4](1989)在对教育考试的效度研究中提出了“效度整体观”(theunifiedconceptionofvalidity)的概念,并为效度验证(validation,简称效验,以下同)提出了具体的指导。(3)效验被认为是一个评价的过程。效验需要使用定量和定性的方法搜集足够多的证据来支持基于测试分数做出的推断。(4)传统效度理论中信度与效度的概念不同。在现代效度理论中,信度作为效度的证据来源也是效度的一个不可或缺的重要组成部分。在现代效度理论下,效验要求对测验从编制到解释、再到使用后果的整个程序进行拷问,因为“每个环节都是效度证据的重要来源”[5]。教育评价是否真实有效,需要“搜集证据”来验证是否达到了既定的教育目的或目标。因此,从教育评价理论发展的实际需要和国外现代效度理论发展的实际来看,需要根据教育评价本身的特点和属性来构建其概念系统。

·教育管理·论教育评价的效度及其构建三、教育评价效度概念的建构

由于教育评价所涉多个价值标准,因此较难依据一种价值标准来判断教育评价的效果,应从多个维度对教育评价的效度进行拓展并构建。

本文以构成教育评价系统的要素作为逻辑基点,分别考察评价过程中的目标、体系、内容、标准、方法、功能、主体、过程、结果等要素特征的有效性来论述建构教育评价的效度概念体系。

(一)目标效度,即某种教育评价目标以及教育理念的实现程度

目标效度即教育评价达到了某个既定的教育目标或价值的程度,这是教育评价最根本的价值体现,因为效度本身就是以“目的或目标”的实现程度来进行考察的。因此,目标效度是以针对“教育目标、教育目的”的实现为判断依据的。如果某项教育评价结果在实践中有证据表明达到既定的目标,实现并完成了最初所设定的教育目标价值,那么即认为评价项目具有一定的目标效度。从根本上说,目标效度所要考察的是教育评价的总目标以及总目标下的各个评价维度的子目标的实现程度,反映了教育评价的根本目的和价值要求。

(二)建构效度,即评价体系的目标和教育对象之间的一致性程度

messick[6]认为现代效度理论中最核心的效度是建构效度,并不存在几种不同的效度,如内容、实证、结构、概括化、外部和结果。我们认为将所有的效度类型都归结为一个建构效度显然太过于笼统,不利于对各种使用目的不同的效度做出区分,也不太符合教育评价的实际情况。因此,在教育评价领域中,建构效度不同于教育测量学的建构效度的含义,它通常是以设定的某个评价体系和编制的评价量表(测验工具)来表征和反映被评价对象。比如抽象的概念如创造力、智能;评价对象所在的水平状态如教育质量水平以及所包含的各要素的实现程度。建构效度所关注的是评价体系中的各个行为指标、要素特征、评价维度是否真实反映了评价的客体对象,最终要表达的是教育评价体系中的目标和教育对象之间的一致性程度。

因此,建构效度不仅是要关注理论或构念系统(有时可能并不需要某个构念系统,如依据一项结果是否达到教育政策的要求来给予评价),更要关注评价体系是否真实反映了评价客体的心理状态、行为取向、能力水平各方面的变化。同时一个具有良好建构效度的教育评价工具还可以准确地将一组被试和另一组被试区分开来。比如,一个评价工具要检测学生面向社会收集信息的能力,在检验这一评价结果时,如果所设计的评价项目能够将收集信息能力强与能力弱的学生分别开来,那么这个评价工具就有了建构效度。反之,如果评价的体系、维度不能反映学生在收集信息方面真实存在的能力差别,这个评价工具就没有建构效度。

(三)内容效度,即教育评价需要考察的内容或行为样本的适当程度

教育评价在实际操作时,需要对教育评价的总目标进行分解,总目标又具体分解为具体的教育子目标,而子目标又规定了哪些内容需要被考察以及相应的权重大小如何。因此,内容效度是对于要考察的内容或者行为样本的适当程度。在实际的评价过程中,内容效度是通过对评价目标以及具体的可操作的内容维度目标来进行检验的:一是反映总目标的维度内容的充分代表性,即维度目标是否被覆盖了所要考察的全域范围中的总目标要求;二是要评价的项目应是已界定好内容范围的代表性样本;三是要对每个项目所要评价的具体行为(如知识与技能)与上一级评价目标应保持一致,同时各子目标要相互独立,不能重叠,要力图反映总目标的要求。考察内容效度可采用复本法、再测法或者经验判断法。

(四)交叉效度,即各种教育评价方法相互检验和验证的一致性程度

实际评价中,多元性评价标准给评价带来了一定的困难。有时候,评价者在操作层面上将不同的标准加以融合是出于某一实用的动机,但往往忽略了“程序或技术的方法”与“逻辑证明的方法”之间的区别,对自己使用的方法背后的方法论缺乏自觉和反省。[7]结果,专家群体则很难对他们的研究进行质量评价。由于标准不同,这时在评估教育评价的效度时需要充分考查各种评价方法和标准的交叉效度。三角互证法可以用来检验不同的证据来源或不同的资料收集方法,其目的是为了在不同的标准之间进行相互证实。因此,可将此方法用作评估检验交叉效度的一种方法。

在教育评价中一般有两种基本评价方法:量的评价方法(亦称量化评价方法)和质的评价方法(亦称质性评价方法)。由于这两种方法采用不同的研究范式,因此,在研究方法、路径和步骤等方面具有很大的差异,评价效度的类型也有本质差异。如表1所示归纳了两种不同研究范式下的代表性方法以及据此建立的评价效度类型。

有必要指出的是,当两种方法整合在一起使用,这时如何考察评价方法的效度?其总的原则是在讨论量的评价结果时,则应考虑按数学概率的规则。将研究的结果推广到从中抽样的总体当中的适当性。在讨论质的评价结果时,则要根据质的研究目的、研究方法和策略以及研究步骤采用不同的效度评价标准及效度类型。如表1所示。无论是量的评价方法还是质的评价方法都需要从多方面寻找“效标证据”,同时考虑效度的测量指标的易获取性和可能性等因素。

(五)评价主体效度,即各种评价主体对评价客体评价结果的正确性和公平性

现代教育评价实践中,往往存在多个评价主体和多个利益相关者。因此,不同评价主体的评价目的不同,评价观念、评价标准、评价方法、评价工具的使用都可能带来很大的差异甚至相反,从而使评价失去效度。从本质上说,评价效度是针对于目的而言,不同评价主体由于评价目的、价值观、立场、标准不同,其评价效度可解释的范围、目的、价值性以及评价本身的意义都会不一样。因此,我们在对某项教育活动进行评价时,保证评价主体的一致性对于保证同一目的效度的评价就很重要。当然,即使是同一评价主体,其主体成员之间也存在着个体间的差异,在对某项教育目标评价时也可能因为个体之间对评价标准把握的不一致性从而带来评价者信度较低的可能,进而影响到评价的整体效度。

因此,在教育评价活动结束后,要考察教育评价的主体效度,对于评价主体效度要一分为二的来看待。

一方面,当存在多个评价主体时,此时就存在着多个评价主体效度,不同主体的评价效度之间还可以作为相互补充,便于教育决策者可以在多个效度之间合理筛选和评价,也便于集思广益,从而有利于教育决策者获得更多的教育评价信息,广开言路。

另一方面,由于存在多个评价主体,这会给效度评价带来一定的困难,使教育评价结果及解释存在着较大模糊性和不确定性,因而带来不同教育评价结果。尤其涉及到评价利益关系时,更会影响到教育评价活动的公平和公正,进而影响评价结果的有效性。因此,在重视评价主体效度的多元性对教育评价结果的促进作用的同时,还要根据教育评价使用的目的来对教育评价主体效度进行区分、比较和鉴别,选择评价结果效度较高的评价主体。

(六)过程效度,即教育评价收集各种评价信息和资料过程的有效性

教育评价的过程是由评价者组织实施,综合运用多种评价方法和工具,收集评价数据和信息的过程。评价活动的过程还是一个不断累积式、动态化评价的过程。因此,评价过程的效度关注的焦点是被评价者的“动态发展过程”,更加注重的是被评价者在既定评价目标下成长发生的经历,以及在整个教育活动中的历史和现实的绩效总和。如利用档案袋评价方法收集学生的优秀作品进行的表现性评价,再如对学校的发展性评价采用的增值性评价方法等。另一方面,教育评价的过程是整个教育评价活动开展的重要的评价步骤和实施依据,评价过程中的任何一个环节和关键评价要素,如对评价指标把握的宽严、对同一指标评价时产生的误差等都可能会影响到整体评价效度。又如在收集资料时,是采用问卷调查还是结构访谈的方法?是采用量的分析方法还是质的研究方法?一旦使用了不同的方法,那么评价的策略和重点就不相同。因此,在评价过程中需要综合运用多项效度指标。

过程效度如何考察需要综合来看。当收集被评价者的评价信息时,更多的则要关注资料的内部效度。当构建指标时,要充分考虑指标的科学性、完备性、独立性的同时还要考虑指标的区分效度以及各测量指标是否反映了总体目标程度的内容效度。要考察现有测量工具的预测效果时,则要考察某个工具的即时效度。当使用测评工具如某个心理量表时,则要关注测评工具的构念(construct)效度。当要对学生进行学业能力水平的形成性评价时,则要用到认知诊断评价工具,还要更多关注模型与方法的统计结果效度。因此,对于评价过程的效度评价而言,则是在各种综合效度都比较高的情况下作出的整体综合性的效度评价,有必要对评价过程当中使用到的方法、工具进行再评价,再检验(亦称为元评价),以确保评价的过程效度。

(七)功能效度,即实现教育评价目标既有功能的程度

教育评价具有选拔、鉴别、遴选、判断优劣、排序等功能,因此我们要考察教育评价的功能效度。功能效度是指实现了教育评价的既有功能的程度,体现的是教育评价的效用性(utility)。功能效度评价的内容具体主要表现为要体现教育评价增量性的指标,且要体现可行性、容易理解也便于操作。因此,功能效度关注的焦点是与教育评价功能直接相关的“结果性指标”效度。比如高考的评价功能是选拔,那么功能效度则具体表现为高考的入取率、重点大学入取率等功能性的可考察指标,这些指标可以作为效度评价的最重要依据。事实上,教育评价的功能效度直接体现了教育评价目标的实现。持有何种教育目的实际上决定了评价者使用何种评价功能,也因此决定了评价的功能效度。

(八)结果效度,即教育评价结果的实现程度

功能效度和目的效度以及最终表现的结果效度都是一脉相承的,即评价结果在多大程度上实现了预期评价目的、评价目标,体现出评价者使用意图以及教育目标价值,同时也能更好反映被评价者的评价需求,并能在实践中取得成效。因此,概括起来,结果效度可以从以下四个方面进行考察。

第一,结果效度要反映评价者使用评价的目的,即满足目的的需要。

第二,评价信息的反馈要反映被评价者的各种需求,特别是教育评价的结果要让被评价者得到认同,这样才能达到教育评价的最初设想和目的,也才能更好的发挥教育评价的督导作用。

第三,评价的结果要能在实践中得到验证和应用,并最终取得一定的教育成效,即效用(utility)。

第四,教育评价结果可推广到的目标团体和范围。

因此,结果效度的内容包括:满足评价目的,得到被评价者的认同需求,有教育成效,可推广性。

综上所述,教育评价的效度概念的内涵是非常丰富的。因此,构建效度评价的指标应当是多维的、多视角来综合考量的。与教育测量的效度概念相比,教育评价的效度概念被赋予的内涵远比测量的效度要深刻丰富得多。通过以上分析论述,教育评价的效度可概括为以下八个基本方面:(1)目标效度——某种教育评价目标以及教育理念的实现程度。(2)建构效度——评价体系的目标和教育对象之间的一致性程度。(3)内容效度——教育评价需要考察的内容或行为样本的适当程度。(4)交叉效度——教育评价方法、标准相互检验和验证的一致性程度。(5)评价主体效度——各种评价主体对评价客体评价结果的正确性和公平性。(6)过程效度——教育评价收集各种评价信息和资料的过程的有效性。(7)功能效度——实现了教育评价目标既有功能的程度。(8)结果效度——具体表现为教育评价最终的价值实现程度和满足主客体的价值实现程度,具体评价的维度又可分解为目的效度、需求效度、成效效度以及外在效度。

四、结语

以上仅从教育评价本身的属性特点建构了教育评价的效度概念,并试图拓展和构建了教育评价效度的内容及其评价的方法。实际上,由于教育评价活动本身的丰富性、复杂性和多元性,决定了教育评价效度的评价方法也存在着多元化,正如巴顿在《效用为本的评价》中所提到的那样,“要确保评价具有效用、可行性、理性和准确性,就必须具有情境的敏感性、方法的灵活性,评价者角色的多元化、良好的政治修养和创新”[9]。为此,我们还要在实践中不断寻找出具有可实际操作性和可考量性的效标评价依据。

注释:

①表1中有关效度概念的分类是由maxwell(2002)在定义“定性研究中的效度”时提出来的。描述性效度指的是准确性(研究者间的一致性,对于物理和行为事件存在的认同的一致性,如频数)。解释效度指的是从参与者的角度揭示行为或行动的意义。理论效度针对的是研究者的构念,包括独立构念和构念之间的因果关系。推广效度指的是将结论推广至本社区的人、组织或者机构。评价效度从价值观的角度评价行为或者事件的适合性。

参考文献:

[1]胡中锋主编.教育测量与评价[m].第2版.广州:广东高等教育出版社,2006.11.

[2]胡中锋,莫雷.心理与教育测量中效度理论的重建[J].华南师范大学学报(社会科学版),2007(12):82-90.

[3]顾志跃.对我国中小学教育评价的质量分析[J].上海教育科研,1992(6):19-23.

[4][6]messickS.Validity[m].in:R.L.L.inn(ed.).educationalmeasurement.newYork:americanCounciloneducation/macmillanpublishingCo.(3rded.),1989:13-103.

[5]DowningS.twelvestepsforeffectivetestdevelopment[m].in:S.Downing&t.Haladyma(eds.).HandbookoftestDevelopment.mahwah,nJ:Lawrenceerlbaumassociates,2006:3-25.

[7]陈向明.质的研究方法与社会科学研究[m].第1版.北京:教育科学出版社,2000.475.

教育测评概念篇2

论文关键词:高等教育;质量与水平;评价指标

据统计,2008年中国各类高等教育总规模达到2907万人,继续稳居高等教育大国的位置。与此同时,高等教育面临的挑战也相当严峻。挑战的严峻性主要集中在以建设高等教育强国为战略目标的高等教育质量与水平的提升。建设高等教育强国是一个长期而复杂的过程,在这一过程之中,高等教育质量与水平评价指标体系则发挥导向作用,指导高等教育各个方面向前发展。因此,如何构建评价高等教育质量与水平的指标体系,采用何种分析框架,是目前中国高等教育迈向高等教育强国过程中必须正视和急需回答的一系列问题。

一、评价指标体系设计依据

目前,对于评价指标体系设计的依据主要有两个方面,一种是从概念分析出发,通过演绎的方式对被评客体属性有关内涵进行分解进而生成具有相互关联的各项指标,另外一种是根据评价目的来确定评价指标体系。评价目的是指进行评价活动所要达到的目标和要求,对评价指标的设计具有导向作用。不同的评价目的会导致评价指标体系的差异。根据评价目的来确定指标体系的具体步骤为:先从评价目的结构分析入手,认真分析评价目的所包含的各种因素,并将其全部罗列出来,再经过反复的分析、筛选,最终提炼出最能反映目标体系的指标,从而形成指标体系。当然,两种方法并不互相对立,在恰当的情境中两者可以很好地结合。对于高等教育质量与水平评价指标体系构建来讲,其最终目的是建设高等教育强国,所以,评价指标体系的设计既涉及对高等教育质量与水平的概念演绎,也要将其与建设高等教育强国的目的结合起来。

(一)高等教育质量与水平的概念演绎

当将“质量”与“水平”两个概念连接在一起的时候,在不同的场合或语境所表达的意思侧重点不一样,在过程评价中,“质量与水平”的重心放在“质量”上,在结果评价中,重心则放在“水平”。因此,在作为过程的指标体系的构建中,概念的演绎应该将重心放在“高等教育质量”这一概念上。

高等教育质量是个见仁见智的概念,其中尤以联合国教科文组织在考察世界各国高等教育情况基础上所提出的高等教育质量概念最具有代表性和全面性。“高等教育的质量是一个多层面的概念,应该包括高等教育的所有功能与活动:各种教学和学术计划、研究和学术、教学人员、学生、楼房、设施、设备、社区服务以及学术环境等等”,“还应包括国际交往方面的工作:知识的交换、相互联网、教师和学生的流动以及国际研究项目等”。因此,可以根据对高等教育质量概念的演绎,选择有代表性和可行性的指标,共同构成一个完整的指标体系,全面反映高等教育质量的各个方面。

(二)高等教育强国的内涵、特征

高等教育强国的内涵和特征是什么?指标设计如何体现这些内涵和特征?现有文献分析表明,虽然不同的学者对于高等教育强国这样一个复杂概念有不同的分析和解读视角,但是数量、要素、结构、功能、环境、输人、输出却是绕不开的理解维度。具体而言,一个国家之所以可以称得上高等教育强国,关键在于“它拥有较大的高等教育规模和较高的高等教育普及率”(数量、输入);在于“它培养出一大批具有国际影响的高水平的人才”(输出);在于“它建有若干所世界一流的大学或一批世界一流的学科”(要素、输出);在于“它已经形成多样化、多层次、多类型、布局结构合理、开放的高等教育体系”(结构);在于“它的高等教育系统已与本国的社会各子系统已形成功能耦合关系,能够全面适应经济社会发展的需要”(功能);在于“它是世界知识创新、科技创新和高等教育创新的‘集散地”’(输出)。因而,在设计指标体系时必须以上述高等教育强国的特征为依据,进行逐层分解并体现在具体的指标上。

二、评价指标体系构建

(一)指标体系分析框架

在逐层分解出评价指标之后,一定要有贯穿其中的理论分析框架将所有指标组织起来,才能发挥指标体系所具有的功能,使深入分析成为可能,否则,分解出来的指标只是一种教育统计数据的堆积。建设高等教育强国的评价目的一方面使评价指标体系不得不放在国家层面来考虑,另一方面也蕴含着对于高等教育质量与水平的评价不是为了证明,而是为了改进。对于前者,长期致力于教育指标研究的专家约翰斯通(johnstone,james.n.)认为,在建构国家层面的教育指标体系过程中,教育输入、过程与输出这个框架仍是最常用的分析架构;l6对于后者,则与斯塔弗尔比姆(stuflebeam,l.d.)所提出的教育评价的cipp模式具有恰切性。cipp即为背景(context)-投入(input)一过程(process)一结果(product)的评价模式。_7因而,结合高等教育质量概念演绎和评价目的,可将评价指标体系纳人背景一投入一过程一结果的分析框架,并将其列为评价指标体系的一级指标。在一级指标下,确定生源与规模、学术基础设施、教育投入、科研投入、学生类型、教师资源、学生投入、教育资源转化、人才培养结果、学术和科研产出、社会服务、国际影响力等12个二级指标,二级指标之下又设立32个观测点,构成高等教育质量与水平评价指标框架(见表1)。

(二)观测点内涵与重要性说明

1.与高等教育背景(资源基础)相关的观测点

人是教育的出发点和归宿点,在评价一个国家的教育水平时,人口统计上的特征是一个重要要素,对于高等教育来讲也不例外。人均受教育年限反映的是某一国家人口接受教育的总体水平,受教育年限越长则人口中接受教育的水平越高。完成高中教育是青年人进入高等院校学习的基础,因此高中教育的毛入学率直接影响高等教育的毛入学率及其规模。高等教育毛入学率反映的是国家提供高等教育机会的整体水平,实质上是高等教育培养人才能力的一个标志。学生均拥有图书量和在校生计算机普及率是评价国家或地区学术基础设施能力的指标。从高等教育的逻辑起点高深学问来看,对高深学问的保存、共享的方式和手段则对高等教育和研究有着重要的作用。信息社会,互联网时代,个人计算机不仅为身处高等教育领域的人们打开了交流高深学问的新通道,而且也为高等教育找到高校与社会资源相互合作的途径和方式。当然,传统以图书来保存、共享知识的方式也不能丢弃。

 

2.高等教育投入观测点

合理的教育财政投入比例是教育发展的重要保障。在反映高等教育投入的各个指标中,政府对高等教育的财政支持力度和投向直接影响到高等教育质量的高低。公共教育经费占gdp的比例反映了一个国家对教育投入的总量,也是衡量一国政府对教育努力程度的主要指标;高等教育经费占总教育经费的比例反映一国政府在总体财政资源中如何对各级教育进行分配;高校生均经费指数含义是一个国家用一个gdp支撑了几个学生完成其一年的学习,也可以说相对于一定的经济发展水平,一个国家拿出多少财力支持相关教育的发展。从经费来源结构上看,高等教育的社会效益为政府对高等教育投入并发挥主导作用提供了充分合理性,但是,由于政府对高等教育投入的增长无法满足人们对高等教育日益增长的需求,非公共资金带着满足利益相关者的兴趣、需要的使命介入高等教育的现象开始在全球出现。因此,观测点“公共高等教育经费占gdp比例”与“非政府高等教育经费占gdp比例”在结构上的伙伴关系也会影响一个国家高等教育系统的使命和质量。与扩大高等教育入学机会一样,促进高等教育公平也是提高高等教育质量的一种方式和衡量手段。“学生资助经费(奖学金、贷款等)占高等教育经费的比例”反映了一国政府对弱势学生群体入学机会的关注和资助力度。

通过研究促进知识的发展是高等教育系统的重要职责,研发经费是保证高校实现这一职责的重要保障。“高校研发经费占gdp的比例”反映了一国企业、政府、高等教育部门、私人非营利部门对研发的投入力度;“高校科研经费占总科研经费的比例”反映了研发经费在上述各部门的分配。

3.体现高等教育过程的观测点

对过程的监测也是保证质量的重要手段。与高等教育过程相关的主体主要有学生和教师及两者的比例。观测点“5a类学生比例”、“5b类学生比例” 和“博士生比例”反映了高等教育结构的多样化程度及比例与社会需求的协调性。学生是学习的主体,学习效果既取决于学校的教学安排,也取决于学生课后的自主学习。与其他观测点相关的统计数字不同的是,观测点“学生课后自我学习时间”需要通过抽样调查来获得相关的数据。拥有博士学位是大多数国家高校教师的入场券,因而,拥有博士学位教师比例反映了一个国家高校教师所具有的基础学术训练水平,也体现了师资的质量与水平。教师年薪占人均gdp比例是反映高校教师职业获得经济收入在社会各职业中所占的位置,是教师职业是否具有吸引力的标志。生师比是影响教育质量的重要指标。生师比越低,师生之间互动的机会可能越多,学生得到教师的指导就越多。反之,亦然。

4.高等教育结果观测点

结果是直接体现质量的直接观测点。在高等教育的人才培养结果中,观测点“25—64岁人口接受高等教育的比例”反映以往高等教育培养人才的存量。高等教育所培养的人才必须能够参与经济活动才能体现出其质量和价值,观测点“经济活动人口教育程度构成”中高等教育的比例说明了这一点。

科研产出的具体观测点包括“师均日论文数”、“师均sci论文数”、“师均专利授权数”、“高被引论文数”。虽然科技论文ei、sci收录和被引是一个在国际学术界广为争议的话题,但是在没有更有效的衡量方法出现之前,其对科研质量的度量仍然是主要的方法。由于高深学问只有同行才能理解,高被引论文则通过同行评价体现了科技论文的质量。专利本身的特点之一就是要有新颖性,反映了技术发明创造活动的水平。

根据高等学校的社会服务职能的含义是“以直接满足社会的现实需要的为目的、以教学和研究职能为依托,有目的有计划地向社会提供的具有学术性的服务”,指标体系将“高校年均非学历教育人次”和“师均技术和专利转让收入”作为评价高等学校社会服务的观测点。

正如克拉克·克尔所言,“大学按它对普遍知识的承诺的性质而论,本质上是国际机构”,因而,吸引着来自许多国家的学生与教师。观测点“留学生占全球国际生比例”、“外籍教师占本国教师比例”体现了一国高等教育系统从其他系统获得资源的吸引强度。这种资源在反映本国高等教育质量与水平的同时,也通过交流、理解促进该国高等教育质量与水平的提升。世界一流大学是一国高等教育系统的标杆或高地,在各种不同世界大学排行中,一国的高等教育机构居于何种位置、数量的多少体现了该国高等教育标杆或高地高度。观测点“上海交通大学世界大学学术排行前500的高等教育机构数”和“泰晤士高等教育增刊世界大学排行前20的高等教育机构数”分别从学术排行和声誉排行两方面分别反映一个国家高等教育机构的国际学术地位和社会声誉。

三、指标体系构成特点

高等教育质量与水平评价指标体系构成特点可以参照图1来理解。

(一)反映高等教育质量的本质特征

指标体系从高等教育质量概念的内涵演绎出发,使具体的观测点并不是一种主观判断,而是有着比较充分的依据,反映高等教育质量的本质特征。

(二)以诊断和导向为功能

评价指标体系的构建以建设高等教育强国为目的,因而,具有诊断和导向的功能。通过观测指标观照高等教育,诊断发展过程中所存在的质量问题,找出解决问题的对策,进而发挥其导向作用,指导高等教育各个方面向前发展,最终达到高等教育强国的目的。

(三)反馈性与可塑性的统一

一方面,指标体系的构建不仅遵循着输入——过程——结果的分析框架,而且在体系内存在着反馈回路,体现为结果评价不仅可以夯实高等教育的基础,而且可以刺激高等教育投入。另一方面由于高等教育职能的多样化,指标体系可以根据研究的需要变换组合,具有可塑性。

(四)过程考察与结果考察的统一

针对以往评价指标体系注重结果评价的弊端,该评价指标体系在重视结果评价的同时增加了反映教育过程的指标。

(五)与社会、经济发展密切相关

教育测评概念篇3

对学生满意度的研究起源于上世纪中叶,并且受顾客满意度理论的影响很大,无论在概念界定还是模型构建方面对顾客满意度理论有一定程度的借鉴。对学生满意度的研究,不仅可以测量学生在校期间的态度与感受,而且可以为提高学校的教育质量提出改进意见或建议。笔者通过对过去十多年的文献进行梳理,发现我国学者对高职院校学生满意度的研究主要有以下几个方面。

一、高职院校学生满意度的概念研究

从心理学上来讲,满意是指在完成一项活动,或体验某种服务之后所产生的一种愉悦感觉,具有主观性的特征。而满意度就是对这种主观感受的度量。对学生满意度的研究,不同研究者有不同的理论视角,因此,对学生满意度的概念界定也不尽相同。总结起来,可归为以下几种:

(一)整体性概念

整体性概念是对学生满意度概念的概括性解释,能够了解学生满意度的总体状况。它将学生满意度看作是一个单一整体,其研究范式是“总的说来,您对自己在校期间的满意度状况作何评价”。这种概念侧重于对学生在校期间的主观感受或态度的测量。例如,台湾学者张霞就将学生满意度界定为学生对其所经历的学习活动的主观感受或态度。而这种主观感受或态度又将成为学生满意度状况的重要标志。整体性概念便于理解,且易于测量学生在校期间的整体满意度状况。但这种概念的缺点是不能了解学生在具体方面的满意度状况。

(二)要素性概念

要素性概念主要指学生对在校期间各项经历的认知评价和情感反应,它重在探究学生的满意度水平受哪些因素的影响。要素性概念的任务首先要确定学习由哪些方面构成,涉及学习的具体方面,包括学习环境、教学质量、教学设施、师资力量等等。要素性概念不仅能够确定学生在校期间对各个方面的满意度水平,而且有助于进一步确定学生满意度的结构。

(三)期望差距概念

期望差距概念认为,学生满意度水平等于学生在校期间“希望得到的教育服务”与“实际得到的教育服务”之间的差值。如果两者之间的差值较小,则学生满意度水平就较高,反之则学生满意度水平就较低。期望差距概念为学生满意度概念的界定提供了一个量化的研究视角,但这种概念淡化了对学生满意度的影响因素研究。

综上所述,不同研究者对学生满意度的理解不同,在对其进行概念界定时也各有自身的特点。如前所述,学生满意度的整体性概念只是从总体上了解学生满意度的状况,而不能深入了解学生满意度的特点,因此,在具体研究中,研究者更倾向于从要素性概念与期望差距概念方面对学生满意度进行界定,并在此基础上构建学生满意度测评模型。

二、高职院校学生满意度模型研究

近几年,我国学术界对高职院校学生满意度的模型建立、指标体系的研究文献相对较多。罗新、李建湘参考企业顾客满意度指标体系,并依据高职院校自身特点建立了一套指标体系,该指标体系主要包括顾客对学校的总体印象评价、对学校产品评价以及对学校服务的评价三项要素。钱敏、叶文振立足于福建地区,从学生角度分析了学生对高职教育教学质量的主要关注点,构建了指标体系,包括专业知识教学质量满意度、职业能力训练课程满意度、综合素质教学质量满意度、学院师资服务满意度四个维度。简彩云运用层次分析法确定高职院校学生满意度测评指标体系,该指标体系分为四个层次的评价目标。第一层为一级评价指标,即高职院校学生满意度(指数);第二层是二级指标层,即调查项目层,包含6个项目指标,即学校形象、基础条件(设施)、教学质量、学院管理、学生支持、学生发展;第三层是三级指标层,即基础指标层,包含23个指标;第四层为四级指标,为影响基础指标的因子(“学校形象”、“学生支持”与“学生发展”只设置三级指标)。欧阳河等人在参考国外高等教育机构的调查量表和国家本科教学评估指标体系和内容的基础上,确定了专科生满意度测评量表,该量表包括课程和教学、生活和环境、信息资源、入学和就业、咨询和建议、收费和资助、个人发展七个维度。李桂荣、李志构建了包括教师、课程、学习、管理、住宿、饮食、就业七个部分的高职院校学生满意度指标体系。汪雅霜基于“国家大学生学习情况调查”的数据分析,从教师教学、人际关系与校园支持三方面对高职院校大学生进行满意度调查。李振祥、文静在理论梳理与调查访谈的基础上,分别从课堂教学、教学过程、教学关系、学校有关制度以及配套措施、图书馆资源、学校餐饮质量、学校住宿情况、学生各种人际关系等方面进行指标体系设计。袁宜英等人借鉴美国noel-Levitz公司的SSi(nationalStudentSatisfactioninventory,简称SSi)、加拿大安大略省职业技术院校业绩评价指标(ontarioCollegesofappliedartsandtechnologykeyperformanceindicators,简称Kpi),并结合“学生涉入理论”、“学生参与度理论”、“学生学习成果评估”等相关理论与实践成果,按照多层次分析法的原则,构建了课程学习环境、课程学习体验、技能训练过程、学校管理与沟通、受关注程度、自我发展等6个维度的指标体系。

总之,学术界对学生满意度模型、指标体系的构建,大多是在借鉴和应用国外满意度指数模型的基础上,再结合中国高职院校自身特点与实际情况进行的,并且,大多数研究者都是从学校软硬件、教学过程、专业建设、个人成长发展等方面来构建模型。

三、高职院校学生满意度的影响因素研究

对学生满意度的影响因素研究大多是从人口统计学变量和组织学的角度进行研究的。人口统计学变量有性别、年龄、学历、专业等;组织变量有学校性质、学校规模等。林丽卿的研究发现,学生满意度水平在年级、生源类型、学校性质等因素上存在显著差异,而性别、生源所在地、专业类别不同的学生满意度不存在显著差异。欧阳河对不同专业的学生满意度水平进行比较,结果表明:理学、工学、教育、医学、哲学专业学生的满意度高于平均水平;历史、法学、农学、经济学、管理学类、文学类及其他专业的满意度低于平均水平。以理学类专业满意度最高,法学类专业学生的满意度最低。高敏通过分析调查数据发现,就业前景满意度、运动与体育设施的满意度水平在性别、年级因素上差异较大。刘新学、董仁忠通过对文理科专业间的数据进行统计分析表明,学生满意度水平在文理科之间存在统计上的显著差异,其余因子则没有达到统计上的差异。李振祥、文静的研究选择性别、生源地和年级作为变量,对总体满意度进行统计分析,研究发现:在性别、生源地与年级变量下,学生总体满意度均存在差异。钱敏、叶文振的研究发现,性别、党员与否、生源性质、年级以及家庭收入在学生满意度不同因子上存在显著差异,具体表现为:男生与女生、党员与非党员在专业知识教学质量满意度方面存在显著差异;生源性质对该校职业能力训练课程的满意度存在显著差异,生源为文科、理科、单招、五年专的学生对职业能力训练课程的满意度依次下降;学生年级与综合素质教学质量满意度呈显著负相关,学生干部的满意度要高于非学生干部;家庭月收入在1000元以下的学生对此项的满意度要低于其他学生,家庭月收入在1000元以上的学生之间对此项的满意度没有显著差异。

对以上文献进行分析研究发现,不同的研究者对学生满意度的影响因素研究所得结论不尽相同。但不可置否的是,性别、年级、专业等人口统计学变量对学生满意度有着不同程度的影响。

四、高职院校学生满意度测评模型指标赋权的方法研究

评价指标确定之后,紧接着应对指标进行权重分配。权重分配在指标体系设计中的意义也不容小视。相同指标组成的指标体系会因权重分配的不同而使评价结论大相径庭。所以,分配指标权重应严格根据各具体指标在整个指标体系中的地位、作用和对评价目标贡献程度的不同而予以分配,而且权重一经确定,就应保持其相对稳定性。分配指标权重的一般顺序为:首先,确定一级指标的权重,各个一级指标根据各自对指标体系的贡献程度而获得相应的权重;然后,确定二级指标的权重,各个二级指标再根据其所属的一级指标的贡献程度而获得相应的权重;以此类推,直至末级指标。指标权重可用小数、百分数或整数来表示,具体选用何种数值表示,视具体情况和需要而定。指标体系权重的确定有很多方法,如经验法、德尔菲法、层次分析法、专家法与综合法等。

简彩云在大量的学生调查与文献研究基础上,应用层次分析法确定了高职院校学生满意度测评指标的权重,为高职院校学生满意度测评研究提供了可供操作的数据信息。欧阳河等人的研究则从高等教育行政部门、湖南高校和高等教育研究机构选择了13位专家,运用德国不来梅大学的授权评估法(ee-tool)请专家对一级指标进行权重分析,同时对原有的二级指标做进一步的分析和论证。宋彦军的研究基于因子分析法在确定指标权重时的客观性比较强,采用因子分析法来确定指标体系中各项二级指标在高职教育服务学生满意度中的权重,用同样的方法可以计算出各项服务的第四级测评指标的权重。

指标体系权重是反映测评指标对满意度影响的重要尺度,科学、合理地设计指标体系,才能真实反映学生的满意度水平。现有研究不仅运用层次分析法、专家法等主观方法来确定指标体系的权重,而且也运用因子分析法、主成分法来确定指标体系的权重系数。

五、高职院校学生满意度研究存在的不足

综上所述,目前对高职院校学生满意度的研究,在概念界定、模型构建和实证调查方面都取得了一定的成果。但仍然存在着一些不容回避的问题。

第一,高职院校学生满意度研究的高职特色不突出。高职院校学生满意度的影响一方面受顾客满意度研究的影响,另一方面受本科院校学生满意度研究的影响。在概念界定、理论探讨、模型构建等方面基本借鉴了顾客满意度理论及本科院校学生满意度研究的已有成果。这就导致现有研究忽视高等职业教育的特殊之处,没有提出和建立适合高职院校学生特点的满意度测评模型和指标体系。

第二,研究内容缺乏全面性。现有研究尽管研究了学生对高职院校管理、教学、学校硬件设施等方面的满意度状况,但对影响学生满意度的因素分析仍较为欠缺。而且多数研究探讨了人口统计学变量对学生满意度的影响,而对其他影响变量,如组织学变量、心理因素等则研究甚少。只有通过对学生满意度影响机制进行深入分析,才能对如何提高高职院校教育服务质量及学生满意度水平提出切实意见与建议。

第三,研究方法缺乏严谨性。现有研究虽然都强调实证研究方法的运用,但仍存在很多不规范现象。如选择调查样本时没有完全按照抽样的原则,对构建的指标体系没有进行权重分析,不注重对所编制的量表进行信度、效度检验,等等。这些现象的存在导致人们对调查的有效性产生质疑。

第四,研究对实践的指导意义有限。现有研究多侧重对学生满意度结果的描述性分析,并在此基础上提出一些粗浅的意见或建议。由于缺乏对学生满意度成因的深层次探讨,因此,所提意见或建议很少能触及问题的本质。更重要的是,能付诸高职院校教育质量改革的应用研究少之又少,也很难为高职院校在保持和提高学生满意度方面提供有针对性的建议。

对我国高职院校学生满意度文献进行综合分析,可以看出,对高职院校学生满意度的研究越来越受到重视,在高职院校改革教育质量过程中的价值和作用越来越显现。有关高职学生满意度的研究,不仅有对学生满意度的理论探讨,而且更有对学生满意度测评的实证调查。尽管对学生满意度的研究已有朝纵深方向发展的趋势,但现有研究在理论探讨和实证研究层面仍然存在诸多不容忽视的问题。如缺乏对学生满意度理论支持的深度探讨、没有形成对学生满意度定义的共识、对学生满意度的研究还不够全面系统、所编制的学生满意度量表存在缺陷、缺少实证研究的数据挖掘技术等等。因此,对高职院校学生满意度的研究,应加强对学生满意度理论及实践问题的反思,不仅关注学生满意度调查结果的现状描述,更要进一步探讨结果背后所隐藏的实践价值问题。

参考文献:

[1]张霞.大一学生时间管理训练对成就动机和学习满意度的影响[D].长春:东北师范大学,2006.

[2]罗新,李建湘.高等学校顾客满意度的定量评价方法研究[J].技术经济,2006,25(10):22-25.

[3]钱敏,叶文振.从学生满意度进行的高职“差异化教学”研究——以福建金融职业技术学院为例[J].高等教育研究,2007,23(1):71-73.

[4]简彩云,刘爱莲,李海燕.高职院校学生满意度实证分析[J].辽宁教育研究,2008(11):53-56.

[5]欧阳河.学生评价高等职业教育服务质量实证研究——以湖南高专2008届毕业生满意度调查为例[J].中国职业技术教育,2009(9):49-54.

[6]刘金兰,宋彦军.高职教育服务学生满意度指标体系研究[J].中国职业技术教育,2009(17):35-38.

[7]李桂荣,李志.高职院校学生满意度现状与提升策略研究[J].中国成人教育,2010(2):84-85.

[8]汪雅霜.高职院校大学生满意度研究——基于2011年“国家大学生学习情况调查”数据分析[J].中国高教研究,2012(7):85-89.

[9]李振祥,文静.高职院校学生满意度及吸引力提升的实证研究[J].教育研究,2012(391):71-76.

[10]林丽卿.高职学生教育服务满意度的实证研究[J].高教论坛,2013(11):89-92.

[11]袁宜英,吴念香,张坚雄,李青.高职院校质量监控抓手:教学质量学生满意度调查[J].中国职业技术教育,2014(13):84-87.

[12]高敏.高职院校学生满意度调查研究——以无锡职业技术学院为例[J].顺德职业技术学院学报,2011,9(2):39-42.

教育测评概念篇4

教学评价的构建最具挑战性,也最为关键。ShawnStevens等人提出以“结构为中心”的评价,诺曼・e・格伦隆德、C.基思・沃等人提出了“对学生进行有效评测的指导方针”,markwilson提供了BeaRSystem模型。我认为,每位教师(或学科)都可以围绕特定教学主题,按照如下路径构建利于核心素养落地的教学评价,即评价什么(确定概念基础)、如何评价(规定评价模式)、怎样实施(具体实施评价)、如何应用(结果分析利用)、是否有效(整体评估修正)。由于篇幅所限,本文重点阐述评价什么和如何评价。

1.基于核心素养的评价框架

在实践中,将某教学单元与核心素养联接起来至关重要,只有如此,核心素养才会成为教学根据,教学的改变才会真正发生。

由安德森和克拉斯伍(anderson&Krathwohl)修订的《布卢姆教育目标分类法》提供了“知识与认知过程的二维结构”。该框架分横向的认知过程维度和纵向的知识维度,认知过程维度分为记忆、理解、运用、分析、评价、创造六个方面,知识维度分为事实性知识、概念性知识、程序性知识、元认知知识四个方面。该框架与核心素养的指向是一致的,当然,核心素养不是停留在某一点或某一块,而是可以伸展到整个框架。所以,可以⒄崭眉芄菇核心素养与特定教学单元形成关联,并注意对该框架的“全覆盖性”,从而使核心素养“具体化”。

对某内容,可按“知识维度”分类,教师按照不同的知识维度涉及的学生认知过程进行教学设计。如《辛亥革命》一课中,事实性知识如中国同盟会、革命纲领、黄花岗等武装起义,《临时约法》等,学生的认知过程是记忆、理解、分析;概念性知识如辛亥革命的背景、过程等,学生的认知过程是理解、应用、分析;程序性知识如结合史实分析辛亥革命的历史意义,学生的认知过程是理解、应用、分析、评价;元认知知识如以史为鉴,理性、客观、多角度分析自己的知识、能力及方法的优劣,学生的认知过程是理解、分析、评价、创造。

2.基于核心素养的评价方法

确定适当的评价方法。评价方法应根据具体的内容,选择适当的评价方法。仍以《辛亥革命》为例,其中事实性知识可以采用作答测验,如选择题、是非题、配对题;概念性知识可以采用选择作答测验、提供作答测验(词、短语或短文作答)、限制型表现评测(结构图或时间轴);程序性知识可以采用选择作答测验、提供作答测验、限制型表现评测、拓展型表现评测(论文、故事或手抄报、学习档案等);元认知知识可以采用提供作答测验、限制型表现评测、拓展型表现评测。

教育测评概念篇5

【关键词】物理化学教学效果

【基金项目】湖南省教育科学十二五规划课题(XJK012CGD060)。

【中图分类号】o64【文献标识码】a【文章编号】2095-3089(2013)09-0172-02

物理化学是从化学与物理学的联系入手,研究化学的基本规律的一门学科,包含了化学热力学、化学动力学、结构化学等内容,是化学的一门重要分支学科,起着指导其它化学分支学科的作用。物理化学课程是中医药院校的中药学、药学、药物制剂等专业的重要基础课,根据专业要求,主要学习化学热力学、化学动力学两大内容。由于该课程的理论性强,与其它化学课程比更深奥,学生一般觉得比较难学。作为教师,如何提高教学的效果?本文根据该课程的特点,从教学目标、教学内容的侧重点和组织、教学评价等方面入手,做如下探讨。

一、确立明确的学习目标。目标,即是主体所期望的成果。在实际生活中,目标为我们指明有待完成的使命。目标的确立有助于我们集中所有能量和注意力为之努力。在教育教学中,目标为教师指出预期的学生达到的学习效果,即目标明确提出教育过程使学生发生的预期变化。目标是教学的灵魂,教学的整个过程都是围绕着目标进行的,目标决定了教与学的方向。如今,在中医药院校,物理化学作为基础课,课时普遍受到了缩减。那么,在有限的课堂教学时间内,什么更值得学生学习?这就要求我们参考课程标准,根据教材、学生情况、特别是专业要求,制定出具体的、可操作的、可评价的学习目标。

二、明释教学内容是教学的逻辑必要条件之一,是教师在课堂上的主要教学活动。教师讲解的好坏,直接关系到教学效果的好坏。对于物理化学这门学生认为难度较大的课程,教师怎样讲解才能做到深入浅出,收到良好的教学效果呢?本文认为应做到以下几点:

1.注重基本概念的学习和理解。学生在中学学了不少化学,但物理化学的内容几乎没有接触,概念都是全新的。此外,物理化学知识的正确运用首先建立在对基本概念的熟练掌握和深刻理解之上。因此,基本概念的学习非常重要,教师应花大量时间帮助学生加深对概念的理解和掌握。例如,对“力平衡”这个概念,教师不只要指明“系统各处压力相等”,还要引申到“边界不再移动”,即如有刚壁存在,虽双方压力不等,但也能保持力平衡。有些概念看似简简单单的一、两句话,但每个字、词都有它特定的含义,要理解到位并不容易。这一点在该课程中尤为凸显。同时,要注意与中学一些概念进行辨析。例如,热力学中的“可逆过程”这一概念,几乎贯穿教材的所有章节,极其重要,但初学者很容易将其与早先就接触过的“可逆反应”的概念混淆。基于基本概念的重要性,教师在进行教学设计时,要通过讲解例题、布置习题、效果测评等方式,帮助学生对概念进行辨析。仔细、深入地理解概念,熟练地掌握概念,是学好物理化学的基础。

2.特别强调各种公式的适用条件。物理化学课程的另一难点,在于计算公式多,而且每个公式的适用条件非常严格。初学者往往只注意到了具体公式,而忽略了对适用条件的把握。例如,公式w=pidV=dV=nRtln是用来计算没有相变化和化学变化的理想气体在等温可逆过程中所做功w的大小的,只有当理想气体、等温、可逆过程三个条件都满足时才能使用,可初学者常常只要看到是理想气体膨胀或压缩过程(比如理想气体反抗恒外压膨胀压缩过程),不管是不是等温过程和可逆过程,拿来就用,造成错误。还有,理想气体绝热可逆过程方程“pVr=常数”也必须在同时满足“理想气体、绝热、可逆”三个条件下才能使用。再例如,热力学第二定律主要用来判断变化的方向和限度,其三个判据式必须在不同的条件下使用:判据“S孤立=S体系+S环境≥0”只能用于孤立系统;判据“F≤0”只适用于封闭系统的等温等容过程;判据“G≤0”只适用于封闭系统的等温等压过程。这样的例子非常多。因此,教学过程中,教师应通过字词讲解、举例比较等方法,帮助学生反复进行辨析,以达到正确使用公式,解决实际问题的目的。

3.注意与生活实际相结合,增强内容的实用性和趣味性,提高学生的学习兴趣。教学不只是传授知识或演示技能,关注学生的学习动机才是教学的起点。物理化学又称理论化学,学生学习过程中难免感到枯燥。教师如何有目的地引导学生投入积极的学习状态,引起学生的学习意向呢?教师应尽可能从学生生活中的现象、身边的事入手,加深学生对知识的记忆和理解,激发学生的学习兴趣。例如,在讲解弯曲液面下的附加压力这一内容时,可从学生孩童时期所玩的吹泡泡游戏切入;在讲解克拉贝隆-克劳修斯方程时,可从生活中常用的高压锅说起;在讲解表面活性剂时,可从我们日常生活中少不了的洗涤用品入手……兴趣是激发求知欲的催化剂,如何使知识变得有趣,值得每一个教育工作者深思。

三、及时进行教学评价。教学是有意向性和目的性的,直接落脚于教学任务的达成。教学目标究竟有没有实现?这就要求我们及时检查教学效果,进行测评。对每次课的效果测评,我们可以通过课堂提问、练习、习题来进行;对阶段性的效果测评,可通过小测验、专题讨论等方式进行;对整个课程的效果测评当然主要是通过考试的方式进行。在进行测评题目的设计时,要注意确保目标、教学和测评彼此一致[1]。通过对每一个教学环节的测评,找出不足,及时补进,这样才能提高教学的效果。

一次成功的教学,要能体现“在老师指导下的学习和没有老师指导下的个人学习”的区别[2],这就要求教师在教学内容的侧重点和方法上用心选择、精心设计,不断地尝试、不断地归纳总结,使不愿意学的学生愿意学,使愿意学的学生更加轻松高效地学。

参考文献:

[1]洛林.w.安德森等。布卢姆教育目标分类学.[S].北京:外语教学与研究出版社.2009,5.

[2]崔允.有效教学.[S].上海:华东师范大学出版社.2009,19.

教育测评概念篇6

(一)更新教学理念,深化教学思想诚信教育是教育统计与测量教学的出发点和落脚点。教育统计与测量课程的思维方式是理性主义关照下的经验主义、演绎主义关照下的归纳主义、“从部分到整体”的思维方式。其基本思想是,按照特有的思维方式,定量地揭示教育领域中“寓于偶然性中的必然性”,为教育工作者提供科学依据和理论指导。

(二)优化课程结构,重组教学模块优化课程结构的关键是要吸取各版本教材的优点,重新建立一个适合学生特点、体现教学特色、注重培养学生素质的课程新体系。总结多年的教学经验,以厚基础、专题化的研究性学习理念为基础,构建了教育统计与测量的课程教学新体系。1.理论教学模块(1)描述统计模块主要包括数据的整理与分析;集中量数、差异量数、相关量数等统计指标的意义、应用;二项分布、正态分布及其应用。(2)推断统计模块主要包括概率及概率分布、抽样分布及总体平均数的推断、平均数差异的显著性检验等。(3)教育测量与评价模块主要包括教育测量产生的历史、类型;教育测量的质量特性:信度、效度、难度、区分度;编制测验的原理;测验题目的类型及编制要求、适用条件;评价学生课业发展进步的主要方法。2.实践教学模块(1)会分析数据统计分析是用数字精确反映事物的一种定量研究。[5]平均是描述统计分析的核心思想。如,(1)有3位报考相同专业的研究生考试成绩,各课程权重系数给予同一规定,试问录取结果如何?(2)有两组个数相同、数字不完全相同的10个分数,试问:两组分数的分布是否一样?为什么?哪个平均数的代表性更好?为什么?由样本推出总体是推断统计分析的核心思想。如,从某年高考作文试卷中随机抽取100份,试估计作文总体平均分数95%和99%置信区间。(2)会假设检验假设检验有两个相互对立的假设:零假设和备择假设。如,零假设H0:某人患癌症,备择假设H1:某人未患癌症。医生给此人做诊断时,尽管遵循小概率事件原理,仍可能犯两类错误:此人未患癌症而被诊断为患癌症(α错误:H1为真却拒绝,弃真);此人患癌症而被诊断为未患癌症(β错误:H0为假却保留,取伪)。如果医生犯α错误,此人是否会抑郁而患癌症?如果医生犯β错误,此人是否会错过治疗而成为不治之症?两类错误危害很大,应该降低犯错的概率,尽量控制。(3)会编制测验教师在日常的教学工作中,一般都会通过试卷来检测学生的学习情况。于是,如何编制一份合格的试卷并进行科学分析,成为教师的必备技能。自编测验必须明确三个问题:测什么,为什么测?怎样测?包括题目双向细目表的制定,题目的类型、数量、记分方法的选择,测验的信度、效度、难度、区分度分析等步骤。[6]3.应用教学模块(1)应用一:用word、excel绘制统计图、表。统计图、表能简洁、直观、形象地表达数据。如,某小学四年级学生参加校园绿化植树活动,总计需要植树120棵(其中槐树46棵,柳树24棵,松树50棵)。请绘制圆形统计图。再如,某小学在雷锋活动月中,各年级涌现出的好人好事分别为:一年级男生12件、女生15件;二年级男生16件、女生24件;三年级男生11件、女生13件;四年级男生20件、女生24件;五年级男生18件、女生15件;六年级男生5件、女生10件。根据上述资料,请编制一个适当的统计表,并绘制相应的统计图。(2)应用二:考试、竞赛、选拔等。应试技巧:针对不同的题目类型,采取不同的应对方法。如,(1)一个学生猜做10个是非题,若全凭猜测,平均就可以猜对5道题(np10×0.55)。假如规定做对95%的题目才算掌握了测验的有关知识,那么,学生必须做对多少题才算掌握了这些知识呢?(2)一份试卷有100道四选一的多项选择题(每题1分),考生答对了其中80道,有20道不能回答,因而对这20道题作猜测,则猜测得分的范围有多大?(3)某项职业录取考试,在参加考试的1600人中准备录取200人,考试分数接近正态分布,平均分数为74,标准差为11,问录取分数线是多少?(3)应用三:对两组或两组以上样本的平均数差异的比较。运用SpSS统计软件进行相关样本平均数差异的显著性检验和单因素完全随机设计方差分析。如,(1)某学校将80名学生按年龄、性别、智力水平、原有知识基础等一一匹配后,分成两个班级进行教材改革实验。甲班学生使用旧教材,乙班学生使用新教材,学习后两班学生测验的结果已知。两班成绩的差异是否显著?(2)某学校为了改进教学方法,从某年级中随机抽取60名学生,分成三组,进行三种教学方法实验。一个月后进行统一测验,测验成绩已知。三种教学方法的教学效果有无显著性差异?(4)应用四:评价学生课业发展进步的方法的运用。评价学生课业发展进步的方法主要有:客观题与主观题评价法、表现性测验评价法、评定量表评价法、同伴评定和轶事记录评价法、档案袋评价法等。考试是一种常用的评价方法,作业批语、课堂提问是一种评价,家访是一种评价,一个微笑、一个眼神都是评价。教师对学生的评价是教师教育教学活动的基本环节,是教师实施教育活动的途径之一。

(三)改革教学方法1.讨论法让学生主动发表自己的看法。如,有人认为:用相对位置或相对分数来描述与评价学生的学习情况不符合素质教育的思想。这样,常模参照测量与评价的方法,在新一轮的基础教育改革中还有存在的价值吗?你怎么看这个问题?启发学生课堂思考,分组讨论。如,某学生一学年内期中考试各科平均分数为95分,期末考试各科平均分数为90分。95分与90分相差5分,存在本质上的差异吗?该学生家长批评了他,你赞同该家长的做法吗?你眼中的素质教育与分数、排名有什么样的关系?2.小组合作学习法组内合作、组间交流汇报:如,计算某班某两门课程分数的平均分、标准差、相关系数,画出成绩分布图并判断是否为正态分布。小组合作学习描述统计:列举经典实例,分组课堂练习,分析比较数据,探讨在教育科研中,标准差S是越大越好还是越小越好?讨论集中量数与差异量数的关系。小组合作学习推断统计:对小组合作调查获得的数据进行分析,探讨性别差异、年级差异等。3.讲授法在科学研究和实际应用中,我们常常要对教学方法、教材选择、心理测验、考试等实验所得的数据进行分析或对实验效果进行比较。我们可以通过对两组随机样本来比较实验前后的效果,比较的目的是看实验前后随机样本是否有所变化。引出差异显著性检验:根据两个样本统计量的差异检验两个相应总体参数差异的显著性。平均数差异显著性检验原理教学的重点是,使学生把基本原理正确地运用到教育领域的实际问题解决之中,培养学生选择知识、应用知识的能力。4.案例教学法近十几年来,西方国家的案例教学法被日益广泛地运用到我国的教育领域。通过案例的桥梁可以实现学习材料与认知结构的连接,促进有意义的学习。如,飞机失事,大家已经众所周知,为什么仍然有很多人乘坐飞机?人们坐飞机出行前,都坚信小概率事件原理,认为飞机失事不可能发生在自己的头上。任何事情都有偶然性。概率就是偶然性当中的必然规律。把测验的信度和效度的关系,比作“人才”德和才的关系,有德有才为一等,有德无才为二等,无德无才为三等,无德有才为四等。信度高是效度高的必要而非充分条件。一位学生在一个学期中,期中考试数学考了95分,期末考试数学考了88分,家长会评价说:“你看不努力,退步了吧!”这样的评价合理吗?案例教学法的关键在于所选案例要具有代表性,能很好地阐释相关理论;要典型,具有说服力;要深入浅出,使学生通俗易懂。5.参与式、探究式教学法如,在教学进程中对学生进行“大学生学习动机”的问卷调查,让学生们参与调查、评分、数据分析的全过程,渗透参与式学习、探究式教学,将教学和教育科学研究紧密结合,培养学生的教育研究能力。6.抛锚式教学法如,二项分布和正态分布的教学,以典型例子呈现正态分布的应用。分析问题时,先抛出问题留给学生思考的空间,让学生感知问题后,再作引导性讲解。紧紧抓住学生,适时引导和修正,使他们逐步理解和概括。总之,以教师为主体,以学生为主导。各种教学方法的综合运用,有利于激发学生的学习动机,增强学生的学习兴趣,让学生进行知识建构,有意义地学习。通过行动与体验,培养学生教育统计与测量能力。

(四)整合教学手段通过ppt、word形式呈现讲解内容,使学生会读统计图、表;借助word、excel制作统计图、表,将概率分布等直观的表达出来,加深学生的理解,减轻教师上课手绘画图的难度。整合后的教学手段=板书+电子教案(ppt、word)+excel+统计软件(SpSS)。

(五)构建教学评价根据教学改革评价多元化的理念,既关注结果又重视过程,既体现知识与技能又兼顾情感、态度与价值观,设计考核的内容与权重为:教育统计与测量基本概念、原理30%(如考试),教育统计与测量软件操作20%(如运用excel绘制统计图、运用SpSS统计分析数据、检验测验的信效度等),平时学习态度20%(如出勤、课堂参与),教育统计与测量实践应用30%(如考试、作业)。总之,考试形式不拘泥于书本知识,更侧重于实践与应用。

(六)践行教学反思1.关注学生,以学生为本在教学中要关注学生,关注学生的接受与理解水平,适时地调整教学进度和难度。教学设计联系学生生活实际,激发学生的兴趣,提高他们的学习动机;教学内容贴近学生,使得他们容易感知、领悟;教学方法关键在于学生的参与与理解,使得学生活学活用。2.案例生活化,注重实践性、应用性“抽样分布”内容抽象、理论性强。教师用生活化、典型的例子讲解,让学生分组讨论学习,实现良好的师生互动,训练学生运用观察、比较、分类等思维方法;教师举出应用性的实例,进行软件操作与演示,拓展学生的学习。如相关量数的教学,重点是每种相关适用条件的判定,而不是公式的推导。3.精选教学内容,开展形成性评价夯实理论教学,践行实践教学,突出应用教学,精选教学内容。开展形成性评价与终结性评价相结合,将学生的学习过程、学习体验和学习效果的评价作为一项教育研究工作,引导学生积极参与教育研究,培养他们的教育科研能力和教育评价能力。

二、教育统计与测量教学改革的展望

(一)建构网络互动平台组建QQ群,使得师生互动和交流有效、及时;逐步实现典型试题库、教育统计与测量相关操作软件的共享,构建网络互动平台。师生互评是在师生平等对话的过程中完成的,评价者和被评价者是一种“双主体”的评价关系。

(二)加大教育统计与测量实践教学环节的改革提高教育统计与测量在教师教育课程中的地位,重组教学模块,突出实践性和应用性。使学生掌握科学研究的方法,提高他们的教育教学实践能力,提升教育统计与测量能力。

教育测评概念篇7

[关键词]跨文化交际课程语言测试大学英语

[作者简介]周玉兰(1971-),女,广西恭城人,桂林理工大学外国语学院,讲师,硕士,研究方向为英语教学论。(广西桂林541004)

[中图分类号]G712[文献标识码]a[文章编号]1004-3985(2014)26-0185-02

一、跨文化交际的重要性

地理位置上的东西方,是相对而言的,相辅相成共同构成地球这个整体。同样,跨文化交际的东、西方文化,没有孰优孰劣,孰对孰错,都是人类文化的一部分,相辅相成共同构成人类文化这个整体。全球化是人类发展的必然结果,跨文化交际是每个国家面临的挑战和机遇,要求人们在对外交流中具有跨文化能力,即对文化差异的敏感性、宽容性和处理文化差异的灵活性。我们只有在了解别人时,才对自己更加了解。张爱琳在《跨文化交际》课本的第一章强调不同角度、他人性、参照物、比较在认知事物时的重要性。一些高校开设了大学英语“跨文化交际”选修课。由于测试不仅评估而且反拨教学,因此搞好课程测试是一项迫切的任务。笔者在此粗谈一些看法,旨在抛砖引玉。“跨文化交际”选修课是集语言性和文化性于一体的课程,要谈课程测试,首先应了解语言测试的基本原理。

二、语言测试的基本原理

根据李筱菊《语言测试科学与艺术》,评估事物分两分判断法和连续判断法。语言测试标准包括准确性、流利性和得体性。语言测试按评估标准和判断方法分三代体系。第一代是科学前的主观的两分法的量化评估,依据结构主义语言学,标准主要是准确性,内容考“记”形式,综合运用的试题没有真实语境。第二代仍然依据结构主义语言学,更强调准确性,把形式的准确性孤立于语境和情景外,甚至剥离了意义,流利只是脱离语境情景甚至意义的语言形式结构操作的熟练问题。这一代体系是科学的高度客观的两分法量化评估,与之相适应的,是离散项目测试题型。第三代根据中介语言学说,外语学习者在学习的过程中所使用的目标语是一种过渡性的中介语,学习的过程是中介语越来越接近本族语者的过程。语言测试不是正确与错误的问题,而是学习者到目前为止能用目标语做什么事、做得怎么样的问题。做得怎么样是一个从最坏到最好的连续概念。因此,语言测试应在语言使用中进行,评估的对象是交际行为,评估标准是交际的有效性,包括语言的准确性、流利性和得体性。每个具体交际行为对准确性、流利性和得体性要求到什么程度,要看实际的情景。这一代是连续判断的质的评估。

语言测试的效度指测试是否站得住脚、是否能成立,所考的是否是该考的。其中内在效度包括内容效度和结构效度。内容效度指测试是否考了考试大纲规定要考的。结构效度指测试是否以有效的语言观(包括语言运用观和语言学习观)为依据,是考试的原则理论的效度,是各种效度之本。第三代体系的结构效度指所要测试的能力,是否以对交际需要的有效理论为依据。第三代还提出了超考试效度,其中实效效度指测试能否判别受试者能不能胜任某项交际任务,反拨效度指测试对教学有什么作用。

测试的信度指测试的结果分数对受试者的表现而言的可靠程度,包括分数是否公正而客观地反映了试题的作答,试题是否给了受试群公正而客观的作答机会。信度的保证包括试题的量和质。量是指抽样够大,覆盖面合理。质是指考试结果的分数要具有人分散度,即分数呈正态分布,这就要求试题的区分度高,难度适中,没有偏颇性,适宜于受试群。信度的保证还要求评分标准一致。

三、“跨文化交际”课程测试的现状

笔者所在院校采用大学英语选修课系列教材中张爱琳主编、重庆大学出版社出版的《跨文化交际》。课程测试出题难,因为作为一本为高等院校大学生编写的教材,该书具有一定的专业性,生词多、专业术语多、抽象的基本概念多、文化理论多,学生颇感吃力。按第二代体系出题,即考查学生对抽象基本概念、零碎的表面的文化知识的死记,首先违背了测试的效度原则,即结构效度原则、内容效度原则、实效效度原则和反拨效度原则;其次违背了测试的信度原则,即信度规定的试题的“量”和“质”的保证原则。

1.效度低。课本25页对“跨文化交际”的定义是不同文化背景的人之间的交流。《大学英语课程教学要求》(以下简称《要求》)中规定跨文化交际是大学英语教学的主要内容之一。因此,这样出题首先与“跨文化交际”的定义相悖,没考查到“不同文化背景的人之间交流”,没有实效效度;不符合《要求》的规定,内容效度不高;所依据的结构主义语言观本身存在效度问题,故结构效度较低;徐强谈到的测试对教学的“指挥棒”作用会使学生花费大量时间死记硬背一些意义不大的东西,而没学到真正的跨文化交际的内容,对教学产生负面的反拨作用。

2.信度不高。抽样不够大,覆盖率低,大多数只抽到抽象基本概念、零碎的、表面的文化知识的内容,不能做到“量”的保证。区分度不高不能把受试者跨文化交际能力的好和差区分开来;试题偏难,特别是抽象的基本概念的死记硬背;偏颇性大,有利于擅长死记硬背的学生,不利于擅长创造性思维和批判性思维的学生;适宜性低,大学本科生都是经过三年高中考入大学,具备一定的英语基本功、文化素养和思维能力,基本能胜任该课程的要求,按第二代体系出题不适合他们已具备的高素质。因此,试题的“质”也存在问题。

如何做好课程测试,笔者搜索了近十年国内中文核心期刊发现,目前对该问题还没有研究结果,只是在《跨文化交际》课本的总序中提到“在大学英语选修课的开设中出现了……课程测试不规范……”。下面笔者提出一些拙见。

四、“跨文化交际”课程测试改进措施

针对上述问题,笔者认为课程测试应以第三代体系为指导。

1.内容方面。一要剔除抽象基本概念的考评。教材的每一章或多或少都有对基本概念的定义、特点、成分、功能、重要性等方面的阐述,如关于交际、非言语交际、文化、价值、语言、思维等基本概念的阐述。对基本概念的阐述通常情况下在文字上比较晦涩、抽象,即使不难理解也难以记住,而且这些概念性的知识不是跨文化交际的事实现象,因此如第三部分所述,考查这方面的内容会导致测试考查死记硬背的功夫,与跨文化交际实际内容相去甚远,从而使测试失去效度和信度,因此在测试中应剔除这方面内容的考查。

二要减少零碎的表面的文化知识的考评,因为这些知识不是跨文化交际的主流,测试应挖深层次的、主导性的内容,真正从广度和深度上考查学生,达到测试的效度和信度。课本的前言说明“本书……具有理论上的系统性和完整性”。读者不难发现,纵贯课本的主线是东西方的世界观、价值观、思维模式和语篇模式的不同,以及由此产生的行为方式的不同,因此测试应着重这些内容。

2.题型方面。一是知识性的内容,采用客观题。课本里有很多事实性的内容,如中国古代的三大思想家是孔子、老子、墨子,古希腊的伟大思想家包括荷马、苏格拉底、柏拉图、亚里士多德;世界观分为两分法的世界观和整体性的世界观,一般来说,西方文化的世界观是两分法的世界观,中国文化的世界观是整体性的世界观;价值观包括人性价值观、人与自然的关系之价值观、集体主义与个人主义的价值观、时间价值观、人际关系价值观、权利价值观、性别价值观等,以及中西方文化在这些价值观方面的一般取向。这些都是客观存在的事实,是具体的内容,适合采用客观题的形式考查,既保证了测试的实效效度、内容效度、结构效度、反拨效度,保证了信度要求的抽样合理、覆盖面大、难度适中、适宜于受试群的原则,也有利于评分的客观性和便利性。

二是思辨性的内容,采用主观题。笔者认为,闭卷的问答题、论述题不适合广西工科院校非英语专业的本科生,因为这些学生的英语主要是强在输入,尤其是阅读方面,输出能力非常有限,只限于写一些一般性话题的简短文章,难以把握专业性较强的稍长的文章,其专业词汇、论述能力还有限。所以闭卷的问答题、论述题不符合信度要求的难度适中、区分度高、适宜于受试群的原则。针对这种情况,笔者提出采用开卷的问答题、论述题。提供一些英文的思辨性的跨文化交际材料,让学生在纸质词典的帮助下,用中文回答和论述。这就要求学生要理解、翻译、归纳材料。不允许学生带电子词典和手机,因为这两种工具上的句子翻译功能会妨碍对学生能力的考评,且机器翻译目前还存在很多问题,会对学生产生误导。开卷英译汉的问答题和论述题,可以考查出学生对相关跨文化交际理论的理解,不仅保证了测试的高效度和信度,而且能测试出学生的语言能力,而翻译能力本身就是《要求》里规定要提高的语言技能之一。不能采用开卷的问答题和论述题让学生用英文作答,因为学生在作答时,有可能对相关理论不是很了解,也看不懂英文材料,只是把材料照抄下来,这样的测试没有信度。

三是加大主观题的题量与分值。《教育部财政部关于实施高等学校本科教学质量与教学改革工程的意见》(以下简称《意见》)将“学生的实践能力和创新精神显著增强”作为教学改革的重要目标之一。教材的总序谈到该套选修课教材的特点之一是培养学生的跨文化交际能力和批判性思维能力。课本的前言讲述该书的特点是:广泛吸收跨文化研究领域的新成果新理论;课文和练习都通过对具体生动的事例进行分析和讨论,阐释跨文化交际的思想和理论,突出启发性和实用性,增强跨文化交际敏感性和实际交际能力。因此,出题时应按照《意见》的精神,尊重教材编者的意图,这就要求主观题占较大比例,笔者认为卷面和分值都占2/3比较合适。

3.评分方面。客观题的评分不用赘述,笔者认为主观题的评分应参照国内外大型考试方法,即第三代体系的交际法的评分法。具体操作如下:首先,看答题的意义的要点的全面性,论述的逻辑性,论据的充分性,内容的丰富性。其次,看答题的结构、层次是否清楚分明。最后,看答题的语言。准确性,即语法方面,不做对与错两分法的判断,而根据准确性的不同程度作连续性的判断,主要看学生是否把意思表达清楚了。流利性在笔试里看语言的流畅程度,是否合乎英文习惯,是否唆或疙疙瘩瘩。得体性看答题的文体是否符合情景。

本研究只是在该领域非常粗浅的初步尝试,只涉及跨文化交际的阅读及翻译能力,还有很多不足,如该课程的听说、写作能力如何测试等,都有待于众多的专家学者去做更深层次的探讨。

[参考文献]

[1]教育部高等教育司.大学英语课程教学要求[Z].上海:上海外语教育出版社,2007.

[2]教育部财政部.关于实施高等学校本科教学质量与教学改革工程的意见(教高[2007]1号)[Z].2007-01-22.

[3]李筱菊.语言测试科学与艺术[m].长沙:湖南教育出版社,2001.

[4]徐强.交际法英语教学和考试评估[m].上海:上海外语教育出版社,2002.

教育测评概念篇8

关键词:《地球科学概论》;课程国际化;新版布鲁姆目标分类理论;测绘工程

一、引言

为了顺应国家对世界一流大学建设的诉求,推进国际化人才培养的教学模式,课程国际化是必然的趋势,其中教师和学生的英语水平为国际化最基本的条件。近年来,武汉大学测绘学院尝试开办多门双语或全英语课程,但由于教学内容专业性较强,使得课程国际化教学效果不大理想。课程国际化强调培养具有国际眼光和热爱祖国的“全球通”人才,课程具有开放性、共享性、通用性的特征。在学科课程选择上,应选择国际通用性强,能与国际接轨的课程[1]。《地球科学概论》课程以科学普及为核心的教学思想,着重培养地学思维而非传授技能[2],旨在扩展学生的知识面,引导学生进行跨学科思考与相互交叉的意识,这是本学院开办该课程的主要目标。该课程具有课程国际化的基本特征,以双语或全英语进行教学能有助增加课程学习的趣味。本文以本学院为例,从课程教学现状分析出发,以新版布鲁姆教育目标分类体系为依托[3],探讨《地球科学概论》课程国际化教学模式的可行性。

二、《地球科学概论》课程与国际化教学现况

《地球科学概论》为测绘工程的通识必修课,本课程从宇宙出发,介绍宇宙起源、行星与恒星的关系、地球的演化,以至地球各圈层的特性、变化及其相互作用。随着地球科学与测绘技术交叉融合内容日益增加,课程在不同的章节中加入测绘技术在地球科学的应用与发展部分,让测绘工程学生建立起对地球环境、资源及灾害等问题的基本的认识,为此课程增加了测绘专业特色。随着我国对国际化办学、国际交流与合作的重视,有必要开展国际化课程,拓展我国学生的国际视野,同时吸引国际留学生,促进多元化文化背景与国际化办学基础[4]。本学院从2004年起,先后开始《大地测量学》、《工程测量学》、《GpS原理与应用》等双语精品课程,并纳入本科“卓越工程师教育培养计划”方案,教学模式表现为英文教材与中文授课相结合[5],但仔细考察该双语教学模式,其优势仅体现为对教学资源充分的使用。继上述双语教学实践,2012年引进外籍教授R.tenzer,以全英语教授《物理大地测量学》课程,课程从“卓越工程师教育培养计划”学生中按自愿原则,形成约30人的小班听课规模,达到了课程观念、目标、内容、过程及评价国际化的要求。《地球科学概论》作为引导前瞻性课程,课程国际化具有开放性、共享性、通用性的基本特征。一般而言,国际化课程成功的因素包括:发动者的作用、教师参与、资源、专业发展支持、学习领域、语言学习及技术[6]。从本学院条件看,课程内容可选择性进行深度与广度的调整,可以以测绘技术在地学应用出发,广泛介绍并导出与地球科学相互交叉的部分,扩展学生的知识面,引导学生进行跨学科思考。目前,不少教师有国外学习的经验和背景,长期活跃在地球科学和测绘技术研究领域的前沿,使得课程国际化实施的可行性大大提高。

三、课程国际化教学实施

实行课程国际化教学,必须采用国外通用的教学理论。美国著名的教育心理学布鲁姆在1956年提出了认知目标分类法,其后称为布鲁姆教育目标分类法。随着网络的发展,iz和Fok首次应用该目标分类法,为大地测量学的题目分类,以网络考试形式,评估学生对课程认知的水平,发现此分类法与学生认知的水平有较大的相关性[7]。随着现今的需求,该分类体系于2001年做出修订,从一维分类扩展到二维框架[8]。新布鲁姆教育目标分类法恰好提供了理论基础,并贯穿整个教学过程。为了使《地球科学概论》课程目标明确、内容恰当、顺序合理、层次分明、考核高效,我们将应用新版的分类法,为实现测绘课程国际化提供理论应用的参考。1.新版布鲁姆教育目标分类。新版的分类法将教育目标的分类从一维分类体系扩展成二维框架:知识维度和认知过程维度。知识维度分为四类:事实知识、概念知识、程序知识和元认知知识。认知过程维度由低至高分为六类:记忆、理解、运用、分析、评价和创新。此分类贯穿整个教学过程,达到教学目标、过程与结果系统性的评估,已应用在《测绘专业英语》课程[9]。下面以《地球科学导论》[10]教材为例,说明其分类法在实际教学中的应用。2.制定教学目标。教学目标是教学活动的始端和末端,贯穿于整个教学活动,与整个教学过程息息相关,最后亦为教学结果评估提供依据。要确立教学目标,首先要区分《地球科学概论》所包含的知识类型:(1)事实知识:明确地球科学所涉及的相关知识,如地球是圆的事实;(2)概念知识:认知各种概念,如什么是地球系统、径流和蒸发量;(3)程序知识:认识输入和输出的计算步骤,如推算地球年龄的计算;(4)元认知知识:以上述知识综合理解和评价相关事物,如建立思维导图记忆知识[11]。上述教材可以确立教学目标,分为如下四层:(1)对地球科学有基本的认识:可通过了解和记忆事实知识,把握整个课程结构,与事实知识和元认知知识对应;(2)对概念知识的认知:可通过回答课后思考题理解并区分各种概念的类同与差异;(3)对某部分有深入的认知:可通过阅读书目文献与该部分知识相结合,以及与元认知知识对应,检测现有的理解水平;(4)对某部分有创新性的认知:能与相关学术前沿相衔接,可通过创新生成新的知识和认知。上述教学目标与此分类法认知过程维度相对应:(1)对应记忆:须记忆地球系统的基本知识;(2)对应理解和运用:须理解某一部分的知识并运用知识解答课后思考题;(3)对应分析和评价:须分析阅读书目中文献与该部分知识的相同和差异,并对其异同点进行评价;(4)对应创新:须对该部分知识融会贯通,并结合该部分相关学术前沿提出自己的观点。在具体实施教学活动中,须根据实际教学活动情况对教学目标加以调整,使之达到更好的效果。3.实施教学活动。教学活动是实现教育目标的途径,其实施须循序渐进。教师可在上课首5分钟播放地球科学课程相关的视频,让学生对后续的内容有大概的理解,随后通过教师讲解与活动便可达到记忆层次,透过教师互动提问和回答加深内容的理解和记忆。课堂完结前,教师再次提出不同的思考问题,让学生有更宏观的理解,并在下次课再反复提问相关知识,达致元认知的体验。结合前沿学术文献或自选题目做1—2次口头报告,提出创新观点和看法,达致相互自主学习。目前互动率占课程四分之一,要达到课程国际化水平尚有一段距离。4.评估教学结果。教学结果评估是教学过程的直接反映,目的是检测是否达到教学目标。下表是2015年的期末考试题型分类,分为简答题(8小题,32%)、论述题(4小题,36%)、分析题(2小题,32%)。通过上述的目标分类理论,对考试题型作出定量的评价(表1)。由上表统计,基础的记忆和理解层次占32%,运用和分析分别为18%和50%,分析部分比例较为臃肿,既没考核认知过程维度中的评价和创新部分,亦没涉及知识维度中的程序和元认知知识,体现了教学结果评估的缺陷,不利于评估学生评价和创新的能力,亦没顾及学生的操作(即程序)与联系和综合(即元认知)的能力。因此,采用此分类检测有助于教师更全面提高教学效率;未来可适度将比重放在评价和创新层次的知识上,在今后的考查中增加操作与联系和综合的内容。

四、结语

教育测评概念篇9

事实上,抽象概念的可操作化是一个颇具理论色彩的问题,但为了更简明易懂地解释这个问题,让我们不妨先来看一看生活中的许多出色的“红娘”是怎么成功进行“拉郎配”的。曾有这样一个“红娘”,经她介绍的对象最后步入婚姻殿堂的成功率非常高。人们很是好奇,不断向她打听成功秘诀。她沉思良久,道出了其中奥妙:

我是一个很热心的人,我身边的许多单身的大男大女,托我给他们介绍对象。刚开始时,总是信心百倍。结果却总不怎么令人满意。为什么我认为很般配的一对最后没成事呢?经过仔细捉摸,我发现是我没有很好地理解他们的择偶要求,对他们的择偶标准作了想当然的过于简单的处理。比如,介绍前问双方都有什么样的要求时。他们给出的回答几乎是一致的,没什么特别的要求,只要对方“人好”就行。可我给他们介绍的对象都挺好的,为什么不成呢?原来,“人好”是一个高度抽象的词,这个词的背后有着丰富的内涵,包含着很多要素。经过一番仔细思考。我终于找到了解读“人好”的组成要素的基本思路。当再有人请我介绍对象时,我就问:“你对对方有什么特别要求?”如果得到的答案是“没什么特别要求,只要‘人好’就行”,我就进一步追问:“什么叫‘人好’,你能不能说得再具体一点?”此时,他或她往往不好意思说,我就把“人好”这个词进行分解,说道:“这样吧,我来问,你来答。第一,你对对方的长相有什么要求,比如说身高,低于哪一个高度你就不能接受,1米70还是1米75?第二,你对对方的文化水平有什么要求,比如说学历,低于哪一个层次你就不能接受,专科?本科?硕士?还是博士?第三,你对对方的收入水平有什么要求,比如说月收入,你不能说越高越好,你得告诉我低于哪一个额度你就不能接受,3000元?4000元?还是5000元?第四,你对对方的家庭有什么要求,比如说你希望他是来自农村的还是城市家庭的?还是无所谓对方的家庭出身?第五,你对对方的性格特征有什么要求,比如说喜欢外向一点,还是内向一点的?……”经过一番将“人好”的抽象概念具体化的过程,我把它转化成一个个可操作化的经验性指标,这样一来,在后面的“红娘”工作中就能有的放矢,成功率也就直线式提高了。

应该说这位红娘是一个聪明的红娘,她本能地运用了我们社会科学研究中常用的一种方法――抽象概念的操作化,解决了介绍对象成功率的问题。在日常生活中,类似于引的案例比比皆是。比如说“健康”是一个高度抽象的词,我们怎么断定一个人健康与否呢?到了医生那里,他就会把这一抽象概念可操作化,转化成一个个可操作的“健康指标”。他会量心跳,测血压,称体重,量身高,测腰围,还有血液化验等等项目,最后根据测量的综合数值,得到一个确定的健康与否的结论。再比如,“智力水平”也是一个抽象概念,通过将学生的语文、数学、外语三门课程的成绩按3、2、1的权重分别加权,然后相加并计算出平均值,也是将其可操作化的方式。在教育研究中,通过可操作化而解决一些教育方面的难题或争论的案例也是非常多的。

那么,何谓抽象概念的可操作化?在教言研究中,所谓概念的可操作化,指的是将抽象的概念和命题逐步分解为可测量的指标与可被实际调查资料检验命题的过程,即用可感知、可度量的事物、现象和方法对抽象概念进行界定或说明。也就是要把我们无法得到的有关教育的理念、思想和特征的内在事实,用代表它们的外在事实来替换,以便于通过后者来研究前者。或者是将抽象的概念转化为可观察的具体指标的过程。众所周知,“概念是抽象的,而指标是具体的;概念是人们的主观印象。而指标则是客观存在的事物……概念只能想象,而指标则可以观察和辨认。”它是对复杂的教育现象进行定量研究的一种方法。

将抽象概念变成可操作化的概念在教育研究中有着极为重要的作用,其好处在于:第一,可以使概念或命题具体化,使研究得以进行。“存在于研究者头脑中的各种概念、意识,研究者用以构建其理论大厦的各种基本变量,都只有经过合适的操作化之后,才会在普通人可以看得见、摸得着的现实社会中显现出来。”第二,可以使概念或命题量化,对教育现象与问题的分析,从定性、定量两个方面进行,避免了对教育现象与问题的分析的片面性。第三,可以使对教育现象与问题的分析建立在量的基础上,使定性分析即结论建立在科学的基础上,而不是一种主观的臆断。

抽象概念的操作化过程实际上就是是一步步从抽象层次(概念)下降到经验层次(指标),使概念操作为可观察的事物的实践过程。其基本流程如下图所示(胡仕勇,叶海波,《操作化流程及其在社会研究中的应用探讨》):

概念操作化流程具体可以分为以下几个操作步骤:

第一,定义概念。在具体操作上,首先要弄清概念定义的范围,此时可借鉴其他研究者对这一概念所下的定义。当我们通过收集和查询,了解到有关这一概念的各种不同的定义,从而对这一定义的大致范围有所理解以后,便可以对这些定义进行分类。这种方式可以帮助研究者形成对这一概念范围的总的理解和把握。其次可进行探索性研究,确定概念操作化的框架。例如,“我如何为教师士气这个构想下一个操作性的定义呢?首先,我阅读他人的研究报告,查看是否已经有个很好的指标存在。如果没有现有指标存在,我就要凭空发明一个。士气是一种心理状态或感觉,因此,我只能通过人们的谈话与行为进行间接测量。我可能设计出一份教师问卷,调查他们在我的定义下,对士气的各个层面有何感觉。我可能到学校去,观察在教室休息室中和学生互动时,以及在学校活动中的教师行为。我可能通过学校所保存的教师行为人事记录,查阅显示士气的一些陈述(例如,缺席、要求提供申请其他工作用的推荐信、考核报告)。我可能对学生、学校行政人员,以及其他人展开调查,以了解他们对教师士气的想法。不论我选择哪个指标,我都要随着概念定义的发展,逐步锤炼这个定义(例如,写下特定的问卷项目)。”概念转化为变量形式后就可以进入科学研究的领域,因此,这一步实际上要完成从抽象领域到经验领域的第一

步――从概念到变量。

第二,列出概念的维度。将概念分解,从不同的角度或维度将概念所表示的现象进行分类。所谓分解就是以理论为依据,分解中心概念,将整体分解为部分,将复杂的事物或命题分解为简单的要素,然后对各个部分或要素进行研究的一种方法。如对性别的分解,我们就可以直接用“男”和“女”进行:对抽象层次较高的要逐步的分解,如“人的素质”概念,可将其分解为智力、体力、思想等,然后对这些分解概念再进行逐一的分解(如下图所示,风笑天,《社会学研究方法》)。如果对概念或命题进行第一次分解,还达不到目的的操作化或具体化,可进行第二次或第三次分解。在分解过程中,必须注意到概念或命题的明确程度,所囊括的范围,构成的结构因素,以及层次性等。通过分解可大致了解一个概念的基本内容和各种分类,根据这些分类,就可以了解这些各种类型的共同属性和特征,从而对概念下定义。再比如,“人的素质”就是一个复杂的变量,它需要用多个指标去度量。

教育测评概念篇10

培养学生语文素养的前提是教师自身具备好的语文素养,为此,需制定一套可操作性的中文师范生“语文素养”综合培养方案;同时根据语文“核心素养”指标,制定一套可操作性的检测方案,以检测中文师范生的语文素养。这一套检测方案可作为中文师范生自我水平评估和中文专业教学水平评估的检测工具。

关键词:语文素养;中文师范生;养成;检测

一、“语文素养”概念的学理反思

与基础教育对接是加强中文师范教育的重要举措。新《语文课程标准》明确规定:“语文课程应致力于学生语文素养的形成与发展。语文素养是学生学好其他课程的基础,也是学生全面发展和终身发展的基础”;“九年义务教育阶段的语文课程,必须面向全体学生,使学生获得基本的语文素养。”[1](6)“语文素养”作为语文教育的新理念,已引起业界广泛重视。语文素养是语文能力的综合体现,包括听、说、读、写诸多方面。语文素养的养成,亦是一项复杂的系统工程,牵涉到语文教学改革实践诸多环节。培养学生语文素养的前提是教师自身具备好的语文素养。

在《语文课程标准》中,“语文素养”是作为一个全新的概念提出来的,但这个概念缺乏明确的解释,更没有一个逻辑严密的理论界定。随着新课标的推行,“语文素养”像个时髦的“标签”,被人到处粘贴。于是,“语文素养”变成一个无边无底的“框”,什么东西都可往里装,其外延不断扩展,由此导致内涵的模糊泛化,其中包括字词句篇的积累,语感,思维品质,语文学习方法,阅读,写作,口语交际能力,文化品位,审美情趣,知识视野,情感态度等等。在以前的语文教学大纲里,与“语文素养”概念相关的表述为“语文能力”、“语文素质”等概念。有论者认为,“语文素养”要表达的就是“语文修养”、“语文水平”、“语文能力”、“语文素质”等概念的“总和”,它是一个比前述几个单一概念更妥帖、更科学、更新颖生动的“集合式”短语。实际上,“语文素养”概念的界定如果过于宽泛,则会丧失其应有的理论生命力,其突出的弊端即是无法凸显语文课程的目标特性与核心定位。有论者对“语文素养”概念提出尖锐批评,称“语文素养”为“怪胎”,认为把语文课程目标定位于无所不包的“语文素养”,是语文课程定位、定性发生了原则性的差错。也有人指出,“语文素养”的提出,只不过造了一个新词而已。“语文素养”作为一种理念,其合理性比较容易论证;但关键是新课标把它当作了语文课程的核心目标,其受到质疑是必然的,因为理念的相对模糊性与目标的相对明晰性本身就存在深刻的矛盾。

综合各方面的观点,我们认为,应将“语文素养”分为“学科素养”与“基础素养”两部分。有关语文学科的知识、技能、态度目标属于“学科素养”部分;而思维品质、知识视野、思想观念、文化品位等属于“基础素养”部分。“学科素养”是表现语文学科独特性的核心目标,是“语文素养”的显性标志,应该予以重点强调。“基础素养”是基础教育各门学科共同承担的目标,每门学科在突出强调自己的学科素养目标的同时,不能忽视“基础素养”的目标。总之,既要有牢牢把握“学科素养”的目标意识,也要树立“基础素养”的目标意识。“基础素养”是“人”的最基本的素养,基础教育要培养的学生的整体素养不是各学科素养的简单相加,而是各学科间的相互融合渗透。这样来理解“语文素养”,就可以摆正语文学科教育与整个基础教育目标的关系,从而清楚地认识语文学科教育在整个基础教育体系中的独特作用和恰当位置。

二、中文师范生“语文素养”的养成

语文素养是语文方面诸多素质的整合,是语文知识、语文能力、语文情感、语文态度、语文习惯、语文方式,甚至文化素养、审美情趣、人格个性、思想道德等各方面的融合。可以说,一个人的知识积累、生活阅历、思想理论水平、语言能力、表达技巧等诸因素的提高,都有利于语文素养的提高。那么,中文师范生如何有意识地培育学生语文素养?

第一,从语言材料积累中提高语文素养。学好语文无非是两条途径:一条是课内,一条是课外。课内,我们要走进“教材”,让学生感悟、体验优秀的古今中外名文名篇,培养良好的语感;课外,我们要让学生走出“教材”,走向社会、走向生活,多渠道学习语言。语文教育是母语教育,社会生活中有取之不尽的教育资源,我们要让学生在母语的环境中,不断积累语言,自然而然地提高语文素养。语言文字不仅仅是工具,更是人的心灵和生命的活动。语言材料不断积累,就是学生不断接受祖国优秀文化、世界先进文化熏陶感染、潜移默化的过程。

第二,从语言运用实践中提高语文素养。语文课是学生学会正确理解和使用祖国语言文字的人文学科。语文课不是“语言学”课,不需要大量系统的语言理论知识学习,却需要大量有计划地进行言语训练实践。因此要培养中文师范生的语文素养,就要给学生大量的时间、机会,让学生在具体的语言行为活动中不断提升自己的语文素养。比如写字,写一手好字,不仅是一个人语文素养的“门面”,而且也能在我国传统书法艺术感染中,增强热爱祖国语言文字的思想情感。

第三,在综合性学习中提高语文素养。《语文课程标准》指出:“语文综合性学习有利于学生在感兴趣的自主活动中全面提高语文素养,是培养学生主动探究、团结合作、勇于创新

精神的重要途径,应该积极提倡。”[1](13)基于以上认识,我们认为,综合性学习是提高学生语文素养较好的途径。我们需要在语文知识综合运用、听说读写能力整体发展、语文与其他学科沟通、课堂语文学习和实践活动融合这四个方面下苦功,逐步提高中文师范生的语文素养。

第四,从课程资源开发和创设良好语文学习环境中提高语文素养。“课程资源”是指形成课程的要素来源及实施课程的必要而直接的条件。课程资源可分为素材性资源和条件性资源。另外,从性质上可把课程资源分为学科资源和活动资源,从形态上可把课程资源分为课内资源和课外资源,从显现形式上可把课程资源分为显性资源和隐性资源等等。语文学习环境也是语文学习资源,属条件性资源、课外资源、隐性资源等。

综上所述,语文素养是学生语文方面的基本素质和修养,是一个人在长期的习得中逐渐形成的综合性人文素养品质。它的发展和培育,需要学生自身的努力和教师多渠道多方面的引导和激励。基于此,我们需要制定一套可操作性的中文师范生“语文素养”综合培养方案。本培养方案分为以下四个板块:①“听”:对所听到的信息归纳概括,再用恰当的语言重新表述;②“说”:学说普通话;在即兴和规定情景中能够自由顺畅地表达自己的思想。③“读”:在主动积极的思维和情感活动中阅读,加深理解和体验,受到情感熏陶,获得思想启迪,享受审美乐趣,拓展思维空间。④“写”:运用语言文字进行表达和交流,对自我内在思想进行创造性表述。

三、中文师范生语文素养的检测

从目前中文师范生(准老师)的语文素养总体情况来看,许多师范生尚不能充分胜任中学生语文素养培养的重任。为使中文师范生能够顺利就业上岗,必须加强其语文素养的培养。但目前我们缺乏一套系统的语文素养培养方案;同时,师范生的语文素养如何,我们也缺乏一套有信度、可操作性强的工具对之进行有效检测。故此,中文师范生语文素养的培养与检测研究显得尤为必要。

前已述及,新《语文课程标准》中的“语文素养”是作为一个全新的概念提出来的,但此概念缺乏明确的解释。随着新课标的推行,“语文素养”这个概念模糊泛化,无法凸显语文课程的核心定位;同时,“语文素养”概念的泛化也影响到中文师范生的语文素养培养。为此,我们在中文师范教育过程中需化繁就减,提炼出“语文素养”中的“核心素养”,并对之进行系统训练。但训练效果如何,在目前的专业培养方案中无法体现。为此,我们需结合中学语文教学实践以及语文“核心素养”指标,制定一套可操作性的方案,以检测每位中文师范生的语文素养。同时,这一套方案可作为中文师范生自我水平评估和中文专业教学水平评估的检测工具。而目前全国还没有哪所高校在中文师范生语文素养方面,构建完善的培养方案与检测标准。正如新课程《高中语文》(人教版)主编、北京大学语文教育研究所所长温儒敏教授所言:“中国之大,至今没有一个专门研究语文教学质量的检测研究机构,甚至没有这方面的专家。”[2]

针对目前“语文素养”概念的模糊泛化,提炼出“语文素养”中的“核心素养”,便于中文师范生在语文素养的训练中能够抓住重点,有的放矢,打下扎实的语文基础。为此,我们需要设计一套可操作性的中文师范生“语文素养”综合检测工具,突出语文素养评价的整体性和综合性,以全面考察学生的语文素养。其中,尤其要考察学生的文学作品阅读、古诗文阅读和写作等能力。总之,一套科学的“语文素养”综合检测工具,能够客观有效地检测中文师范生的“语文素养”,亦藉此检测中文师范专业的整体办学水平。

[参考文献]

[1]语文课程标准[S].北京:北京师范大学出版社,2001。