首页范文数据分析的统计学基础十篇数据分析的统计学基础十篇

数据分析的统计学基础十篇

发布时间:2024-04-29 11:27:34

数据分析的统计学基础篇1

本文结合上海市黄浦区教育数据中心系统平台建设及应用案例,从需求获取分析、平台框架构成设计、系统数据标准定义,平台基础管理服务构建,以及教育决策支持高级应用等方面,全面阐述了区域性基础教育综合业务管理平台的建设策略和方法。

关键词:

基础教育;综合业务管理平台;平台框架构成;数据标准;编码规范;教育决策支持

一、引言

在基础教育信息化建设与应用的推进过程中,各类区域性基础教育软件系统的建成和应用,有效地规范了各类项教育管理工作的开展,极大地提高了相关教育业务工作的效率。然而,当教育行政管理部门希望利用系统运行产生的业务数据,综合分析区域教育发展状况,并为教育管理决策提供参考依据时,却常常显得异常困难,甚至无法做到。究其原因是因为这些软件都是被孤立成单个的业务系统而实施设计开发的。无论是数据标准制定,还是业务流程设计,都各不相同的。软件上线运行后,系统之间更是互不相关。长此以往,就形成了围绕着不同教育业务的“信息孤岛”。面对“信息孤岛”教育行政管理部门根本无法整合各类软件的业务数据和开展有效的教育管理决策支持分析。为此,区域性基础教育应用软件系统的开发建设,应当强调需求导向、整体规划、规范建设的原则。通过构建统一的区域性基础教育综合业务管理平台,统整开发各类教育业务软件系统,并最终实现全面整合各类教育业务系统和共享应用数据信息的愿景目标。

二、区域性基础教育综合业务管理平台建设要点分析

1.开展需求获取分析,确定建设愿景目标

(1)系统建设业务需求获取与分析

在区域性基础教育综合业务管理平台建设初期,必须开展建设需求调研工作。全面了解来自各方的平台建设要求,尽可能多地获取来自区域内各基层学校、教育管理机构、教育行政部门的想法和意见。按照应用业务领域,汇总分析各类建设要求,梳理归纳出针对不同教育业务的系统建设需求,确定整个平台各类业务子系统的具体组成,从需求层面对整个系统平台的建设规模和建设范围进行界定。与此同时,还必须从业务系统关联、业务数据流向和基础信息共享等方面,分析确定各业务子系统之间存在的关联关系,从而为后续平台的功能性框架结构设计奠定基础。

(2)系统建设技术需求获取与分析

在构建区域性基础教育综合业务管理平台的同时,还应该为平台的部署和运行,设计构造与之相匹配的运行环境。另外,建成后的平台在运行过程中,需要和周边外部系统进行数据交换。因此,设计开发合理有效的技术对接机制,确保系统间数据交换的正常实现,也是平台建设过程中需要解决的问题。诸如此类,这些都是与平台建设有关的非功能性技术需求。系统建设技术需求的获取和形成,将有助于完善对整个软件体系架构的构成认识,从而正确导向系统建设的整体规划设计与技术实现选型。

2.整体规划软件框架体系,研究编制系统数据标准

(1)规划设计平台框架构成

1)系统功能框架组成规划设计

从全局来看,区域性基础教育综合业务管理平台的核心,应该是一个由众多教育业务子系统整合构成的应用服务系统。按照应用业务功能划分,整个平台应由行政业务系统和教育业务系统两大部分组成。其中,行政业务系统部分主要由区级层面的行政办公系统、人事管理系统、财务管理系统、资产管理系统等教育行政管理子系统构成。而教育业务系统部分则由学籍管理系统、学生综合素质评价系统、教师专业发展管理系统、教学质量监测分析系统、教育科研管理系统等教育业务管理子系统构成。从功能实现上来看,这些业务子系统涉及各个教育应用业务领域,它们相互独立,各自提供与各类教育事务处理相关的系统服务。但是,从基础信息共享、业务数据交换、事务处理流程对接所形成的系统间耦合关系来看,这些业务系统之间必然存在着不可分割的关联。因此,对于基础教育综合业务管理平台功能框架的规划设计,不仅要考虑具体的系统功能组成,而且还要考虑业务系统之间基于共享数据的耦合机制的实现,明确基础数据和业务数据的生成维护与交换应用规则。从系统组成的完整性和系统整合的有效性两个方面,综合考虑平台功能框架结构的构成。

2)系统整体框架构成规划设计

如前所述,区域性基础教育综合业务管理平台的核心,是由各个业务子系统构成的教育应用服务系统,分为行政业务系统和教育业务系统两个部分。这两大业务系统共同构成了整个平台的核心业务层,平台的各项教育业务功能全部由该层的各个业务子系统予以实现。平台内的各个业务子系统,除了要实现各自的业务功能之外,还必须提供一些重要的基础管理服务功能,如:用户及组织机构管理、用户登录身份认证和用户角色权限设置等。为此,可以统一设计开发具备上述基础管理服务功能的子系统,并提供给其他业务子系统进行调用。这样,在整个平台建设框架内,就形成了一个专门服务于业务子系统的基础管理服务层。区域性基础教育综合业务管理平台建成投入运行后,必然会积累起大量的业务数据。对这些业务数据实施信息查询、统计分析,并继而开展深度数据挖掘,不但可以为教育管理与教学实践提供有益的参考信息,而且还可以为区域性的教育行政管理和规划制定,提供科学的决策依据。因此,就平台的架构设计而言,其最上层应该是能够为区域基础教育工作开展,提供决策支持服务的高级应用层。区域性基础教育综合业务管理平台建成后,需要部署架构在由软、硬件系统构成的基础结构层之上。基础结构层的构造设计是否合理,系统性能是否良好,将直接关系到平台能否正常运行。因此,构建基础结构层也是平台建设工作中的重要组成部分。它的规划设计包括,基础系统软件(操作系统、数据库系统、软件开发运行环境等)和基础硬件设施(服务器选配、存储设施配置、网络环境构造等)的选型与搭建。区域性基础教育综合业务管理平台不是一个独立的自封闭系统,它需要与上游的教育部及省市层面的信息化业务系统,以及下游的区域内基层学校的信息化业务系统进行对接,完成数据交换。所以,在构建区域性基础教育综合业务管理平台的过程中,还必须考虑平台与上述外部系统的对接实现机制,尤其是如何有效地解决跨系统间的数据交换与数据共享问题。由此可见,从系统整体框架体系构成来看,区域性基础教育综合业务管理平台由下往上可分为四个层面:底层是支撑平台运行的基础结构层;中间是提供公用服务的基础管理服务层和最为重要的提供教育应用服务的核心业务层;而顶层则是提供教育决策支持服务的高级应用层。

(2)制定系统数据标准与编码规范

如前所述,区域性基础教育综合业务管理平台内的各个业务子系统,不是相互独立而是相互关联的。一方面,各个业务系统需要共享学生、教师、学校等基础数据信息。另一方面,业务系统之间也需要开展各种业务数据交换。因此,必须为平台建设制定统一的数据定义标准,有效地确保平台内各业务子系统之间,能够正常开展数据共享和数据交换操作。平台数据标准的制定应有三个部分组成:

1)制定基础数据标准

对学生、教师、学校等核心业务数据表结构的组成数据项进行标准定义,约束平台内各业务子系统的数据库设计,方便各业务子系统对学生、教师、学校等基础数据信息的共享和应用。

2)制定业务数据标准

平台内有许多业务子系统需要通过数据交换,从其他业务子系统中获取相应的业务数据信息,以维持本系统业务流程的继续。例如,学生综合素质评价系统中有关学生学业评价数据的生成,必须得到来自质量监测分析系统的学生考试数据信息的支持。为这类业务数据制定数据标准,有助于降低业务子系统之间数据交换的技术难度,提高数据交换效率,进而规范此类业务数据的使用。可以根据子系统之间的业务关联和需要交换的数据内容,选定相应的业务数据表,并对其组成的数据项进行标准化定义。

3)制定数据编码规范

对基础数据和业务数据的相关数据项进行编码,是一项极为重要的工作。它不但涉及平台内各业务子系统数据取值的规范性,而且还关系到平台与外部系统实施对接交换数据的可行性。数据项编码规范的制定,需要以相关行业编码规范为基础。对于区域性基础教育综合业务管理平台建设来讲,首先应以国家教育部和地方教育部门的相关教育信息化编码规范为基础,然后再结合本区域的实际情况,开展数据编码规范的制定。数据编码规范的制定,主要涉及编写数据项的编码规则以及定义数据项的代码取值,并形成数据字典。

3.集中平台管理功能,统一系统基础管理服务

区域性基础教育综合业务管理平台如同一个容器,可以容纳众多符合标准的教育应用业务系统,并使这些应用业务系统在事务处理及数据共享应用层面实现有效整合。然而,对于整合嵌入平台的每个业务系统来说,都存在着许多相同的系统用例,例如:系统用户及组织机构管理、系统用户登录身份认证、用户角色及权限设置等。对于这些具有共性的用例场景,应当构建统一的基础管理服务,以泛化这些用例的功能实现。

(1)用户及组织机构管理服务

区域性基础教育综合业务管理平台内任何一个应用业务子系统,都涉及用户和组织机构的管理问题。各个业务系统的实际用户,主要是区域内广大的在编教职人员。所以,如果以区内各类教育机构和在编教职人员作为实体模型,来设计构建统一的用户及组织机构管理系统,并从人事管理子系统中抽取、载入人员及机构的基本信息,就可以形成用户及组织机构的基础管理数据库。平台内各业务子系统也就可以从中交换获取到所需的用户信息和机构信息,同时也有效地确保了用户和机构信息在各个业务系统应用中的唯一性和准确性。

(2)单点登录(SSo)服务

当用户需要访问区域性基础教育综合业务管理平台内的应用业务子系统时,应当做到,只要通过一次登录身份认证进入某个业务子系统后,用户就可以按其相应的权限访问平台内所有其他的业务子系统,无需重复经历类似输入用户名和密码的繁琐的身份验证过程。然而,要实现这一目的,构建的区域性基础教育综合业务管理平台,就应提供基于单点登录(SSo)方式的统一的用户登录身份认证服务。当然,利用单点登录(SSo)进行用户身份认证时,其中用于比对的标准用户信息,必须来自于由用户及组织机构管理系统所提供的用户身份信息。

(3)角色权限管理服务

区域性基础教育综合业务管理平台内的任何一个业务系统,都需要定义具备不同操作权限的用户角色,然后再将定义好的角色指定给要访问业务系统的不同用户,从而使用户在登录系统后执行与其角色身份相符的操作。为此,可以把这一具有共性的系统功能,当作区域性基础教育综合业务管理平台的一个公用组件进行设计和开发。构建起可以为所有的业务系统,提供统一的角色权限管理和用户授权管理服务。

三、基于业务数据搭建数据仓库,实施联机分析形成教育决策支持

区域性基础教育综合业务管理平台建成投入应用后,包含其中的各个业务子系统,会产生大量的教育业务数据驻留在相应的操作型数据库中。对这些业务数据进行抽取、汇总、统计和分析处理,可以获取更有价值的新的数据信息,为区域基础教育管理与规划工作提供决策支持。然而要达到这种数据应用目的,就必须通过搭建数据仓库,实施数据联机分析处理(oLap),并进而开展更为高级的数据挖掘分析才能够得以实现。

1.构建面向教育主题的数据仓库

面向主题是数据仓库最重要的特点,它要求数据按照一定的主题域进行组织,以利于后续数据模型的构建和实施数据分析,对业务工作的开展形成决策支持。就教育本身而言,学生的全面成长、教师的专业发展和学校办学质量的提升,是衡量区域性教育管理工作成功与否的重要标志。因此,为了能够对区域性基础教育管理工作提供有效的教育决策支持,我们应该选择学生、教师和学校为主题,搭建基于区域性基础教育综合业务管理平台的教育数据仓库。通过从平台各业务子系统的业务数据库中,抽取与上述主题相关的数据源(各业务数据库中的有关数据项),经过清理、转换和装载,形成由事实表和纬度表构成的基于多维模型的数据仓库。

2.实施多维度数据查询与分析处理

由纬度表围绕事实表组建构成的数据仓库,是一种基于多维数据模型的数据仓库。这种数据仓库不但可以被用于查询和报表方式的信息处理、开展oLap数据分析,而且还可以通过数据挖掘完成知识发现,从而为教育行政管理提供科学有效的决策支持依据。

四、区域性基础教育综合管理平台设计及应用案例

上海市黄浦区教育局开发构建的“黄浦区教育数据中心系统平台”,就是一个典型的区域性基础教育综合业务管理平台。它的规划与建设充分地体现了上文所讲的,关于区域性基础教育综合业务管理平台建设的三大建设要点。同时,在平台的设计开发过程中,我们也专门就教育数据仓库构建、实施数据联机分析处理和开展教育决策支持,进行了深入的探究和实践,并形成了具体的应用模式。

1.开展平台建设需求分析,确定平台建设愿景目标

“黄浦区教育数据中心系统平台”的规划和建设,是一项区域性的教育信息化系统建设工程,平台的建设以学生全面成长、教师专业发展和学校教育创新为核心,整体规划、规范建设、全面部署。在平台建设初期,黄浦区教育局专门开展了平台建设的初始需求调研工作,重点了解区内基层学校、教育管理职能机构(教师进修学院、招生办、基建站等)和教育局机关各职能科室对平台建设的要求。通过分析获取的各种需求,梳理确定了“黄浦区教育数据中心系统平台”建设的总体目标与愿景:

(1)建立黄浦区教育业务数据标准,规范区教育业务系统建设。

(2)构建“黄浦区教育数据中心系统平台”,实现区教育业务数据的有效集成应用,完成各类区教育业务系统的全面整合。

(3)通过科学分析、综合利用平台运行后生成的各类教育业务数据,为黄浦区教育局的教育行政管理和教育规划决策,提供科学可靠的参考依据。

2.分层定位系统实现功能,整体规划平台框架构成

从平台功能实现角度看,黄浦区教育数据中心系统平台由教育应用业务系统、教育决策支持系统和基础管理服务系统三层构成:

(1)教育应用业务系统

各项教育业务功能的实现,是黄浦区教育数据中心系统平台的建设重点。从系统功能框架构成来看,平台的核心组成部分是一个由学籍管理系统、人事管理系统、资产管理系统、财务管理系统、教育局办公系统、学生综合素质评价系统、教师专业化发展管理系统、学业质量监测分析系统等多个业务子系统构成的教育应用服务系统。而黄浦区教育数据中心系统平台建设的首要任务,就是要开发构建各个教育应用业务子系统,并将它们整合在一起,为区内广大教育用户提供统一的集成应用服务。当然,要实现各业务子系统的全面整合,就必须先行制定详实的软件建设技术方案和系统数据引用标准,以便统整平台内各个业务子系统的建设和集成,有效地实现平台内数据信息的共享应用。为此,在平台建设之初,我们就专门研究编写了《黄浦区教育数据中心系统平台总体建设方案》和《黄浦区教育数据中心系统平台标准与规范》。前者重点确定了平台建设的总体架构和技术路线,明确了平台内各类业子务系统的主体实现功能和相互之间的关联关系;后者主要是对平台的数据标准与规范进行定义,并对各类系统服务的接口标准与使用规范进行了说明。

(2)教育决策支持系统(eDSS)

在黄浦区教育数据中心系统平台的框架构成设计中,位于顶层的教育决策支持系统(eDSS)由数据仓库、数据分析工具和分析结果展示三个部分组成。首先,教育决策支持系统从平台各个业务数据库中抽取、转换、装载各类数据信息,构建起面向学生、教师和学校为主题的数据仓库。然后,利用oLap工具或数据挖掘工具开展数据查询和挖掘分析处理。最后,向用户呈现查询分析结果。教育决策支持系统的建成,为教育局开展教育管理工作,提供了科学、可靠的决策依据。通过该系统实施的一项有关区内学生学业成绩与体质健康的相关性挖掘分析。该项分析展示了学生学业水平与体质状况的潜在联系,并为区内学校正确引导相关学生群体开展体育锻炼活动,提供了科学的决策依据。

(3)基础管理服务系统

从信息化应用软件平台建设的角度来看,黄浦区教育数据中心系统平台同样也应具备系统用户管理、角色权限管理、统一认证服务等各种基础管理服务功能。我们专门设计开发了一个名为HpemGnt的基础管理服务系统,并将它作为中间层,为整合嵌入黄浦区教育数据中心系统平台的各个教育业务子系统,提供包括用户组织机构管理、人员角色权限设置管理以及用户单点登录(SSo)认证等各种基础管理服务。HpemGnt的建成和运行,有效地实现了平台内各业务子系统在基础管理服务应用上的整合与统一。

3.选型数据仓库及数据分析技术,搭建教育决策支持系统(eDSS)

黄浦区教育数据中心系统平台的整体开发采用了技术,其所有的应用业务子系统都是基于B/S结构的web应用。针对整个系统的数据库访问技术选型,则选用了microsoftSQLServer作为数据库服务器。为此,我们选用了微软数据库产品SQLServer的数据集成服务工具(SSiS)、数据分析服务工具(SSaS)和基于Sharepoint的商务智能分析工具(powerBi),设计构建了位于整个平台上层的教育决策支持系统(eDSS)。以下是有关如何利用教育决策支持系统(eDSS),开展联机分析处理(oLap),并获取查询分析结果的实施步骤:

(1)利用SQLServer集成服务(SSiS)对操作型业务数据库中有关学校、教师和学生的业务数据实施抽取、清洗、转换并加载至数据库,创建用于搭建数据仓库的事实表和维度表。其中,事实表内记录的是学校、教师和学生的数据记录。然而,学校、教师和学生的数据记录,又是由基本数据项和扩展数据项所构成,而纬度表内记录的则是学校、教师和学生的扩展数据项所对应的属性数据记录。

(2)继SSiS完成了针对业务数据的etL操作后,再利用SQLServer分析服务(SSaS)创建多维数据集。使众多的扩展信息纬度表围绕着学校、教师、学生的中心实事表,构建起面向学校、教师和学生为主题的数据仓库,并据此形成了多维数据挖掘分析模型。

(3)利用SharepointpowerBi工具,连接构建的面向主题的数据仓库,实施多维度数据查询,形成查询统计报表,实现联机分析处理过程(oLap)。关于区内不同学制(高中、初中、小学等)、不同年龄段的男、女教师,针对三类主要学历(大专、本科、研究生)人数分布情况的多纬度联机分析查询实例。

五、总结

区域性基础教育综合管理平台的建设和应用,可以使教育业务管理工作更趋规范和高效。同时,对于平台运行后积累生成的大量的教育业务数据,通过开展构建数据仓库、联机分析处理和深度挖掘分析,可以获取更有价值的知识信息,为教育业务管理和规划决策提供科学依据。然而,要达到上述建设应用目标,就必须从获取平台建设需求、制定数据标准与技术规范、整体规划平台架构设计和统一构建基础管理服务系统几个方面入手实施平台建设。并以此达到整合各类区教育业务系统,实现教育业务数据共享应用之目的。继而开展教育业务数据的深度分析,形成教育决策支持,使区域性基础教育综合管理平台,成为具有真正实用意义的教育大数据平台。

作者:孙庆单位:上海市黄浦区教育信息中心

参考文献:

[1]龚鸣,经春秋.基于基础平台的教育信息化系统架构设计[J].网络教育,2010,211(11):71-75.

数据分析的统计学基础篇2

今天,我们召开全市经济形势分析暨统计基层基础建设工作座谈会,主要目的有两个:一是讨论交流新形势下如何更好地做好全年经济形势分析工作,积极为当地党委、政府科学决策提供正确的统计依据;二是传达贯彻全省统计基层基础工作会精神,学习县乡镇统计员垂直管理的经验做法,讨论新形势下如何进一步加强统计基层基础建设。下面,我分别就这两个方面讲几点意见。

一.高度重视,全力做好全年经济形势分析工作

分析报告的水平在一定程度上代表着统计工作的整体形象。在当前受国际金融危机影响,经济形势变得异常复杂的情况下,做好经济形势统计分析工作,显得尤其重要。今天我们专门召开全市统计系统经济形势分析会,涂福军副局长就全市经济形势作了全面分析,各县(市、区)统计局局长针对本县(市、区)经济形势调研情况作了汇报发言。以后这块工作还要不断加强,充分发挥我们统计工作对当地党委、政府科学决策的参谋作用。希望下一次开经济形势分析会时,大家材料准备得更充分、经济运行特点分析得更到位、提出的对策建议更可行。在此,我讲四点意见。

首先,深入分析研究经济形势,既是统计部门履行职能的需要,也是当前统计工作中最迫切、最主要的任务之一。

统计的基本任务是对经济社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督。做好统计分析特别是经济形势分析是统计部门的一项重要职责,是为各级党政领导服务的主要方式。自去年四季度以来,受国际金融危机影响,经济形势变得异常复杂。各级党委、政府领导越来越关注和重视经济运行走势的分析,市委、市政府召开经济形势分析会的频率、次数明显增多,对经济形势分析、走势判断要求也越来越高。市政府召开的季度经济形势分析会都安排或点名统计局发言,发言的主要观点也都得到领导认可,许多观点被采纳。从当前形势走势看,尽管去年下半年以来经济增长明显下滑趋势得到遏制,经济形势总体呈现企稳向好势头,但是世界经济复苏将是一个缓慢曲折的过程,我国经济回升基础还不稳定、不巩固、不平衡,国际国内不稳定不确定因素仍然很多,我国经济发展仍处在保增长的关键阶段。我市经济运行中也存在一些需要密切关注的问题。在这样一个重要时期,把握好经济运行情况,准确判断经济走势,为保增长、保民生、保稳定提供参考价值高的政策建议,是摆在我们统计工作面前的一项重要任务。因此,我们能不能加强对经济运行情况的追踪,及早发现影响宏观经济发展的苗头性问题,是能不能很好地发挥统计职能作用的关键,也是统计工作水平高不高的重要体现。

第二,一定要努力提高统计数据质量,特别是要注意主要数据之间的逻辑关系,为搞好经济形势分析打下坚实基础。

履行统计职能、为党政领导当好参谋,首先要把统计数据搞准。统计数据只有客观真实,才能正确反映经济运行规模、结构和动态变化,为把握经济运行态势、研究经济运行走势打下基础。没有准确数据,根本谈不上对国民经济运行进行认真研究和分析。当前我国经济正处于企稳回升的关键时期,统计数据受到社会各界的高度关注,我们全市各级统计部门必须深刻认识这一大局,要认真学习马建堂局长和吴新雄省长关于提高统计数据质量的有关讲话精神,高度重视统计数据质量问题。这是我们做好全年经济形势分析最基础的东西,一定要努力使反映经济运行的主要指标不出现大的偏差。

提高统计数据质量是一项长期的系统工程,需要举全系统之力,持之不懈地努力。当前,特别要加强主要统计数据质量的评估,提高评估的科学性。在评估过程中,首先要找准基础。有产出,必然就有投入,这个投入如原材料就是产出总量的基础;有生产,就必然要消耗能量,这个能耗就是生产量的基础;生产出来的东西必须通过流通到达消费者那里才能为消费者所消费,必须上缴税金,则流通量如货运量、税收总量也可以作为反映生产量的基础,这些都是经济发展的必然联系。如要评估一个地方的工业生产总量及其增长情况,就要把它与这个地方消耗的原材料、发电量、货运量、税收等进行比较,看其匹配不匹配,看其在趋势上是否一致。其次,要找基准。一个行业中的领头羊企业,能够左右整个行业发展趋势的大企业,就是这个行业发展的基准。反映一个行业发展的统计数据,如果趋势上与基准企业的变化不一致,那么这个统计数据的准确性就要高度关注。不能说一个行业的领头羊企业的生产在下降,但整个行业却在大幅增长。再次,要高度关注统计数据之间的逻辑性,这涉及到统计数据的公信力。经济发展是一个整体,准确反映经济发展的各项数据之间必然存在着一定的逻辑关系。如果逻辑关系不匹配,要么是统计数据有问题,要么是经济发展出现了某些异常因素。如一个地方的固定资产投资实不实,我们可以看固定资产投资额与GDp的比例关系,通常这一比例40%-60%,如一个地方长时间显著高出这一比例,投资数据就值得质疑;一个地方的GDp、财政收入实不实,我们可以看财政收入占GDp的比重、税收占财政收入的比重高低。同时要关注我们的统计数据与统计数据的衔接,主要是与部门统计和行业授权统计之间的衔接。

第三,做好当前的经济形势分析要丰富分析技术方法,提高分析研究水平。

当前,经济运行异常复杂,这就需要我们不断调整观察方法,“工欲善其事,必先利其器”。金融危机使我们在制度方法上暴露出一些缺陷,我们应注意研究并加以改进,在制度方法上进行改革,使得我们应对危机的方法更科学。当前我们要更及时、更准确、更全面地分析经济问题,有几个问题需要注意:在进行动态分析时,不仅要看累计、同比,更应注意当期数据和环比。累计反映阶段性内容,而当期数据更能反映近期状态;同比反映阶段性时期的发展,环比更能反映即期的变化。在使用环比这一分析方法时要注意严谨。环比在有些地方用的比较成熟,如价格、用电量进行环比分析,但是有的地方运用还不够成熟,对价值量的时期指标使用时要注意,如同比速度相减进行环比分析是否严谨值得商榷。其次,在深入分析时不仅要注意总量指标,还要注意结构性指标。结构的变化能反映被总量掩盖的一些现象,而这些现象是需要注意的。如城乡居民收入,在总体上保持增长的同时,我们要注意分析其结构因素,如果结构性因素发生重大变化也是要引起关注的。再次,多注意部门指标的运用。在分析经济整体时,政府统计部门和部门统计都承担了很大的责任。部门统计的一些指标对反映国民经济某个领域、某个方面非常重要。我们现在比较注意运用用电量这个指标,还用到财政、税收、金融等部门数据,还有一些部门数据很重要,如工商部门企业登记注册数据,这也是反映一个时期经济活跃程度的重要指标;还有交通运输部门的物流指标,也是反映区域经济活跃程度一个非常重要的指标。此外,还有节能减排、就业率、失业率等指标,我们在分析时要注意运用这些部门数据,把这些指标结合起来进行印证、分析,我们对经济的分析才会更全面。

第四,多方密切配合,共同做好全年经济形势分析工作。

经济形势分析涉及到经济生活方方面面,单靠综合科(股),没有各专业科(股)室提供相关专业的分析,很难写出高水平的经济形势分析报告。各业务科(股)室要加强沟通交流,做好各专业数据间的佐证、评估、衔接工作,同时要整合各专业统计资源,发扬团结协作精神,协作配合提高分析整体水平。另外,可以通过召开各有关部门经济形势分析联席会、实行部门资料交换互享制度等方式,更好地做好经济形势统计分析工作。在当前经济运行十分敏感、经济发展变化受到高度关注的情况下,尤其在经济出现拐点的关键时刻,用统计数据说话,做出正确及时、符合实际的科学判断尤其重要。大家回去后,一定要继续密切关注宏观经济运行态势,结合本地实际,进一步加强调查研究,认真组织好全年经济运行分析,特别是对主要经济指标2009年预期目标完成情况要及时作出专门分析,提供给当地党政领导参阅,从而更好地发挥统计部门的参谋和助手作用。

二.坚定信心,强化举措,切实加强统计基层基础建设

今年十月,省统计局在上饶召开了全省首席统计员制度现场会。按照这次会议日程安排,听取了上饶市统计局和县政府的典型发言,到统计局和冰溪镇及工业园区进行了现场参观考察。通过推行首席统计员制度,上饶市农村统计基层基础建设达到了“六有”、“六化”标准,即有统计站牌子、有编制、有专职统计人员、有电脑设备、有办公场地、有业务经费,统计人员专业化、统计信息网络化、统计管理制度化、统计报表规范化、统计资料档案化、主要指标台帐化。让人看了深受启发。

今天,我们观看了县光碟、参观了会埠镇统计站、听取了县经验介绍,在讨论交流中,大家都一致反映:触动很大、感受很深,这就达到了会议的预期目的。我认为,跟上饶市县相比,我们有的特色。县乡镇统计员垂直管理的经验做法,也是我们的特色。我市的统计基层基础工作在全省还是有一定基础的,各县(市、区)统计局在实际工作中也都探索出了一些好的经验做法。在当前面临机构改革的新形势下,我们要敢想,更要敢做,勇于探索出适合本地实际情况的加强“双基”统计工作的新路子。

㈠政府主导,部门配合,形成抓统计基层基础建设的合力

统计基础不扎实,源头数据不全面,不仅难以反映农村经济社会发展全貌,并且势必影响市县统计数据质量和统计服务质量,进而影响各级党政科学决策,最终影响到统计部门的权威性。抓基层基础建设,是一项系统工程,涉及人员,编制,经费,办公条件,制度建设和业务培训等实质问题,人财物要素缺一不可。仅靠统计部门单枪匹马、孤军作战是不行的。需要政府主导,部门配合,形成抓统计基层基础建设的合力。我们要抓住在当前新的形势下,党政领导和社会各界对统计工作的需求与日俱增的契机,改变观念,更新思路,深入调研勤汇报,有针对性的提出从根本上加强统计基层基础建设的方案或意见,把加强统计基层基础建设问题列入地方党政领导的重要议事日程。在前有榜样,后有追兵的大气候下,要积极研究和探索加强基层统计基础规范化工作的有力措施、有效途径,大家要以“松不得”的危机感、“坐不住”的紧迫感,迅速行动起来,把夯实统计基层基础工作,提高源头统计数据质量作为当前一件头等大事来抓,摆上重要议事日程;一把手负总责,分管领导具体抓,细化工作任务,真抓实干,实实在在的提高统计数据质量,提升统计服务水平,提升统计部门形象,提升统计社会地位。

㈡立足当前,着眼长远,要以创新和务实的精神做好“双基”工作

在当前形势下,大家既要学习上饶经验,又要紧密结合各自情况,创造性的开展工作。如,,,等地的做法就有自己的特点。近几年来,县县积极探索加强乡镇基层基础建设的新路,以理顺管理体制为重点,以统计员编制垂管为关键,全面推进乡镇统计站正规化建设,取得了一定的成绩。是我市全国统计工作先进单位,其基层基础建设也有其特点,全市23个乡镇、街道、景区,基本达到“五个一”的建设要求。按照统计工作“六化”(统计人员专业化、统计信息网络化、统计管理制度化、统计报表规范化、统计资料档案化、统计主要指标台帐化)的要求,县人民政府办公室印发了《县统计工作规范》,该规范包括了《乡镇场(街道)统计工作规范》、《县直部门统计工作规范》、《企业统计工作规范》三部分,对统计机构、统计人员的配备,统计人员持证上岗,统计报表报送要求作出了统一规范。早在2005年,县就为3名没有编制的乡镇统计员解决了行政编制。并按照分级负担的原则,保证农村抽样调查工作调查记帐户和辅助调查员的补贴能按时足额发放到位。抓基层基础建设,我们要向好的典型学习,做到“四个到位”:一是领导重视要到位。这需要各位在座的局长用智慧赢得政府领导的理解、重视和支持,做到政府主导,部门配合,统计部门全力以赴抓业务建设和督查监管。统计基层基础建设要立足当前,着眼长远,把加强统计基层基础建设工作当作一件大事来抓,决不能麻痹大意,应付了事。二是工作落实要到位。各地要结合本地实际,制定加强统计基层基础建设的实施方案,明确工作目标,精心安排实施步骤,采取有效措施逐项抓好落实。要有针对性的解决一些实际困难和问题,要及时与当地党政领导加强汇报请示,与上级部门加强沟通与联系。三是可行性工作实施要到位。抓统计基层基础建设是一项实实在在工作,要一步一个脚印落到实处。在抓统计基层基础建设方面,当前统计部门切实可行的工作,具体内容有:一要抓统计基层基础建设的摸底工作,二要抓基层统计人员的业务培训和继续教育工作,三要抓源头统计数据质量的巡查监管工作,四要抓相关调研工作,各地要在充分调研的基础上,向当地党政领导提交一套加强统计基层基础建设的工作方案,五要抓统计法律法规的宣传工作,向统计调查对象宣传新的《统计法》。四是督促检查指导工作要到位。方案措施确定之后,贯彻落实就是决定因素,而督促检查指导可以促进贯彻落实的效果。

㈢抓住重点,明确目标,分步实施,努力做好统计基层基础工作

一是实实在在落实目标责任。希望大家要按照“有特色、出亮点、求实效”的目标要求,做到主要领导必须亲自过问。在狠抓基层基础建设工作上要有明确的工作计划。决心要大、信心要足、措施要硬,深入、细致、详实的做好本地乡镇统计工作情况摸底工作。各地要把这项工作摆在更加突出的位置,及时向政府领导汇报,积极争取党政领导的关心和支持。

二是锲而不舍努力破解工作难题。市局这次在县召开全市统计基层基础建设座谈会,目的在于进一步加强统计基层基础建设。我们要在传承以往好的做法的基础上,结合本地实际,在加强基层基础建设上要创造性地有所作为。在取得当地党政领导关心支持的同时,整合部门力量,想法设法解决统计机构设置、人员编制、经费来源、办公条件等一些现实但又急需解决的问题,锲而不舍,做到问题不解决不撒手。

数据分析的统计学基础篇3

关键词:教育基层基础统计

统计学根据原理划分可以分为描述统计学与推断统计学两部分。描述统计学即研究简缩数据和描述这些数据,通过对所搜集的数据进行分类汇总,通过多种图形、表格方法呈现出来,对这些数据进行计算得出的“集中量数”“差异量数”和“相关系数”等特征数值。对有关教育活动的典型性、波动幅度以及相互之间的关联性进行表述,对教育的内在规律予以表现;而推断统计学是对数据进行统计检验、分析以及非参数统计等多种方式进行的科学判断。也就是通过一定的置信度,参考一部分数据而对教育发展情况进行推理判断,通过推断统计得出的结论能广泛应用于教育范围之中。

现行的教育统计主要依靠“描述统计学”理论来进行教育统计,进而对教育现象及其发展规律进行分析。教育统计作为一项基础工作,是进行宏观决策、实行科学管理的重要内容,也运用“推断统计学”理论来规划和预测教育未来的发展。我们可以说,教育统计工作的认真落实,对教育计划的制订与监测、发展规划的执行与落实有着重要的意义。与此同时,教育统计工作也是深化教育改革,实现教育不断发展的有利因素。如何扎实地开展教育统计工作,保证教育统计数据质量的真实性,直接关系在教育的发展现状以及未来的发展趋势。“求真务实,与时俱进”是教育今后发展的追求目标。基于此,规范与加强教育统计基层基础建设工作,务必要通过一整套卓有成效的实践措施。教育统计管理工作的规范化、业务流程标准化、任务落实制度化、统计调查法治化、统计人员专业化和统计手段现代化的工作机制,是当前各级教育统计机构以及每个基层教育统计工作人员应当重点落实的工作任务。笔者做统计工作已有十个年头,现就统计工作经验,对如何加强教育基层统计工作提出几点建议。

一、当前教育基层基础统计工作现状

(一)统计数据的真实性无法保障

部分统计对象因认知程度不高,配合不到位,导致统计数据的真实性无法保障。在传统观念中,“七分统计,三分估计”的思想仍然根深蒂固。这些统计对象(学校)在一些不正当利益的驱使下,对教育基层基础统计工作的严肃性与重要性持不配合的态度。少数统计对象(学校)因惧怕实底的泄露,有意识地进行虚报与瞒报。还有对统计资料的提供不及时,统计资料的真实性也有待商榷。这种由统计对象(学校)人为制造的影响因素,对统计基础资料的收集产生了一定的阻碍;与此同时,一部分基层单位在报表的收集过程中缺乏及时性与积极性,不能自觉准时提交统计资料,给基层源头数据的收集造成极大不便。每次在报表送审的最后期限内,不管是定期的报表或者是抽样调查表,都需要县级教育统计工作人员反复的催促与跟进才能将报表收集到手。催报时间长、催报难度大,基础教育统计工作人员在基层源头数据的收集上花费的精力与时间过长,都严重影响到报表录入及处理分析。

(二)教育基层统计机构力量薄弱

教育基层统计机构力量薄弱,具体表现在部分二级教育统计机构中,统计任务与统计工作人员力量差异较大。当前,教育统计人员有许多属于兼职,其主要工作任务为教学或者财务,统计任务的开展主要依靠业余时间完成。县教育局、乡(镇、街道)教育办公室、学校教育统计人员负担了多数的统计数据的收集、审核等任务。基于这种形势下,统计人员配置与实际统计工作量之间矛盾明显。

(三)基层统计人员素质亟须提升

在当前统计形势与工作现状之下,教育基层统计人员的工作能力与业务素质仍存在许多不足,亟须提升。当前,教育基层统计机构工作人员能做到会统计、会调研、会分析、会计算机的“四会”标准人数较少。而基于“四会”标准之外,懂政策、知法规、能统计、会预测的复合应用型人才少之又少。这种现象的存在,很大程度上影响了基层统计数据的可靠性。

(四)教育基层统计受教育基层经费制约

教育基层统计受教育基层经费制约,时常使其陷入困境之中。作为教育统计经费的主要来源,由于县级教育主管部门办公经费不足,在保证统计人员工作成本的同时,举步维艰的维持着统计基础设施以及网络化建设需求。更为严重的是部分基层(学校)统计单位的领导还没认识到教育统计的重要性,甚至连购置统计专用设备报告都未打过。

二、关于教育基层基础统计工作的建议,

(一)健全机构、提升统计人员职业能力

健全机构、提升统计人员职业能力,为规范教育基层基础统计工作打下坚实基础。首先,要完善壮大县教育局、乡(镇、街道)统计机构,充实、培训统计人员,尽快考虑对市、县级成立相应教育统计机构,并关注基层教育统计工作人员的编制以及经费投入问题。与此同时,针对教育基层(学校)统计工作中的不足,加大督导力度,完善统筹、组织、协调以及各项统计工作任务,为保证基层教育各项统计工作的落实打下良好基础;其次,要关注对教育基层(学校)统计工作的监督与管理,对政府统计与教育统计两者的关系有明确的认知,实现教育统计工作与统计部门工作资源共享;再次,加强教育统计工作人员的资格认定,通过创新培养方式为教育统计工作培养出高水平的工作人员;最后,建议上级教育主管部门与政府统计部门加强教育统计报表的管理,以及相关部门和统计部门之间报表的对应,为改变报表指标不统一,减轻基层统计工作负担提供便利。

(二)提升统计质量与效率

关注统计质量与统计效率的提升。对教育统计数据质量的提升应从数据的完整性、准确性、及时性、简便性和适用性五个方面着手。完整性,即要求统计采集范围与被统计对象(学校)数据内容的完整性;准确性,即统计数据质量在统计信息客观性、真实性上要符合基层(学校)真实情况。在数据采集源头上确保数据质量真实可靠,对上报的数据是否符合统计制度相关规定,指标填报、计算方法正确与否、结果是否精确等问题应细致审查;及时性,即数据质量在统计时间与价值上要满足教育统计数据的时效性。统计工作中以求真务实的态度,通过对统计方式方法的不创改革创新,对数据统计、收集、时间不断压缩,以高效的统计效率完成教育统计数据;简便性,即统计数据质量与统计信息在使用过程中应尽量简便明了,便于各级领导与政府部门、社会公众理解接受。在执行过程中,要加强与政府各部门合作,以资源共享形式减少重复统计工作,降低教育统计工作量。同时,对外公布的统计数据、图表以及分析文章等,必务以精确、简洁的表现方式,将枯燥的数据、专业的图表及术语进行适当转换,以符合大众理解能力;适用性,即统计数据质量在统计信息价值实现上的适用性。通过对教育统计数据的实际需求开展教育统计工作,在工作开展之前要了解各级领导决策与社会各界对教育数据的需求,以符合实际需求为基础开展教育统计工作。

(三)提升教育统计服务水平

1.提高服务的主动性

打破传统服务观念,提升服务意识,根据县域教育以及社会发展现状,主动积极开展教育统计服务,对教育发展中存在的优势与不足进行深入思考,及时反馈。

2.增强服务的针对性

统计工作的开展不仅要满足数量的要求,同时对分析的质量也需引起重点关注。对当前教育中存在的重点、热点、难点问题,要认真分析选题,对具体问题细致分析,针对问题提出符合现状、有针对性以及可操作性强的建议。

3.提高服务的实效性

对教育发展趋势科学预测、及时掌握,打破信息反馈与提供被动的教育统计现状,加大对信息反映与提供问题的研究探讨,确保数据精确度与实效性。

(四)规范教育统计执法基础工作

首先,抓住“九五”普法机遇,在《统计法》与教育统计工作中,加大统计违法案件的查处力度,对违规行为进行分析与曝光,营造出法治统计的良好氛围;其次,通过各项统计制度的制订与完善,督促教育统计基础工作规范化。要求严格落实统计制度与统计标准,对各教育统计项目业务之间的关系、统计主管部门的业务关系、上下级教育统计机构间的业务关系进行沟通协调。强调统计工作的整体性、协调性和互补性,完善统计数据采集、审核、加工、管理各环节流程化建设,实现统计原始记录、统计报表、统计台账的规范化、档案化管理。

(五)全面提升教育基层统计人员素质

通过多种渠道,提升教育基层统计人员素质。作为统计工作的实践者,教育基层统计工作人员,既要掌握基础的统计工作方法,如数据收集、指标的计算、资料的分析整理等,在此基础上,对现行的教育方针、政策、趋势等要有明确的了解。与此同时,还要具备一定的信息网络技术。要加强教育基层基础统计工作效率,就要不断对统计人员进行教育培养,通过资金、技术、人力等方面的投入,培养打造一支优秀的教育基层统计队伍。教育培训方式可以是多样的,如集中培训、鼓励其自主进修、请专家进来讲课,或将统计人员送大专院校学习等,实现基层(学校)教育统计员自身职业素质的增强,自主学习扩展专业技能,对教育趋势进行精确把握。并通过网络系统的熟练运用,加快信息传递,成为时代所需的高水平的教育统计人才。

(六)借助信息化完善统计工作

随着信息化建设的不断加快,教育统计工作依托信息化建设平台对实现工作效率提升、统计服务技能完善、统计现代化发展有着积极的作用。基于现有的硬件与网络资源,通过构建统计信息服务网络互动平台,整合网络信息资源,向“统计信息标准化、数据传输网络化、业务处理电子化、信息服务社会化”大跨步前进。

三、结束语

统计工作的开展为了解教育现状、预测未来,实现教育发展提供参考。教育统计分析研究的数据主要来源于教育最基层(学校)的基础数据,因此,加强基层(学校)基础统计工作是教育统计工作环节的重中之重,是提高对教育统计研究、分析以及更好地为教育发展服务的重要保障。

参考文献:

数据分析的统计学基础篇4

多维数据分析可从多个角度对数据进行观察和处理,将业务型数据转化为管理型数据以获得有用信息,从而为管理决策部门提供有效支持.在数据库管理系统(SQLServer2008)平台上应用多维数据分析方法,提出了基于火电行业环境影响评价应用方案的不同阶段:需求分析、业务关系数据库构建、多维数据仓库构建、多维数据集构建、前端报表展示,并以基于已入库的火电项目指标库为分析对象,给出了不同时期、不同区域电力建设项目的分布、投资、资源消耗、污染物排放等多维分析结果,使用户可从多角度、多侧面分析火电行业建设和发展情况,为环境管理和决策提供科学快捷的决策数据支持.

关键词:

多维数据分析;火电行业;环评基础数据库;数据仓库

中图分类号:X828文献标志码:a

applicationofmultidimensionaldataanalysisintheeia

databaseofthermalpowerindustry

DinGFeng1,CHeLei2,XinGKe-jia1

(1.appraisalCenterforenvironmentandengineering,mep,Beijing100012,China;

2.Beijinginformationscience&technologyuniversity,Beijing100192)

abstract:

Bymultidimensionaldataanalysis,datacanbeobservedandprocessedfrommultipleperspectives,andusefulinformationisacquiredbyconvertingbusinessdataintomanagementdata,inordertoprovideeffectivesupportformanagementdecision-makingdepartments.BasedonSQLServer2008andbyadoptingthemultidimensionaldataanalysis,astatisticalanalysisisperformedontheenvironmentalimpactassessment(eia)basicdataofthermalpowerindustry.theapplicationsolutionofmultidimensionaldataanalysisincludesthefollowingstages:requirementsanalysis,constructingrelationaldatabase,constructingofmultidimensionaldatawarehouse,constructingofmultidimensionaldatasets,andmakingclient-sidereports.wecangettheanalysisresultsofthedistribution,investment,resourceconsumption,andtheenvironmentalimpactofpowerconstructionprojectsindifferentperiodsanddifferentregions.Userscananalysetheconstructionanddevelopmentofthermalpowerindustryfrommultipleperspectivestoprovideeffectivescientificdecisivedatasupportforenvironmentalmanagementanddecision-making.

Keywords:

multidimensionaldataanalysis;thermalpowerindustry;environmentalimpactassessment;datawarehouse

随着国家基础设施建设的不断发展,发电厂近年来发展迅速.根据统计,2000-2010年,全国新建电厂达1000余座.为了实现对全国火电行业发展的宏观了解和控制,同时又便于具体分析,2010年国家环境保护部门开始建设环境影响评价数据库.数据库课题组在建设火电行业环境影响评价报告书的基础数据库中发现需要解决的问题有:基础数据入库后可能存在数据冗余;对基础数据的应用仅限于数据管理的初级阶段;无法对海量数据进行有效的分析和利用.如何实现这些数据的多维度、多层次分析,并从中发现潜在的规律和有价值的信息,对于科学决策将十分有意义.

1多维数据分析技术

多维数据分析是从多个角度对数据进行观察和处理,将业务型数据转化为管理型数据以获得有用信息,为项目管理决策提供有效支持.多维数据分析的概念最早由关系数据库之父Codd于1993年提出[1].它是基于联机分析处理(on-Lineanalysisprocessing,oLap)技术的一种数据分析方法,其核心是“维”.“维”是人们观察世界的角度.多维数据分析的基本分析操作有钻取、切片、切块、旋转,它使用户可快速、一致、灵活地掌握从总体到局部的数据汇集情况,将海量数据表象中所隐藏的信息直观地呈现给用户.通过从不同角度(维)对数据信息进行快速、有效、稳定的交互访问,决策人员能够深入地观察数据规律及数据所反映的问题.

多维数据分析离不开数据仓库的建立.数据仓库是面向主题的、集成的、不可更新的、不同世界的数据集合,用以支持经营管理中的决策制订过程[2].数据仓库的构建是一个处理过程.该过程从历史角度组织和存储数据,并可进行集成数据分析.多维数据分析利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总,采用联机分析和可视化工具对这些数据迅速进行评价,将复杂的分析查询结果快速地返回给用户.

进行多维数据分析需要一个良好的工具平台.microsoft提供的商业智能平台有助于创建功能齐全的商业智能系统.microsoft商业智能平台基于数据库管理系统(SQLServer2008)和microsoftoffice2007系统.其中,SQLServer2008包括SQLServer数据库引擎、集成服务、分析服务、报表服务.SQLServer数据库引擎是一个关系型数据库管理系统,可满足数据源层的要求.SQLServer2008中的数据库引擎提高了其作为企业数据仓库和数据集市的能力.集成服务可从多种数据源中提取和转换数据,并将数据加载到企业的数据仓库、数据集市,或直接载入分析服务.分析服务同时提供多维oLap和数据挖掘功能.分析服务满足了分析层的需求.报表服务可在表示层实现企业报表功能,显示数据分析和数据挖掘的结果[3].

2多维数据分析应用方案

2.1多维数据分析方法

目前常规的环境数据分析基本处于简单统计和汇总水平.采用多维数据分析方法观察和分析数据,并对数据进行相应处理和环境数据挖掘工作则是实现辅助环境决策的重要手段.目前火电行业环境影响评价基础数据库中的项目基本数据、环境监测及污染影响预测数据等具有时间性和动态性外,还具有空间属性,最适于采用地理信息系统(GiS)进行表达[4].基础数据库在整体建设过程中,引入综合最新数据库的设计经验,基于先进的地理信息系统(arcGiS)完成整个系统的总体设计及相应应用软件的编制,并建立系统的图形数据库.将文字资料输入相应的系统资料库,形成多层次、多功能的环境基础数据库.实现对火电建设审批项目进行统一数字化管理,提供建设项目及污染数据的可视化显示、统计查询、空间分析、图层管理等功能.

火电行业环境影响评价基础数据库项目是国家环境影响评价基础数据库的一部分,自2010年建设以来,已陆续收集整理全国范围内656个经国家审批的新改扩建火电项目的环境影响评价基础信息.数据库指标包括:项目基本信息、建设规模与工艺、项目所在地环境质量现状、资源消耗、污染控制措施、排污总量与总量指标、评价等级与基本预测结论、清洁生产指标等[5].多维数据分析在火电行业环评基础数据库的应用方案主要包括需求分析、业务关系数据库构建、多维数据仓库构建、多维数据集构建、前端报表展示等阶段,如图1所示.

2.2多维数据分析应用方案

2.2.1需求分析

火电行业环境影响评价基础数据库的数据统计分析需求包括:(1)统计分析不同时期、不同区域、不同规模的项目措施的类型和效率;(2)对污染物排放、能源消耗、水资源消耗、环境影响等方面进行多维数据分析;(3)不同时期新建电厂的地域分布、投资分布以及发电量等分类统计;(4)结合项目的投资与工艺的时间与空间分布特点,统计分析不同工艺的电厂投资比例及污染防治措施等;(5)可以各种报表形式显示统计分析结果.

2.2.2构建业务关系数据库

火电行业基础数据库数据分为8大类型:项目基本信息、建设规模与工艺、环境质量、项目资源消耗、污染控制措施、排污总量、评价等级与基本预测结论、清洁生产指标等[5-8].根据调研获取的需求分析,通过建立逻辑数据模型和物理数据模型,在SQLServer2008中构建相应的业务关系数据库.业务关系数据库构建完毕后,根据标准数据采集模板采用人工与自动分析读取数据相结合的方式采集环境影响评价报告书及相关业务报表数据,建立指标数据表,为以后的数据仓库和数据分析提供数据源.

2.2.3构建多维数据仓库

多维数据仓库通常是组织内商业智能(Bi)基础设施的核心组件.在多维数据仓库中,保持度量值的详细值或事实的表称为“事实表”;包含了维度信息的表称为“维度表”.依据需求分析,涉及到的维度表有时间维度表、建设单位维度表、区域维度表、行业维度表、污染物维度表等;事实表有发电量事实表、耗煤量事实表、取淡水量事实表、污染物排放量事实表等.这些维度表和事实表的数据都来源于业务关系数据库,通过SQLServer2008数据集成服务,将业务关系数据库中的数据转换到数据仓库中.

2.2.4构建多维数据集

在SQLServer2008分析服务下,构建基于多维数据仓库的多维数据集,包括设计维度、设计度量值组和度量值、设计聚合和层次结构、设计用户需求表、设计关键性指标等工作.多维数据集构建完毕后,依据统计分析的需求及目标,对数据进行全面分析,展现有价值的信息.

2.2.5前端报表展示

在SQLServer2008分析服务中,基于多维数据模型,对多维数据集进行oLap操作,并将其部署到本机的分析服务器上.最后,以分析服务完成的数据集为数据源,用SQLServer2008报表服务,实现以报表、图表或仪表盘等直观显示方式呈现给前端的决策者或业务人员,同时可结合GiS等地理信息系统,实现统计结果的多种形式的直观显示.

3多维数据分析示例

3.1数据分析对象

目前国家环境影响评价基础数据库火电行业共入库了2005-2010年部级审批项目656个,并已按规范的行业指标库设计模板进行数据指标的采集工作,基于行业指标库及用户需求,应用多维数据技术开发了基础数据库应用系统.初步统计入库的全部项目共涉及全国范围内项目审批计划总投资2.2万亿元,其中环保投资2667万元.基于基础数据库应用系统可实现所有项目的地理信息显示、查询、数据的常规统计分析及图形显示功能,如图2所示.

3.2多维数据分析结果

图3以柱状图形式给出了火电行业项目及投资数据统计结果,分别按省份、年份统计项目数量和投资关系.其中,“十一五”期间(2006-2010年)审批火电项目数据最多的省份为山西、内蒙古和江苏,而同期统计火电项目总投资最多的省份为江苏、内蒙古和安徽,新增项目投资额1000亿元以上的省份有内蒙古、山东、江苏、山西、安徽、河南、广东、河北等8个,占全国总投资额的59.1%.环保投资比例统计显示,全国火电项目环保投资平均占总投资的11%,其中环保投资比例最大在安徽,达到18%,其次是山东,为14%.

结合入库火电项目的基础指标信息,并引入数据处理与统计分析方法,可对历年数据进行趋势分析,如图4所示.从而为宏观决策提供一定的〖Cm(21〗数据支持.根据对“十一五”期间全部416个火电

项目环境影响评价指标进行统计分析,“十一五”期间,全国新审批火电项目总装机规模32.8万mw,总计投资1.3万亿元,其中:环保投资1664亿元,占总投资比例的12.6%;审批项目数、项目投资总额等数据指标基本呈逐年下降趋势.由于项目环境影响评价审批相对于实际建设有1~2a的提前期,通过对环评投资额的趋势分析,在一定程度上可预测未来实际行业投资的变化趋势.

结合基础数据库的多维统计分析结果和GiS地理信息系统,将分析结果输入到GiS系统,借助于GiS的图形分析和显示功能,展示数据分析结果.图5借助arcGiS展示了数据库中的项目按省份进行统计分析的数据分析结果(以基准年2005年为例),包括各项目的电厂总投资分布情况、新增装机容量分布、新增耗煤量及按各省统计的三种主要大气污染物(So2、no2、烟尘)的排放情况示例.用户也可根据实际需求选择不同的数据分析及图形显示表达方式.

4结语

环境影响评价基础数据库在建设、运行和维护中,项目数据指标信息也在不断地补充和更新,业务需求不断增加,对数据库中数据的信息抽取和表达方式以及后期对基础数据的统计分析技术也提出了新的要求.通过运用多维数据分析技术对火电行业环境影响评价基础数据库中的相关数据进行分析,从而得到火电行业的项目分布和排放污染物的特点、环境影响等行业管理的统计分析信息,对全国的环境管理工作和环境影响评价工作的深入开展都将是十分有益的工作.通过分析电力企业的历史数据有可能推断火电行业的未来发展趋势,从而为电力企业的设计、分布和环境管理等方面提供深度决策依据.

参考文献:

[1]LanGitL,GoFFKS,maURiD,etal.SQLServer2008商务智能完美解决方案[m].张猛,杨越,朗亚妹,等译.北京:人民邮电出版社,2010.

[2]maCLennanJ,tanGZH,CRiVatB.数据挖掘原理与应用——SQLServer2008数据库[m].2版.董艳,程文俊,译.北京:清华大学出版社,2010.

[3]SCottC.SQLServer2008.分析服务从入门到精通[m].王净,译.北京:清华大学出版社,2008.

[4]金勤献,陆晨,傅宁,等.城市级环境信息系统总体方案的研究与开发[J].环境科学学报,2002,22(1):103-106.

[5]丁峰,车蕾,王庆改,等.火电建设项目环境影响评价基础数据库建设方案与应用[J].电力环境保护.2009,25(5):4-7

[6]国家环境保护局.HJ/t13—1996火电厂建设项目环境影响报告书编制规范[S].北京:国家环境保护局,1996.

数据分析的统计学基础篇5

关键词:大数据;大学计算机基础;数据分析处理;教学改革

信息化时代,几乎每个社会人都生活在大数据时代所带来的便捷之中。接触最多的就是互联网,及互联网兴起的众多服务,例如云计算、社交网络的使用。这意味着我们无时无刻不在接触大量的数据[1]。我们接触的数据种类越来越多,规模越来越大,作为未来社会的主人翁,大学生有必要掌握一定的数据分析和处理能力,以适应时代的发展。大学计算机文化基础这门课程作为大学生的一门必修的公修课在一定程度上影响着大学生的计算机知识水平。时代的发展对社会人提出了更高的要求,作为大学生必修的计算机文化基础课程的改革也迫在眉睫。

一、大学计算机基础课程的教学现状

目前,除了计算机专业的学生外,中国大多数高校也都将大学生计算机基础开设为公修课程,以此向非专业的大学生普及计算机基础知识,使他们掌握一定的计算机基本技能。但是,现在普遍采用的教学思路是教师上课时按照自己的备课教案完成自己的教学计划,实验课上再要求学生进行上机训练[2]。显然这样死板的教学现状极大地降低了学生的学习兴趣和对学习的主观能动性。

二、大数据时代下大学计算机基础课程教学内容的改革

随着大数据技术的发展和成熟,大数据技术及其应用必然会成为国内各大高校新开设的重要课程[4]。对于非专业的学生,他们大多学习的是大学计算机基础这本教材,而该教材主要讲的是电脑的基本操作和mSoffice的初级应用,并未涉及关于大数据的知识,所以对教材中的内容可以进行适当的修改,增加关于大数据的章节,使学生更好地了解大数据时代的需求,掌握一定的数据分析和处理能力,不断培养和提高自己的计算思维和能力。

1.增加大数据基础及其历史发展章节。

此章节是对大数据的概念以及其定义、结构、特点、意义、用途的基本描述,同时也会详细叙述大数据发展的历史脉络,使大学生能够更清楚的了解大数据,进而激发他们学习的兴趣和热情。

2.增加大数据分析技术及其基本操作的章节。

因为在大数据时代下,要求大学生具有极强的数据分析能力,所以要开设相关的章节,向学生教授如何处理和分析数据,使他们能够适应大数据时代的发展潮流。例如可以向他们介绍HadoopmapReduce、noSQL数据库、内存分析、集成设备等与数据分析有关的关键技术,不断扩充他们的知识。

3.增加大数据处理技术及其基本操作的章节。

在大数据时代下,我们要学会处理这些数量庞大、无形的数据资源,将它们应用于实际生活和社会发展规划的制定上,例如中央电视台新闻联播中的数字看两会一样,通过对大数据的处理来形象地观看今年中国的新发展。所以,增加关于大数据处理和分析技术的章节,并通过利用当今社会上通俗易懂的数据分析和处理软件来让学生自己动手实践,使他们掌握并能够对大量的数据进行分析和处理。本文将SpSS作为数据分析和处理的教学软件,来让学生更好地学习对数据的分析和处理能力。SpSS(StatisticalpackagefortheSocialScience)———社会科学统计软件包,是世界著名的统计分析软件之一。它使用windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。SpSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。SpSSforwindows的分析结果清晰直观、易学易用,而且可以直接读取eXCeL及DBF数据文件,现已推广到多种操作系统的计算机上,它和SaS、BmDp并称为国际上最有影响的三大统计软件。与国际上几种统计分析软件对比,它的优越性更加突出[3]。SpSSforwindows操作简单,被应用的程度和领域广泛,因此比较适合作为数据分析和处理知识的教学软件使用。现在很多国外的知名大学都已经开设了相关的课程,例如大数据分析统计基础、大数据分布式计算、大数据挖掘与实际应用等。同时中国国内的一些高校也正在尝试开设一些关于大数据的课程,以此来帮助学生理解大数据,培养大数据的分析与处理技术的能力[5]。

三、大数据时代下高校计算机教学模式的改革

国内大多数高校基本采用的是大学计算机基础这本教材,尽管该书的内容以及课程结构比较系统全面,但是由于受到学生层次的不同以及教学计划的限制,致使学生不能真正掌握到知识的精髓。同时,教学模式也是理论与实践脱节,这就导致上机操作课失去了本来的作用,成为学生玩游戏、聊天的课堂。另一方面大学生来自全国各地,他们对计算机基础知识和技术的掌握程度有很大不同。这些现实问题促使我们对高校计算机基础教育的教学模式进行相应的改革和调整,以适应大数据时代下社会的需求。

1.分层教学法。

现在的大学生在掌握计算机基础知识和基本技能方面存在着参差不齐的现象,所以在计算机基础教育的教学过程中可以实行分层教学法。采用分层教学法就是对不同程度的学生进行不同层次的教学,其中主要包括讲解分层法、练习分层法、作业分层法和辅导分层法。例如练习和作业分层法就是在对不同程度的学生布置课时练习和课后作业时,按难易程度的不同分配给不同层次的学生。采取这种分层教学法,能够使学生更好地掌握所学的知识,找到适合自身的学习方法,从而能够更好的提高自己的计算机实际操作能力。

2.案例教学法。

案例是最生动形象的表现,通过呈现案例的方式可以加深我们对相关事物的理解。所以教师在教授知识的过程中适当采取案例教学法,通过实例详细地给学生进行讲解,在讲到重难点时可以加以强调。演示完之后提问学生并让个别学生进行再次演示,考察学生课堂掌握情况。这种方式可以使学生更快地接受相关知识,并且记忆犹新[10]。

3.大数据教学法。

大数据时代下占据主导地位的是无穷的信息,对于这些资源,教师可以在教学模式的改革中充分利用。大数据时代下各大高校都拥有大量关于学生的信息,同时教师也可以对日常教学过程中掌握的学生信息进行详细分析,从而能够更好地了解关于学生的家庭情况、学习的努力程度、计算机实际操作的水平、聪明程度以及认知能力的高低等诸多情况。大数据教学法的特点就在于通过这种方式帮助教师更加充分地了解到学生的学习和发展情况,为他们制定适合自身的学习计划,彰显个性化,突出学生在学习过程中的主体性。在大数据时代下,提高他们的学习兴趣,激励他们不断进步,掌握对数据的分析和处理的能力。广泛意义上讲方式就是一种行为模式,对于学生来说学习模式的选择非常重要,依靠大数据时代下大量的信息对于学生来说就是一种学习的方法和技巧。如果学习方式选择正确的话,可以达到事半功倍的效果。如果教师在计算机基础教学中增加关于大数据处理和操作的章节,那么其复杂度和实践性会进一步加强。除了通过操作通俗易懂软件让学生实践以外,还可以与相关企业进行合作,为学生提供海量的数据资源和模拟环境,使学生与大数据时代下的社会发展接轨,也可以使学生体验“实习”的感觉。这种教学方法不仅可以增强学生的实际动手能力,而且可以让学生验证自己在学校学习的理论知识,进而使他们对这门课程的学习更加地深入[8]。当人们在浏览网页、网络购物,或者与别人在社交软件上聊天时[7],相关的记录都会被采集,用作数据分析和处理的资源。所以这也要求新时代的大学生拥有极强的数据意识,同时也要具备过硬的数据分析和处理能力以及计算机专业素养。为了使当代大学生更好适应大数据时代的发展,我们以大学计算机基础这门辐射面最广,使学生受益最大,同时在学生中广泛学习的基础公共课为例[9],详细地论述了在大数据时代下大学计算机教育如何进行相应教学内容和教学模式的改革,并且希望我们的研究能够使大学计算机教育与时代接轨,为社会培养出更多的计算机方面的人才。

参考文献:

[1]李雯雯,韩仙玉,刘文洁.大数据时代计算机专业教育的探索[J].现代计算机,2014,(10):54-57.

[2]苟燕,赵希武.大数据时代下基于云平台的“大学计算机基础课程”建设[J].内蒙古师范大学学报(自然科学版),2015,(01):93-95.

[3]甘丽新,涂伟.大数据时代学生信息素养培养的探索[J].科技广场,2014,(02):140-144.

[4]张青,孙雪梅.大数据时代背景下的个性化教学[J].辽宁教育,2015,(01):15-16.

[5]明小波,孙艳玲,刘杨,苏谦.大数据时代信息类学科专业建设的思考[J].信息系统学报,2014,(13):112-119.

[6]陶烨,金莹.大数据时代社科类专业计算机基础课程改革探究[J].专业与课程建设,2014,(06):31-34.

[7]隆岩.大数据时代下的高校计算机教学改革[J].学术论坛,2014,(25):215.

[8]方昕.大数据时代下计算机专业教学的探索[J].研究与设计,2014,(11):32-34.

[9]李廉.以计算思维为导向深化大学计算机课程改革[J].中国大学教学,2013,(04):7-11.

数据分析的统计学基础篇6

[关键词]大学生;经管类专业;数据分析能力;职业竞争力;问题;策略

[中图分类号]G320[文献标识码]B

近年来,随着全球经济一体化进程的加快和网络时代信息获取的便捷程度的极大提高,“用数据说话,做科学决策”已成为企业提高经营管理水平的必然选择,在全球500强企业中,90%以上的重要投资和经营决策都取决于充分的数据分析支持。数据分析在企业战略规划、项目投资决策、融资决策、营销决策、生产运营与管理决策中发挥的作用和价值日益显现,并已被我国政府部门和各行各业越来越多的企业所认同。在这一时代背景下,社会对项目数据分析师、市场调查分析师这些高技能应用型人才的需求旺盛,供给缺口巨大,据权威部门预测,在未来几年,我国对专业项目数据分析师的需求预计可达20万人,调查分析师的市场缺口则在100万人以上。面对社会对数据分析人才的强劲需求和高校经管专业毕业生就业难并存的局面,高校应充分地认识到,当今社会数据分析能力已成为经管类大学毕业生在职场中生存的一项核心能力,积极探讨提升经管类专业大学生数据分析能力的有效策略,对于更好地适应社会需求,提高大学生的职业竞争力具有重要的意义。

一、社会对数据分析人才的技能与素质要求分析

数据分析是指运用适当的统计分析方法对收集来的大量数据进行整理、分析,从数据中提取有用信息并形成分析结论,提出有价值的决策参考建议的过程。数据分析师是指在不同行业中,专门从事数据搜集、整理、分析,并依据数据做出行业或市场研究、评估和预测的专业人员。笔者通过对各大招聘网站数据分析师、市场调查/市场分析师等职位招聘信息的搜索和分析,深入挖掘并归纳出社会用人单位对数据分析师职位的技能和能力素质要求(详见下表1),以期为高校经管专业学生数据分析能力的培养提供参考。

从表1可以看出,数据分析能力是一种综合实践能力,它要求数据分析人员在了解行业状况及公司业务流程的基础上,构建数据分析的思路,主动地搜集相关数据,运用恰当的统计分析方法,借助于统计分析软件对数据进行处理和分析,从而得出分析结论,并撰写出有价值的分析报告。

通过以上分析,笔者认为,高校在经管类专业学生的培养定位中应对数据分析能力的培养给予充分的重视。应要求所有经管类专业的学生具备基本的数据分析能力,以适应本专业领域业务数据的收集、整理和初步分析的需要,并有针对性地培养出一批具有较强数据分析能力的学生,为他们考取项目数据分析师、调查分析师等资格证书创造条件,使他们有机会成为各行业中数据分析领域的高级专门人才。

二、经管类专业大学生数据分析能力培养中存在的主要问题

(一)经管类专业课程体系设置中缺少数据分析能力培养模块

当前,在许多高校经管类专业的培养方案中,较少设有专门讲授数据分析内容的课程。与数据分析相关的内容分散于《大学计算机基础》、《数据库应用基础》、《统计学》、《市场调查与预测》等课程,学生虽然从多门课程中接触到与数据分析相关的一些内容,但各门课程的教学资源未能实现有效的整合,如,《大学计算机基础》课程一般在大一开设,该门课程中将excel软件作为办公自动化软件之一,一般只讲授简单的文字和数据录入及处理,并未涉及excel软件的高级数据分析功能。而《统计学》和《市场调查与预测》课程一般在大二开设,主要侧重于从理论上介绍数据的收集、整理和数据分析的各种方法,以及市场调查和市场预测的各种方法,这两门课程主要为数据分析提供方法论的指导。这样的课程体系设置中就缺少了将数据分析的方法与数据分析的工具结合起来培养学生数据分析实际技能的课程,致使学生并未能有效、深入地掌握实际的数据分析技能。

(二)缺少实用性强的培养学生数据分析能力的实践教材

近年来,一些出版社出版了一批以excel或SpSS为分析工具的统计分析教材,如:黄等编著的《excel统计分析基础教程》、邓维斌等编著的《SpSS19(中文版)统计分析实用教程》等教材,这些教材在内容体系上与《统计学》教材大体相同,教材内容涉及面广,与企业实际需求结合不紧密且难度较大,对于没有数据分析基础的学生来讲很难掌握,而且有些高级统计分析方法在企业的实际工作中也很少能应用到。

(三)缺乏数据分析理论与实践能力兼备的教师队伍

培养学生的数据分析能力,首先需要拥有一支既懂数据分析理论又能指导学生统计软件操作的高水平的教师队伍,而长期以来统计学教学中一直存在的重理论,轻实践的状况,使得能够讲授《数据分析》实践课程的教师严重缺乏,这也是影响学生数据分析能力培养的关键制约因素。

(四)学生对数据分析存在畏惧心理

对于许多初次接触统计学和数据分析的学生,经常会对书中大量的数学公式和复杂的软件操作产生畏惧心理和回避心理,加之一些统计学教师在教学过程中对学生的学习没有加以正确的引导,致使很多学生从一开始就对掌握数据分析这门有用的技能失去了的兴趣和学习的信心,从而必然会影响到学习的效果。

三、经管类专业大学生数据分析能力提升策略的探讨

(一)完善学生数据分析能力培养模块

为强化学生数据分析能力的培养,高校经管类各专业的培养方案中应设置培养学生数据分析能力的模块。笔者认为,首先应将已开设的与学生数据分析能力培养相关的《大学计算机基础》、《数据库应用基础》、《统计学》、《市场调查与预测》等课程的内容进行有机地整合,在此基础上,在大三学年开设《数据分析基础》实践必修课,以加强学生数据分析的实际技能,构建学生数据分析能力的完备知识体系。同时,经管各专业还可根据需要增设《SpSS软件应用》作为专业选修课,以满足那些对数据分析有浓厚兴趣,准备考取项目数据分析师、调查分析师资格证书,有志于成为数据分析专门人才的学生的需求。

(二)开发实用性强的《数据分析》实践教材

借鉴社会项目数据分析师、调查分析师资格认证相关培训教材,编写一部《数据分析基础》实践教材,教材将以通用的excel软件为分析工具,这样可以降低学习难度,从心理上拉近与非统计专业学生的距离,目的是使经管专业的学生掌握必知必会的数据分析概念、流程和操作,以适应社会对经管类应用型人才应具备基本的数据分析技能的需求。教材的内容体系将按数据分析的流程构建,具体内容将设以下7大模块:1.数据分析概述;2.数据采集;3.数据处理;4.数据分析(包括数据分析方法、数据分析工具的使用);5.数据呈现;6.报告撰写;7.综合案例。

(三)培养一支数据分析理论与实践能力兼备的教师队伍

针对当前部分高校缺乏数据分析理论与实践能力兼备的讲师队伍的难题,学校可以采取“引进来,走出去”的办法多渠道解决专业师资力量不足的问题,一方面可以从其他学校聘请专业教师授课,也可以派出本学校中、青年教师到其他设有统计学专业的高校进行短期的进修学习,以提高数据分析的理论水平和实践能力,此外,学校还可以鼓励本校中、青年教师考取项目数据分析师等资格证书,以深入地了解社会对数据分析能力的需求,使学校的人才培养定位与社会需求能够实现无缝对接。

(四)培养学生对数据分析的浓厚兴趣

记得有一位资深的数据分析人士曾说过:“统计学是一门很难,但是很有趣,更是很有用的工具学科。懂得如何使用它的人总是乐在其中,而尚未入门的人则畏之如虎。”笔者结合多年的教学经验认为,要想将《统计学》这样一门多数人认为很难的课程让初学者理解它、接受它,对它产生浓厚兴趣,需要借助一些人们生活中的小案例,将难懂的统计学的基本概念和公式还原回生活当中,用来解释社会经济现象,帮助学生发现隐藏在数据背后的规律。总之,培养学生对数据分析的浓厚兴趣,是提升经管类专业学生数据分析能力的关键所在。

[参考文献]

[1]邓维斌,周玉敏,高锡荣.经管专业数据分析能力研究[J].数字通信,2013(2)

数据分析的统计学基础篇7

一、统计学课程教学的目的

根据中医学专业课程的特点和统计学教育培养目标的要求,本课程的教学目的主要是掌握中医药管理,提供统计调查、资料整理和统计数量分析的一般原理与方法,为学习其他医药管理类课程的数量分析方法打下基础。要达到以上目的,在学习中要求了解统计的产生与发展,掌握数据搜集、整理和显示的方法,能描述中医药临床现象统计分布的特征,掌握抽样推断、相关回归分析、统计指数、时间序列分析、统计预测等统计分析研究方法,并作出综合评价。

SpSS是非专业统计人员的首选统计软件。学生将经历简单的数据统计过程,进一步学习搜集、整理和描述数据的方法,并根据数据分析的结果作出简单的判断与预测,并能计算一些简单事件发生的可能性。在教学中,应注意所学内容与中医学专业现实生活和工作的密切联系,应注重使学生有意识地经历单位的数据统计过程,根据数据作出简单的判断与预测,并进行交流;应注重在具体情境中对可能性的体验,应避免单纯的统计量的计算[2]。

二、中医药统计学课程教学的现状

统计学,按照《大不列颠百科全书》的定义,“是关于收集和分析数据的科学和艺术”。因此,统计是围绕数据分析而建立的。其中包括运用统计的方法来分析数据,组织和显示数据(表格和图形),并在数据的基础上形成推论和预测。

从具体应用的角度来分,统计学包括三个部分:描述统计、推断统计和实验设计。其中,在中医药统计学课程中,主要涉及的是描述统计。描述统计是指对所搜集的大量数字资料进行整理、概括,寻找数据的分布特征,用以反映研究对象的内容和实质的统计方法。例如,对原始数据资料用归组、列表、图示等方法加以归纳、整理,为进一步处理数据资料做好准备工作。计算集中量指标(如算出平均数、中位数)用来反映数据的集中趋势。描述统计可使无序而庞杂的数字资料成为有序而清晰的信息资料。描述统计是整个统计学的基础。统计表是对数据分类后的一种简便表示形式。根据学生年龄的特点,从实物的分类,到抽象的统计表表示将经历几个年级段的学习。对低年级的学生来说,可以通过列表的方式来体验统计的意义。统计表的制作不只是一个简单的技术问题,而是在制作过程中体验和理解统计表意义。不是一个简单的数据堆砌的过程,而是一个对数据理解的过程。设计简单的统计表是更加规范地收集数据的一种方法。学生在设计一个统计表时,一方面,要明确调查的目的,为什么要去调查;另一方面,要考虑调查这个问题所涉及的内容。这些问题在开始设计时,需要有一个全面的思考,这样,在设计统计表时,就容易获得成功。其中,每一项具体内容都应围绕调查的主题。

以往的课堂教学中,由于内容多、时间紧,每次课都是“满堂灌”。教师讲得口干舌燥,学生要么机械地记笔记,要么昏昏欲睡,根本用不着动脑,如果课后不下功夫的话,课堂上的学习时间几乎是白白浪费了。为了解决这个问题,可以尝试“少讲多练”的教学方法。

三、中医药统计学课程教学改革的建议

1.课程教学内容应由浅入深

在教学过程中,要注意基础理论、基础知识和基本技能的学习和培养;紧密结合实际,注重统计分析的基本理论与方法的应用。在教学方法上:每部分教学结束,对全部内容进行小结,提示重点与难点内容,并布置适量的复习思考题与计算分析题,以理解与巩固所学内容。并可选用创新性教学形式,如案例教学、实务分析、作业指导、多媒体教学、课程设计等。在学习过程中:根据实际情况安排两次左右习题课,以解决练习中的问题。有关部分可安排选题练习,即自己选题,自己搜集资料、整理资料,选择适当的统计分析方法。

2.加强中医药专业统计学的实践教学

统计学本科阶段的实践包括课程实验、社会实践、毕业实习等实践活动。统计学专业学生通过本科阶段的学习,必须熟练掌握统计学的基本原理和基本方法,具备应用统计学原理和方法解决实际问题的能力。社会实践包括社会调查等活动,主要培养学生将统计学原理和方法用于社会实际的能力。这类实践学生可利用假期等业余时间进行。

毕业实习是统计学专业学生必修课程。集中一段时间,安排学生到实习单位学习,较为系统、全面地培养学生将统计学原理和方法应用于实际的能力。毕业实习时间一般为9周左右,安排在大学第三学年的假期或第四学年的第一学期进行。学生的学习效果最终需用考试成绩来反映。

3.紧密联系生活实际

教学要紧密联系学生的生活实际,从学生的生活经验和已有知识出发,创设生动有趣的情境,引导学生开展观察、操作、猜想、推理、交流等活动,使学生通过教学活动,掌握基本的教学知识和技能,初步学会从中医药统计学的角度去观察事物、思考问题,激发对中医药统计学的兴趣,以及学好中医药统计学的愿望。教师是学生中医药活动的组织者、引导者与合作者;要根据学生的具体情况,对教材进行再加工,有创造地设计教学过程;要正确认识学生个体差异,因材施教,使每个学生都在原有的基础上得到发展,要让学生获得成功的体验,树立学好中医药统计学的信心。

课堂教学需要把握好教学内容的整体性和联系性。这一方面是中医药统计学学科特点的要求,中医药统计学学科的严谨性和系统性要求中医药统计学教学必须从整体上把握教学的内容,只有从整体上把握了教学内容,才能对每一章节、每一堂课的内容的地位、作用有深入的分析,对重、难点有恰当的定位,也才能有效地突出重点、突破难点,合理地分配时间。另一方面是中医药统计学学习的需要,是学生认知的需要,学生有意义地学习不是一个被动接受知识、强化储存的过程,而是用原有的知识处理各项新的学习任务,通过同化和顺应等心理活动和变化,不断地构建和完善认知结构的过程,把客观的中医药统计学知识内化为自己认知结构中的成分,而强调整体性和联系性正是顺应了学生这一认知的需要,可以帮助学生将零散的知识点形成有内在联系的知识网络,而形成网络结构的知识不仅对于当前的学习,而且对于学生认识和理解中医药统计学都是十分有益的。

总之,统计学产生于工作实践,又服务于工作实践、指导工作实践活动。中医药统计学课程教学是统计学教学体系的有机组成部分。在整个统计学教学过程中有多个实践环节,分别实现特定的教学要求,共同形成一个有机整体。

参考文献:

[1]赵莹.浅谈中医药统计学教学中的几点体会[J].数理医药学杂志,2012(05):630.

[2]魏兴民,任真,代婷.excel在中医药统计学教学中的应用[J].高等数学研究,2013(01):93—95.

数据分析的统计学基础篇8

(一)培养学生的兴趣职业教育的目的是培养高素质、技能型专门人才。所以,在统计教学中,要考虑理论知识的适度、够用,而不刻意追求理论体系的完整。要强调统计基础知识的掌握和统计基本技能的训练,注重提高学生运用基本理论和方法来分析、解决实际问题的能力。在语言表述上,力求简明、通俗、易懂,把概念表述准确、完整,便于学生理解、掌握。同时,将统计知识与计算机知识融为一体,让复杂难懂的统计理论和方法变得简单、快速、准确。将反映国计民生的最新统计数字放在恰当的地方与教材内容紧密结合,让学生感受我国社会经济的高速发展,人民生活的丰富多彩,国家变化的日新月异。这也能提高学生的学习兴趣。

(二)科学设置教学内容统计的目的是认识社会经济现象总体的数量方面,从中发现带有规律性的东西。为了达到这个目的,统计需要做一系列的工作。统计课的教学内容就是按照统计工作过程的每个阶段来安排的:统计设计、统计调查、统计整理、统计描述、统计推断、统计分析和数据积累。其中,统计设计和统计数据积累理论性较强,原则上让学生知道“是什么”、“怎么做”就行了。而对于统计调查、统计整理这两部分,内容虽然多,但容易理解,可以简单讲解,让学生多看,借此培养学生的自我学习能力。统计描述、统计推断、分析这几部分内容,要在学生对统计基本概念准确理解的基础上进行系统讲解。搜集统计数据的过程又称为统计调查,就是围绕统计指标及其体系搜集统计数据,特别是原始数据。主要方法包括直接观察法、报告法、采访法、邮寄法和实验设计调查法。统计整理,即对调查资料进行加工汇总。统计调查所获得的资料往往是分散的、不系统的原始资料,这就要求我们必须对统计调查所获得的资料进行科学的整理,并通过合适的形式把这些整理结果表述出来。具体来说,统计整理是根据统计研究的目的和要求,对统计调查所得到的原始资料进行科学分类、汇总,或对已初步加工的资料进行再加工,使之系统化、条理化,成为能够反映现象总体特征的综合资料的工作过程。统计整理主要讲方法,包括分组、汇总和编制统计表和绘制统计图。统计课的主要内容包括:统计描述(综合指标)、抽样推断、统计指数、时间数列(动态分析)和相关与回归分析。这也是重点和难点。

(三)注重学科知识的系统性统计各章节内容的安排是有逻辑性的,前面内容往往是后面内容的基础。学习过程环环相扣,不能跳越某一章节而直接进入后面的章节。总论部分是对统计课程教学内容的概括描述,通过学习,使学生了解统计学的基本框架体系,把握统计学的涵义、研究对象、研究方法及统计活动的过程,尤其要准确理解统计学的基本范畴(基本概念)。统计学基本范畴包括:总体、总体单位、标志、统计指标以及延伸出的小概念。如果把统计课的学习比喻为盖高楼大厦,那么这些基本范畴就是地基或基石。深刻理解领会这些基本概念的含义,准确把握基本概念之间的区别与联系,并能正确运用,就为这座高楼大厦夯实了地基、稳固了基石。教师讲解这些概念时,可结合生活中学生熟悉的例子深入浅出地讲解,课下布置练习进行巩固。

二、统计课重点、难点内容解析

(一)统计学的基本概念最基本的概念包括:总体、总体单位、标志、统计指标。如上所述,这是学好统计课的基础。例如,“总体”这个概念。毫不夸张地说,统计所有章节的内容都是围绕“总体”展开的。统计学的研究对象是大量的客观现象,特别是社会经济现象的数量方面,包括数量特征、数量关系和数量界限,目的是认识社会经济现象发展变化的规律性。而社会经济现象包罗万象,种类繁杂,包括社会的政治、经济、文化、人民生活等领域的各种现象。统计研究时需要分门别类,把他们界定为一个个客观存在的、具有某种共同性质的许多个别现象或事物组成的集合体,即统计总体。个别现象或事物就是总体单位。总体具有大量性、同质性、差异性三大特征。大量性即总体是由许多单位组成的,一个或少数单位不能形成总体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以,统计研究的对象必须包括足够多的个体。同质性即构成总体的各单位必须具有某种共同性质,这是形成总体的客观依据,也是我们确定总体范围的标准。差异性即总体的各单位除了某些方面的共同性外,在其他方面必须有差异,这些差异是统计研究的基础和前提。如果学生不理解“总体”这个概念,就不能在特定的统计研究目的下,准确地界定总体的范围,描述总体的总量指标、相对指标、平均指标就无从理解和计算,更谈不上利用这些指标进行统计推断和统计分析。

(二)平均指标这是统计课中最重要的基础性指标。平均指标用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。它反映总体分布的集中趋势。其中,算术平均数是基础的、最重要一种。明确它的计算原理和含义,就能顺理成章地掌握变异指标、抽样推断、时间数列分析、指数分析中各类指标的计算和应用。平均数的计算学生并不陌生,在小学或者初中都学过。这是学习统计平均指标的基础。但要让学生明白,他们以前学的平均数是一个抽象的量,而这里的平均数是有特定经济内容的,是具体的有空间范围、时间限制的量。学习平均指标首先要搞清分类。平均数分为两大类:静态平均数和动态平均数,这跟时间有无变化有关。计算静态平均数的每个数值都是同一时间点上的,它表示每个总体单位在某一数量标志上的平均水平。计算动态平均数的每个数值是某一个统计指标在不同时间上的取值,是表示该指标在每个时间单位上的平均水平。最常用的平均数是算术平均数,其基本公式为:算术平均数=总体标志总量总体单位总量这个指标的含义、计算原理、四个计算公式以及应用都要讲透,特别是加权算术平均数的计算和应用,对学生的要求不能停留在“会就给定的资料计算出算术平均数”这个层面,而要让学生透彻理解掌握其计算原理,并把它运用到复杂的领域。因为标准差、抽样平均误差、平均发展水平、综合指数、平均数指数、相关系数、回归分析等有关指标的计算都是以算术平均数的计算原理为基础的。

数据分析的统计学基础篇9

一、数理统计与统计学的主要特点

(一)数理统计的主要特点

数理统计就是通过对随机现象有限次的观测或试验所得数据进行归纳,找出这有限数据的内在数量规律性,并据此对整体相应现象的数量规律性做出推断或判断的一门学科。概括起来有如下几方面的特点:一是随机性,就是说数理统计的研究对象应当具有随机性,确定性现象不是数理统计所要研究的内容。二是有限性,就是说数理统计据以研究的随机现象数量表现的次数是有限的。三是数量性,即数理统计以研究随机现象的数量规律性为主,而对随机现象质的研究为次。四是采用的研究方法主要为归纳法。最后,数理统计通过对小样本的研究以达到对整体的推断都具有一定的概率可靠性。用样本推断总体误差的存在是客观的,但是数理统计不仅重在研究误差的大小,还指出误差发生的可能性的大小。

从数理统计的学科特征来看,数理统计是应用数学中最重要、最活跃的学科之一。由此可见!数理统计从学科划分来说,应属于数学学科,但是其重在应用!而不是纯数学理论或方法的研究,故其采用的方法也就重在归纳法,而不是数学的演绎法。

综上所述,数理统计的主要特点可以用一句话概括为、数理统计是一门对随机现象进行有限次的观测或试验的结果进行数量研究,并依之对总体的数量规律性做出具有一定可靠性推断的应用数学学科。(二)统计学的主要特点

统计学是一门收集、整理和分析统计数据的方法论科学,其目的在于探索数据的内在数量规律性,以达到对客观事物的科学认识。

统计学从其研究的范围来说有三大领域:数据的收集$数据的整理和数据的分析。首先,这三大领域随着统计学的不断发展,已很难分辨出哪个领域更重要些。也许有很多人认为数据的分析要相对重要些。在对1900年和1910年美国两次农业普查资料进行分析时,列宁曾指出:“全部问题,任务的全部困难在于,如何综合这些资料,才能确切地从政治上经济上说明不同种类或类型的农户的整个情况。”这足见数据整理的重要性。近年来困扰我国统计研究的并不是数据的分析方法,而是缺少充分真实有效的统计数据,造成无法用数据去检验或证实相应的经济理论、经济模型和经济政策。数据收集的重要性可见一斑。其次,统计学是一门方法论科学。长期以来,人们一直认为在这众多的方法中,统计研究的基本方法是大量观察法、统计指标法、统计分组法和模型推断法。特别是大量观察法更成为统计学最重要的基本特征方法之一,也可以说这是统计学与数理统计的根本区别之一,否则,统计学也就真的成了现代西方数理统计学了。随着统计学由早期的纯粹描述统计不断拓展为描述统计与推断统计并重,直至有的学者认为现代统计学应该以推断统计为主,描述统计为辅,暂且不论这种观点是否有不妥之处,但可足见推断统计学已在现代社会生活中起到举足轻重的作用。事实上,推断统计已成为现代统计学的基本特征之一。再次,统计学从其成为一门科学的那一天起,就把对现象数量方面的研究作为自己的基本特征,但是,同时强调要以对现象的定性认识为基础。

(三)数理统计与统计学的比较

通过上述对数理统计与统计学特点的分析,可以把数理统计与统计学的主要异同归纳为如下几方面:

1.从其研究目的来看,两者都重在揭示总体现象的数量规律性,而统计学更声称要以对总体现象的定性认识为基础。

2.从其研究的途径来看,数理统计希望通过对总体部分个体的数量特征的研究,以达到对总体相应数量特征的认识;而统计学既希望通过对构成总体的全部个体的数量特征的研究(如果可能$或值得的话),以达到对总体相应数量特征的认识,同时也希望能通过对构成总体的部分个体的数量特征的研究,以达到对总体相应数量特征的认识。

3.从其研究的手段来看,数理统计主要依赖于小样本特征值统计分布的数学原理来推断总体的相应特征值;而统计学或者说推断统计学主要依赖于大样本特征值统计分布的数学原理来推断总体的相应特征值。

4.从其研究的主要范围来看,数理统计侧重于对样本数据的定量分析;而统计学不仅重视样本数据的定量分析,而且重视对所获得的总体全部数据的定量分析,同时,重视数据收集方法、数据整理方法的研究。

5.从其利用样本数据对总体进行推断的数理机理而言,概率论是其共同的基础。特别是作为统计学基本方法之一的大量观察法,其数理基础正是概率论中的大数定律;统计学中用大样本可以方便地推断出总体特征的数理基础正是概率论中的中心极限定理,而无论是大数定律还是中心极限定理也都是数理统计的根基。

6.数理统计尽管强调应用性,但是它本身还是一门数学学科,重在应用方法的数理基础的研究;统计学更侧重于对解决社会、经济等现实问题数量分析方法的研究与应用,而方法本身的数理基础的科学性研究,则由相应的理论统计学去研究,事实上,推断统计方法的数理基础的科学性研究,正是数理统计的研究范畴之一。

从上述数理统计与统计学的特点及其比较,可以清楚地看到,随着现代统计学的发展及其在社会政治经济生活中发挥作用越来越大的趋势,数理统计研究问题的理念及其方法已对统计学的发展产生重要的革命性影响,但是,数理统计与统计学毕竟是两门差异较大的学科,不可能简单地加以“统一”。

二、数理统计在统计学中的地位

数理统计与统计学是两门不同的学科,不可相互取代,也不可能像多年来有些学者提出的那样,要建立所谓的大统计,或者说融合统计学,其实质就是要把数理统计与统计学融合起来。但是其融合的直接后果就是现在某些高校所使用的统计学教材中,既有统计学的内容,也有数理统计的成分,不伦不类,细读之,其实就是数理统计的内容与统计学内容的简单拼接。这不能不说是近年来,中国统计学、统计学教材、统计教学的一大悲哀:迷失了自我,盲目地要“与西方接轨”。笔者认为要想理顺数理统计与统计学的关系,就必须对数理统计在统计学中的地位加以深入的研究。

(一)数理统计在统计思想发展中的地位

统计作为一项社会实践活动,已有几千年的历史。“统而计之”,就是人们对统计的朴素认识。随着社会生产力的不断进步,当代的统计已不圄于“统而计之”的范畴。

1.统计作为人们认识社会的最有力的武器之一,已广泛应用于社会、政治、经济、科技等众多领域,而每一个领域有其复杂多样性,若采用简单地“统”,即全面调查几乎是不可能的,但是全面地了解每一个领域的基本情况及不同领域之间的数量联系的规律性,又为现代社会管理所必需。数理统计研究问题的思路和方法,自然而然地为统计学所利用,即数理统计为现代统计学的发展点燃了解决复杂现实问题的科学思想火花——为用总体的部分去说明总体奠定了数理基础。

2.20世纪30年代以来,随着政府要有效地干预国民经济理念的形成,政府以社会经济生活直接参与者的身份出现,基于对全局数据的掌握,大大地推动了统计思想的发展,不仅投入了大量的资金对统计这支“武器”进行开发,更重要的是从立法的角度对统计行为进行规范。在当今许多国家的统计法规中,都明确地规定抽样调查在统计调查中的重要地位。比如,在我国1996年5月经修改后颁布并实施的《中华人民共和国统计法》第二章第十条就明确规定:“统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,收集、整理基本统计资料”。而抽样调查的基本原理就基于数理统计的推断原理。可见,数理统计的推断理念在统计实践中的地位已用法律的形式确定下来。

3.作为社会经济活动主体的企业单位,在世界经济全球化、区域经济一体化的发展背景下,不仅没有足够的资金、技术支持从事某一方面的全面调查,有时也没有必要通过全面调查以获得生产经营方面的全面数据资料,而抽样调查就足以提供相应可靠的数据作为企业生产经营决策的依据。这也说明数理统计有着微观的现实需要,为微观经济管理活动开辟了无限广阔的前景。在微观统计应用中有着坚实的思想根基。

4.统计的理念,已不仅仅在于用历史数据描述历史的发展特征,而当代更强调通过对历史数据的收集、整理和分析,去预测未来,而这种预测的基础同样基于数理统计的原理。即从历史的时序数据中找出数据的内在数量规律性,以把握未来的走向,即数理统计的分析原理在时间序列数据预测中的作用,同样功不可没。

(二)数理统计在统计方法中的地位

随着数理统计解决现实问题的理念在统计思想中地位的确立,数理统计在统计方法中的重要地位也相应地得以确立。

1.大数定律为数理统计应用于统计学搭起了连接的纽带。大量观察法是现代统计学的基本方法之一,而大数定律又是大量观察法的基础。统计学若没有大量观察法的支撑,则统计分析中的基本指标——平均数与相对数,则失去其应有的作用和意义,可见数理统计在统计方法中的基础地位不容置疑。

2.中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明+只要样本容量足够地大,得自未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。

3.数理统计中样本抽样分布的理论,为现代统计学中的方差分析、正交设计等方法的应用同样提供了方法上的理论保证。特别是正交设计在现实工农业生产中的作用,及其对经济的贡献已引起国外学者的高度关注。据日本某些专家估计:“(日本)经济发展中至少有10%的功劳归于正交设计。”这足见数理统计的方法在统计方法中应用的现实意义。

(三)数理统计在统计内容中的地位

统计学是一门关于如何收集、整理和分析统计数据的一门方法论科学。不管数理统计对统计思想的发展有多大的影响,也不管数理统计在统计方法中居于何种地位,数理统计在统计学中的地位还是主要体现在统计分析中的地位。数理统计对数据的收集方法与整理方法的实际影响要比其对统计数据分析方法的影响小得多。也就是说,统计学作为一门方法论科学,其研究领域要比数理统计宽广得多。试图用数理统计取代统计学的观点显然是不正确的,同样试图用大统计学取代数理统计的观点也不正确,毕竟数理统计作为一门数学学科有其自身的不可替代的特点。因此,数理统计在统计内容中的地位,也只能主要体现在统计分析方面。

1.统计数据收集方法的研究仍然是现代统计学的主要内容之一。正如前所述,在我国现阶段如何获得大量真实有效的统计数据,是我们所面临的迫切任务之一。不真实、不全面的统计数据,使国家的宏观管理"经济理论’经济模型和经济政策的统计检验,以及企业的生产经营预测、决策,都不能有效地进行。可见,“统计数据的质量是统计全部工作的生命”的观点的正确性。而数理统计在统计数据收集方面的影响仅体现在统计数据调查方式方法方面,即抽样调查如何组织实施的方式方法,在统计数据收集方法中得以突出和强调。

2.相同的原始统计数据,采用不同的整理方法所获得的整理资料可以完全不同,并由此对其采用相同的方法进行分析所得的结论,可能完全相反。这足以说明统计整理的重要性。但是数理统计在统计整理方面却难以发挥有效的作用,毕竟,数理统计研究的依据是小样本,而统计学研究的依据的是大样本。假如统计学不是以大样本或总体的全部个体为研究依据,统计学也许就真的沦为数理统计了。

3.数理统计对统计数据分析方法的影响是显著的。不仅体现在对大样本总体参数估计、非参数估计、相关与回归分析、总体分布型态的判断、一个总体参数与两个总体参数的假设检验、方差分析和正交设计等许多内容上,而且体现在描述统计学中最基本指标:平均数、相对数的计算原理等方面。也许真不可想象,若在现代统计方法的内容体系中缺少了数理统计的关于大样本的分析方法原理,将是怎样一种景象。

三、统计学传播理念的转变

对数理统计与统计学的特点作了比较研究,以及对数理统计在统计学中的地位作了分析之后,让我们再回到统计学知识传播的现实实践中来,可以更清楚地看到我们现在正在做什么、在哪些方面还需要改进、今后该怎样把工作做得更好。

(一)统计学知识传播理念的转变主要体现在如下三个方面:

1.统计是什么。这是对统计的最基本的认识,可以通过加强对统计知识的宣传达到。在现代统计工作中,尽管“统而计之”仍有非常重要的现实意义,但是在我们的统计学教学与其它途径的统计知识的传播中,绝不能仅限于此。不仅要让不同阶层的人,认识到统计对现实社会生活的巨大认识作用,而且要让他们了解统计在国家宏观管理、企业经营预测、决策,以及对经济理论#经济模型、经济政策检验中的重要性,从而使各个阶层的人民群众自觉地参与和配合各级统计机构所开展的统计调查活动,以保证统计数据的真实完整。这就要求我国必须加强统计知识普及教育及统计法规的宣传教育!开辟多途径多手段的统计知识传播途径。这是统计学传播的基础理念。

2.统计为什么,即让统计活动的直接参与者懂得为什么要这样做。显然,这是对统计学传播的较高层次要求。知道为什么要这样做!即要知道统计的原理,这并不需要所有的公民都知晓。事实上,只能是具有一定知识基础的人才可能真正理解,且其途径主要是通过高等学校的统计教学活动。由此就对高校的统计学教学理念提出了挑战:统计学课堂上应向学生教授什么。笔者从事高校统计学教学多年,认为高校统计学课堂上应向学生解释统计方法的原理。高校统计学教学课堂不应过分地强调对统计知识的宣传和如何具体地从事统计活动,而应强调重视统计方法机理教学的传播理念,但这在我国现实的高校统计学教学中并没有真正地形成。

3.怎么做统计,这是统计方法具体应用的问题。可以说当前我国高校统计学教学实质上就是教会学生如何做实际统计工作。如何收集、整理数据,如何用公式去计算某些指标等。显然,这样的工作中学生就可以胜任。而真正为什么要那样组织实施数据的调查、整理,为什么要那样计算。不仅老师介绍的不够!而且教材编写的深度也不够。

由此可见,统计知识的传播理念应大致界定在三个层面上:一是统计基本常识的传播。二是如何开展具体的统计活动。三是为什么那样开展统计活动可以达到预期的目的。不同层面的传播对象是有差别的。知道统计是什么、怎么做统计,相对于懂得为什么要那样做统计,其要求是相当低的。也许只要会记数、会写字的居委会大妈,就可以从事数据的收集工作,而会套用公式的一个中学生就可以计算服从X*2分布的统计量的样本数值。而知道为什么要这样做,没有相应的数理统计知识是万万不行的。另一方面,随着计算机的普及及统计数据处理软件的开发,利用计算机对数据进行分析已变得异常简单,甚至一个孩童都可以教会使用统计处理软件,在这种情况下。是否让学生懂得统计为什么就变得不重要了呢?正相反,在统计学的高校课堂上让学生懂得为什么就更重要了。

四、我国统计学教材改革的方向

从对统计学传播理念的不同层次的要求,及数理统计在统计学中的地位和学生的知识结构来看,改革现行高校统计学教材内容体系及教学理念势在必行。

1.去除现行统计学教材中与数理统计相重复的内容,加强关于大样本的数理统计内容,即增加大样本统计分布的数理基础的内容。

2.强调大数定律及中心极限定理内容的教学。尽管这两个定理是纯数理统计的问题,但由于其在数理统计的教学中,教师通常重视不够,因为小样本问题才是数理统计研究的主要问题,因此,可能一带而过,而它们恰恰是联系数理统计与统计学的重要纽带。因此,在统计学教材中必须增加并突出其内容。

数据分析的统计学基础篇10

问题:课堂中的各种理解不到位的现象

场景1:有教师在课堂上出示用左耳或右耳接听电话的人数统计,要求学生计算相应的比例。这种数据于学生而言缺乏实际意义,统计的结果也不涉及相关处理问题,反映出教师对数据的理解不到位。

场景2:教学中,教师给出一些商品的单价,要求学生统计单价超过5元的商品。统计的缘由没有给出,不过是单纯的筛选技能训练,没有体现统计的必要性及其意义,反映出教师对统计概念的理解不到位。

场景3:教师提供多种饮料,如绿茶、红茶、奶茶、可乐等,要求学生从中选择自己最喜欢喝的三种,再根据全班的选择情况整理数据,列出最受班级欢迎的三种饮料。最后,教师给出专家建议“健康的饮品包括水、纯果汁、奶”,要求学生结合课堂统计的数据结果,在调查报告中表达自己对中学生选择饮料问题的看法和观点。由于此三种饮品没有完全出现在此前供学生选择的范围内,自然没有一个学生的选择与专家建议的健康饮品吻合,于是,学生回答,“不管喝什么,只要健康就好”。数据统计的目的就是为分析、决策提供数据支持,而该场景中数据分析部分与前面的统计结果相互脱节、没有关联,或者联系不够紧密,反映出教师对分析的理解不到位。

上述场景反映出的根本问题是,教师对数据统计与分析的内涵或者核心指向理解不足。“数据统计与分析”属于“信息加工与表达”中表格信息加工与表达部分的教学内容,与数据管理部分的内容具有相似的核心指向,即关注“关系”的挖掘与表达,而关系是隐藏在数据之中的,需要通过相关的操作,如借助公式与函数的计算、排序、筛选等,将数据间的关系挖掘出来,可以借助图表的形式进行直观表达,即通过可视化方式清晰展示。

关于数据统计与分析,信息技术课程教学纲要或者课程标准中都有针对性的要求,譬如,2012年中国教育技术协会信息技术教育专业委员会研制的《基础教育信息技术课程标准2012版》中,初中学段在“模块二:信息加工与表达”中对表格部分的要求如下。

1.能列举1~2种常见表格编辑软件,尝试简单编辑操作,理解二维表格的共同特征。

2.根据需求能在文档中绘制或套用表格,并对其属性能按要求进行调整和设置。

3.能应用电子表格进行简单数据的统计、处理,科学地借助折线图、直方图、饼图等直观表达数据。

4.从不同的角度和立场出发,通过对相同数据做不同的加工,表达不同的观点,或对相同数据做不同的解读,感悟信息加工和利用的选择性、多元性和复杂性特征。

上述4条描述涉及表格中数据的统计、表达、分析,关注到数据间的关系挖掘。

“数据统计与分析”涉及对数据的加工、处理,从中获取信息并加以解读。因此,可以从DiKw金字塔模型获得直接的借鉴。

解决之策:DiKw金字塔的启示

DiKw金字塔是关于数据、信息、知识及智慧的体系,如图1所示。

图1DiKw金字塔

数据(Data):可以是数字、文字、图像、声音、符号等,属于事实的记录,表达的是没有指定背景和意义的描述。

信息(information):是经过相关处理的数据,强调的是数据与数据之间的关系。

知识(Knowledge):是有意义的信息,表现为信息和信息之间的关系。由信息到知识的转变过程,是一个对信息判断和确认的过程,需要结合经验、上下文联系、诠释和反省。

智慧(wisdom):是富有洞察力的知识,是运用知识分析和解决问题的能力,可以简单归纳为正确判断和决定的能力。

显然,DiKw体系同样关注关系的挖掘,即数据之间的关系、信息之间的关系,因而可以用来指导“数据统计与分析”部分的教学。

从问题解答的角度观察,信息层回答的是“是何”的问题,知识层解决的是“如何”的问题,智慧层则涉及“为何”的问题。早期研究中有学者曾指出,信息技术中的技术包含三层内涵:(1)动手做的技术,即基本技能;(2)如何做的技术,即设计和规划的技术;(3)为何做的技术,即技术的思想和价值。[1]三层内涵的观点涉及技术是何、如何、为何的问题,与DiKw模型具有共通之处,这为DiKw模型在数据统计与分析中的应用提供了佐证。

从DiKw的视角来看,数据统计与分析的过程也是追求实现“数据—信息—知识—智慧”持续变化的过程。即从数据开始,以形成智慧为最终目的。具体过程是:借助相关操作对数据进行处理、加工,明确数据之间的关系,提取出有意义的信息,进而将信息组织成知识,促进学生明确“如何去使用”,再进一步,当学生明确应该何时使用及为什么要使用时,便形成了智慧。据此,数据统计与分析中的几个关键词,即数据、统计、分析,都需要有专门的指向,符合内在的规定性,且数据、统计、分析应当做到前面环节为后续环节奠定基础,后续环节又必须在前面环节的基础上展开。具体来说,数据需要为统计服务,统计是建立在数据提供的基础上;统计的结果是为了进行分析,分析必须依赖于统计结果;分析的目的是为了提供决策的依据。这些关系必须在教学中予以体现,方能体现数据统计与分析的要义。

实践之道:基于DiKw的教学思路

从DiKw的视角,数据统计与分析教学需要经过三个过程:“数据信息”、“信息知识”、“知识智慧”。从关系发掘的角度,即隐性关系显性化、显性关系知识化、知识运用自动化,下文展开具体阐述。

1.隐性关系显性化

隐性关系显性化,即从数据到信息的过程。数据可以是教师为学生提供的原始资料,或者是收集来自学生的资料。因为需要借此学习相关技能操作,如公式与函数的使用、排序、筛选、图表表示等,因此数据主要是数字形式,如考试成绩、购物费用等,根据需要也可以适当包含文字,如学生的血型、爱好等。

为了从数据中提取有意义的信息进而展开分析,数据需要符合一定的要求:其一,数据最好能够贴近学生,具有真实性。小至与学生个体相关的数据,大至与学校、社区、城市、国家相关的数据。贴近学生生活经验或学习经验的真实数据才能激发学生的兴趣,促进学生通过操作发掘数据之间的关系,形成有意义的信息。从教学实践来看,课堂或者课前收集来自学生的鲜活数据相对容易调动学生的积极性。其二,数据需要具有潜在的意义,即有统计价值,场景1中接听电话用左耳还是右耳的例子之所以失败,就是因为数据不具有统计价值,从数据中无法提取出有意义的信息。其三,数据要具有统计的必要,即数据要达到足够的量,少量数据往往无法体现出用计算机统计的优势。在数据量足够的情况下,可以通过人工计算与计算机统计的对比凸显计算机统计的优势和价值。

在数据有效的基础上,统计承担着从数据中提取信息的功能。为了保证将来从信息到知识的转变,统计所得信息当存在分析的可能、必要及价值,否则统计本身就没有意义。譬如,场景2中让学生统计购买的商品中单价超过5元的商品,数据本身没有问题,但这种统计的结果似乎没有分析的意义及价值,因而统计本身就失去了意义。

从数据到信息的转变需要学生借助一定的技术操作来实现,这个阶段涉及的技术属于动手做的技术,即技术的底层。例如,统计过程可能涉及计算、筛选、排序,统计结果的呈现涉及各种图表的使用。

2.显性关系知识化

显性关系知识化,是指由信息到知识的转变。美国佛罗里达国际大学豪恩斯坦认为,信息是别人内化的知识,知识是自己内化的信息。[2]所以,如果信息是输入,知识在某种意义上便是输出。这意味着从信息到知识的转变需要学生在认知层面形成理解。这一阶段涉及的技术属于无形的技术。

此阶段是对数据统计结果进行分析的过程。譬如,统计全班学生血型,根据四种血型的统计结果,引导学生明确血型的相关知识。又如,统计不同品牌货物销售情况,从不同角度(商场、品牌负责人、顾客)去分析,得出不同的结论。若收集的数据与学生个人或家庭相关,则分析的结果最好能够凸显因人而异,从而促进学生在体验到分析意义的基础上,树立利用数据统计与分析为自己的学习、生活服务的意识。

譬如,《excel中数据的处理》[3]中,教师要求学生将自己家庭衣、食、住、行、用等数据输入到碳排放计算工作表中,完成相关计算,并根据数据回答问题:

1.我们家()方面碳排放最高,()方面碳排放最低。

2.我们家年人均碳排放()kg,和全球人均目标碳足迹2000kg比较,我们家是(高碳/低碳)生活。

3.为了应对气候变化,我们家应该从以下方面减少碳的排放。

每个学生获取的数据不同,结论自然就不同。这种差异性体现了一种真实,也帮助学生理解统计与分析的实际意义。

分析在统计与决策之间发挥着承先启后的作用,“承先”是指,分析必须依据统计所得结果来进行,体现两者的紧密联系,以保证分析的价值及统计的意义;“启后”是指,分析需要为后面的选择、决策提供依据与基础,因此需要恰当设计分析的内容,以保证决策得以进行。

譬如,《excel中数据的处理》中1、2两个问题的分析必须建立在前面数据计算的基础之上,3题的回答又依赖于1、2分析的结果,充分体现出统计分析为决策提供数据支持的功能,促进学生对数据统计分析加深认识与理解。

3.知识运用自动化

知识运用自动化,即从知识向智慧的转变过程,是指在学生掌握知识之后,借助一定量的知识应用练习,熟悉了知识的应用环境及方法之后,在不需要专门选择知识的情况下无意识地运用知识,达到自动化效果的过程。这一过程显然不是一蹴而就的,需要经历几个状态:在知识应用练习之前,处于“无意识的不用”状态;经过知识应用训练,基本掌握了知识应用场合及方法,但还不够熟练,遇到问题时,需要有意识地思考选择相应的知识,该阶段可以称为“有意识的应用”状态;经过足够的知识应用练习之后,学生对知识的应用形成更深的感悟,可以在无意识中,即自动选择某种知识应用于问题解决中,此时就进入了“无意识的应用”状态,达到此状态,即完成了由掌握知识到生成智慧的转变。

具体到数据统计与分析的教学中,就是根据分析结果进行选择或决策的过程。智慧指向正确判断和决定的能力,因而在数据统计与分析后期,需要引导学生依据分析的结果进行选择、决策。智慧倾向关心未来,含有暗示及滞后影响的意味,与此类似,课堂上的选择抑或决策只能更多发生于认知层面,形成的是决策时的心理倾向,但追求的是持续影响学生并实现将来在现实情境中的外显行为的变化。因而,知识运用自动化在一次课内未必能够实现。

同数据分析类似,决策可以因人而异。譬如,《excel中数据的处理》中的问题3。教学中需要引导学生根据实际做出符合需求的决策。譬如,《excel综合运用》[4]案例中,教师课前安排学生对自己居住小区的人居环境从自然、人文、社会、建筑和支持网络几个方面进行评价,课堂上则围绕用excel软件对若干个小区的人居环境状况作系统的分析,涉及excel数据加工技术的综合应用,如排序、筛选、分类汇总等,然后得出结论,哪个区的人居环境综合比较好。最后环节是引导学生的实际应用:

是不是××区的人居环境比较好,我们都要住在那个区?在选购住所的时候,首先应该考虑自己的需求,根据实际需要确定自己的选择。

(1)假如你是一名在南京一中读高一的学生。

需考虑因素:你的父母希望你上学路途中花费的时间比较少,小区居民的整体文化素质比较高。

(2)假如你的爷爷奶奶退休了,考虑给他们选择一处房屋。

需考虑因素:空气新鲜,小区休闲设施齐全,邻里关系和睦,靠近你家现在的住处,方便照顾老人。

该案例是在对真实数据进行统计的基础上,通过分析引导学生明确如何选择、为什么要如此选择,关注学生在掌握知识的前提下生成智慧。学会选择,这就是智慧,影响着将来的选择行为,即根据实际需求进行选择,其实不仅是小区的选择,也包括人生中的其他选择。

知识运用自动化阶段的教学要求:其一,必须为学生提供需要决策的情境,以促进学生在类似情境下的顺利迁移。这一点需要在数据呈现的同时即提供给学生,以促进学生明确数据处理的根本目的。其二,决策需要根据分析的结果来进行,让学生充分体会到分析的目的及价值,即为决策提供依据。

按照上述隐性关系显性化—显性关系知识化—知识运用自动化的思路,教学中引领学生经历数据的收集、整理—处理、加工—分析、表达—选择、决策这一完整过程,促进学生对数据处理形成整体感知与理解。

数据统计与分析的完整过程是从数据收集与录入开始,经过表格规划与修饰、数据处理与统计、图表与分析等,因此,未必在一节课内完成,但整个部分的教学经历完整过程即可。也可以在综合应用或者复习课上,带领学生经历此完整过程,为了在一节课内实现,可以简化部分细节,如使用半成品策略,以凸显整个流程。

结束语

从DiKw金字塔模型的视角观察“数据统计与分析”的教学,意义在于:明确数据统计与分析的教学不能止步于简单的数据收集、整理、加工,其意义主要体现于在此基础上的分析及进一步的决策。即教学中在由数据到信息的转化基础上,关注显性关系的知识化并追求知识运用的自动化。

显然,DiKw模型也适用于信息技术课程中的其他内容,譬如DiKw体系经常应用于信息科学,因此可以应用于搜索技巧及数据挖掘。

注:本文为江苏省教育科学“十二五”规划课题“信息技术课程思想及其应用研究”(B-b/2013/01/039)的研究成果。

参考文献

[1]李艺.高中课改实验进行时[J].中小学信息技术教育,2005(1).

[2]盛群力.21世纪教育目标新分类[m].杭州:浙江教育出版社,2008:67.

[3]张向红.excel中数据的处理.2010年全国初中信息技术优质课大赛一等奖.