首页范文数据统计分析学习十篇数据统计分析学习十篇

数据统计分析学习十篇

发布时间:2024-04-29 11:24:32

数据统计分析学习篇1

关键词:高职教育;个性化学习;数据挖掘;商业智能

中图分类号:tp311.13

作为我国高等教育一支重要生力军――高等职业教育近几年来的发展可谓迅猛,无论是学校数还是学生人数,高职专科的规模已是我国高等教育的半壁江山。高职教育对人才的培养目标是为国家和地方经济的发展输送适应生产、建设服务等一线急需的应用型高素质人才,《国务院关于大力发展职业教育的决定》中就提出了“坚持以就业为导向,深化职业教育教学改革”,要求加强职业院校对学生实践能力和职业技能的培养。

1现状

目前,高职学生在学校完成系统的课程学习依然是高职教育教学的主要方式,在此过程中,由于学生个体特性、就业意向、专业方向等各种因素的影响,获取的知识无论从方式方法、内容结构,还是真正掌握的程度来说都因人而异,而这其中有相当大的部分是学生主动性选择的结果;此外,在高职教育教学改革的尝试中,大类招生、拓展专业等多项措施在很多职业院校中已然试行,这就给予学生更多的自和选择的机会。

然而,在自主选择的过程中,由于没有一个可参照的、适合自己的挑选标准,高职学生进行各项选择时在很大程度上有着“扎堆随大流”、“哪个课能混好过”的心理,这就导致主动选择的课程,其学习过程并不顺畅、学习效果也不理想,没有提升自身知识结构的质量。这种高职教育中教与学环节的脱节会对高职学生的能力培养产生有着不可忽视的影响。

2研究思路

随着教育信息化的深入发展,先进的信息技术手段在教育教学的方方面面都得以有效利用,这也为学生综合能力培养的探索与尝试提供了新的途径,数据挖掘技术就是其中很重要的一种。数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在此过程中,数据源必须是真实的、大量的、含噪声的,而从中发现的是用户所感兴趣的知识内容,这些知识应该是可以接受和理解、并且能加以进一步运用的。

数据挖掘技术之所以在教育行业有更为广泛、实际的应用,这是由于各个学校都会有自己的一整套数据库系统,用于记录学生的学籍信息、课程教学过程等历史数据,这样,就可以尝试运用先进的数据挖掘技术和智能分析工具,通过对高职教育研究和教学过程中积累的海量数据进行采集分类、挖掘和分析,从多角度、多层次出发,构建识别个体特点、知识构成和获取方式等要素之间关联模式的数据模型。数据挖掘是一门交叉学科,其理论和方法有很多,包括K-最近邻分类器、判别分析、人工神经网络和分类树等,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这里就是要将数据挖掘方法与高职教育教学研究相结合,设计实际的分析应用系统,具体来说:

(1)数据挖掘技术面向高职教育这一特定领域中的主体――高职学生,针对专门的指标,包括个体特性、专业要求、就业意向等,着眼于课程这个知识载体,对它们之间的关系进行深层次、智能化的挖掘、分析;

(2)数据挖掘的应用会具体到建模、变量筛选和导入等方面,而不只是一些抽象的挖掘算法的研究;

(3)数据分析采用先进的商业智能工具,同样,数据的展现手段基于平台,具有开放化、模块化、网络化特点。

3系统框架

系统定位于个性化学习分析,其框架结构参见图1,主要由数据集成、数据建模、数据分析及展现等部分构成。具体来说,数据集成模块完成定义数据结构、装载、清洗、合并数据的功能;数据建模是指建立数据分析oLap及数据挖掘模型;数据分析旨在分析和比较各种不同算法得出的结果,寻找最为匹配的算法,而数据展现的作用是根据分析结构灵活创建数据报告。

图1系统框架结构

在此架构下,各个子系统的功能如下所述:

(1)数据集成。分析和归纳课程教学过程中产生的系列数据,根据其特征和行为设计及定义便于分析和挖掘的数据结构,然后并进行数据集成。数据集成的工作包括从异构数据源获取数据,将其进行清洗、转换、合并,然后加载到数据仓储中。数据集成执行的时间、相互的顺序、成败对将来的分析结果的有效性则至关重要。

(2)数据建模。典型的数据挖掘工具将在构建了数据仓库后进行分析并生成结果,一些工具也可以使用关系型数据进行分析,数据分析的结果独立于数据仓库中使用的数据。数据挖掘核心的部分就是选择挖掘算法并建立数据模型,这样就可以根据学生个体信息、学生成绩等数据之间的关系将这些学生划分成分析有意义的组群并预测他们的行为;当把这些组发送回分析过程时,数据挖掘引擎允许分析人员和用户根据这些簇进行划分和细化。

(3)数据分析与展示。以学生个体信息和课程数据为输入,利用所筛选出的最佳建模方法,逐步提出一个可实现个性化学习分析的数据模型,以衡量及提高模型预测的准确度。将分析结果以特定的客户端或web方式进行展现,以建立的分析结果展示平台,具有高度的开放性、通用性和可扩展性。通过建模创建了正确的模型,数据挖掘的重点就从分析转到结果上,数据报告的展现方式有多种,可通过专业的报告工具,也可自行编写web网站进行。

4结束语

在高职教育教学研究中运用先进的数据挖掘技术手段,针对各项课程教学、学生管理数据进行深度挖掘、分析,研究个性化学习模式,为学生的自我学习规划提供具体化、智能化分析结果以供参照,在此情况下,先进技术手段的支持,对教与学都有着不可忽视的影响。同时,也为人才培养的探索与尝试提供新途径。

参考文献:

[1]赵云鹏,石丽,刘莹.基于数据挖掘的高校规模分析及应用研究.第九届全国信息获取与处理学术会议论文集[C].2011.

[2].数据挖掘在高职院校教学管理中的应用[J].清远职业技术学院学报,2010(12).

[3]干娟.基于决策树算法的学生综合测评系统的设计[J].安徽电子信息职业技术学院学报,2011(04).

数据统计分析学习篇2

【关键词】计算机成绩数据分析

面对数据庞大、凌乱的计算机考试成绩,需要通过科学的手段进行成绩的统计、分析。再结合合理的计算机编程进行直观的、科学的计算机成绩评价,以便为计算机教学提供更直观、更准确、更科学的教学参考依据。

1计算机考试成绩数据分析的必要性

考试成绩的数据分析目的在于通过对考试成绩的数据分析,挖掘这些数据中的潜在信息,探索其内在联系及考试问题根源,提高学生的学习效果和老师的教学质量。在计算机考试中利用数据分析对成绩进行评价是很有必要的。第一,计算机考试中成绩数据繁重、复杂,计算机强大的处理功能和运算功能减少了成绩统计中的失误,确保了成绩统计的正确性、准确性。第二,计算机考试中由于考生能力、主观意识等方面的差异,卷面分数(原始分数)凌乱,难以进行教学与学习研究。需要借助数据分析实现对计算机教学效果的客观认识,以便纠正学生学习中的不足,促进教师计算机教学的改革。第三,数据分析将计算机考试中相对孤立的成绩统一起来,提高了成绩信息的利用、挖掘,有利于对成绩中隐藏信息的发现,促进了计算机教学改革的科学发展。

2关于考试成绩的数据分析理论

2.1原始分数据的转化

原始分就是指考试者未经任何处理的卷面分数。一般情况下分散、杂乱,不利于教学中对整体成绩的分析、研究,看不出计算机教学或考生计算机能力的整体发展趋势。原始分数据转化就是将考生的卷面成绩转化为标准分(将孤立的成绩转化为一种地位量数),以便为学习研究和教学研究提供支持。在转化过程中,考生的成绩排位不受考题的难以程度和原始分数高低影响。例一:比如四百个人参加计算机考试,a的成绩是85分,此次考试题目较容易,在四百人中a成绩的地位处于中间档次。同样,四百个人参加计算机考试,a的成绩是62分,此次考试题目较难,在四百人中a成绩的地位仍处于中间档次。那么两次考试a的标准分地位是一样的,表明了a的计算机学习很稳定、教师的计算机教学对于a无太大改变。

2.2分数增值数据的生成

分数增值显而易见就是学生成绩的增加分值,主要应用在学生计算机学习进步的程度的评价。在操作中,先对学生的原始分进行统计,输入一个分数值。在对学习一段时间后(接受教师教育一段时间后)的成绩进行统计,得到一个输出值。最后结合输入值和输出值的差异评价学生的学习和教师教学的效果。

综上所述:第一,分数增值是依托原有的基础成绩进行和现有成绩的比较实现的。第二,分数增值需借助计算机强大的统计功能和处理功能才能实现,并确保了增值评价的效率。第三,分数增值更关注学生的成绩变化而非分数本身,确保了对学生学习、教师教学评价的科学性、公正性。

2.3其他数据分析理论

除上述数据统计理论以外,还有一些计算机考试成绩的数据分析理论。如结合题型对学生各题型的成绩进行统计,利用统计数据的比较、分析研究探索学生学习中存在的问题以及教师教学中的不足。总之,考试成绩的数据分析理论就是依托计算机强大的数据统计、处理功能,实现对学生学习评价、教师教学评价的更科学、更公正,以促进教学活动水平的提高。

3计算机考试成绩的数据分析

在计算机考试中进行考试成绩的数据分析,其目的也是为了实现教学效果评价的更科学、更公正。第一,标准分数据的应用。一方面标准分数据的应用更直观的反应了学生计算机学习在总体中的地位。如该生的地位量数超过了80%的同学,说明他的学习比较优异。反之有80%的同学超过了他,那么就需要对他的学习方法、学习态度等进行分析、思考。另一方面标准分数据的应用客观的反应了学生计算机学习的状况。如例一中,不能因为学生卷面成绩的下滑或提高武断的评价学生的学习和老师的教学。而应结合标准分的地位量数客观评价。此外,标准分数值的应用还清晰的反应了个人或某个集体(班级、学校等)计算机成绩的变化情况,以便教师进行对比教学。第二,分数增值数据的应用。首先,学生个体与总体增值分析可以直观的反应学生的成绩进步状况,有助于学生对自己计算机学习的客观认识。其次,某个集体(班级、学校等)计算机增值的比较,可以使教师清楚的看到自己教学的优势与不足,以便结合学生接受能力、学习能力进行一些合理的、适当的教学改革,促进计算机教学水平的提高。第三,计算机考试成绩的数据分析应用,目的在于及时的、广泛的发现计算机教学中的问题及潜在问题。通过教学方式、方法的改进,学生学习习惯、学习方式的改进等解决这些问题,提高计算机教学的质量。其过程就是以原始分为基础,进行相关孤立的成绩信息的整理、联系和比较,实现了计算机教学评价的直观、科学、公正,确保了计算机教学改革的有效性,提高了学校计算机教学特色的发展。

4结语

计算机考试只是检测计算机教学的一种手段,计算机考试成绩的高低与考题的难易程度等有很大关系,不能直接的、客观的反应计算机的教学水平。计算机考试成绩的数据分析理论为计算机教学评价提供了科学的、公正的评价途径,对改善学习计算机学习效果、提高计算机教学改革的有效性有积极的意义。

参考文献

[1]魏零,肖丹凤,基于excel数据分析处理功能统计学生成绩[J].考试周刊,2013(34):124-125.

[2]姚徐,数据挖掘在计算机等级考试中的应用[J].计算机光盘软件与应用,2013(01):55-56.

[3]张庆丰,王峰.探索性数据分析方法在成绩分析中的应用[J].安阳工学院学报,2011(04):102-103.

数据统计分析学习篇3

(华东理工大学,上海200237)

摘要:在现有成绩分析的基础上,分析目前成绩分析的不足之处,阐述运用相关统计学知识和相关统计软件深入发掘数据和分析,探究影响成绩的真正内因,完善考试分析,为教学管理者提供科学、可靠的有效信息,提高对教学管理的指导作用。

关键词:成绩分析;统计函数;spss;excel

中图分类号:G640文献标识码:a文章编号:1002-4107(2015)09-0061-03

收稿日期:2014-12-24

作者简介:顾艳燕(1978—),女,上海人,华东理工大学教务处七级职员,主要从事教育经济与管理研究。

基金项目:华东理工大学2013年校级教改项目“完善成绩分析对教学管理的指导作用”(YX0226207)

成绩是检验学生在经过一段学习之后对学习内容的掌握程度的标准,也是教学工作者衡量自己教学工作实施情况的标准之一,更是教学管理者分析教学质量、改革教风学风的主要信息依据,因此每个学期的成绩统计分析工作在教学管理中显得尤为重要。本文旨在在目前管理系统无法满足分析统计需求的情况下,利用eXCeL和SpSS强大的统计功能,拓展考试分析的深度和广度,达到弥补目前考试分析只计算无分析的不足,提高考试分析有效信息的参考价值。

一、成绩分析现状

目前,华东理工大学成绩分析主要体现为每学期结束后编制的期终考试小结,通过对不同单位的不及格率进行计算,让教学者、管理者从不同角度了解考试的整体状况,了解各个年级、学院、系的学生学习效果。但是随着教学改革的深入,教风学风的提倡,考试小结也因越来越不能满足教学管理需求而逐渐显露出弊端,主要表现在以下两方面。

(一)内容单一

目前考试小结内容包括考试的基本情况概括,各个年级、学院、系的不及格率,主要课程的不及格率,部分大面积课程情况等,缺乏对统计结果的进一步探究,没有进一步探究影响不及格率的内在原因。

(二)统计手段简单

首先,考试小结采用的计算公式是:不及格率=不及格人数/总人数,该公式不能真实、客观地反映学生的学习能力,无法实现班级之间的有效比较;其次,除了简单的表格之外,并无其他分析工具,因而不能很好地直观反映出各类指标的走向趋势、分布状态等。

二、完善成绩分析的措施

针对现有成绩分析的不足,理清思路,从整体到局部进行补充和修正分析方法。

(一)理清专业类别,增加数据的可比性

目前学校编制的考试小结并没有考虑专业的差别性,统计分析没有对专业大类进行区分,而是把文商和理工专业作为一个整体进行不及格率排名,缺乏一定的合理性。由于文商类和理工类专业在学习方法、学习内容、学习要求等方面有所差异,将每个专业在各自的专业类别中进行系别不及格率比较,显得更为合理,数据比较更合乎规则。见图1。

(二)采用“不及格人次”作为不及格率计算基数

目前考试小结中关于各类不及格率计算公式是:不及格人数/总人数。这一计算公式的缺陷是,当出现两个相同不及格率的班级或者系时,无法判断这两个班级或者系的学生学习能力差距。如表1中,两系不及格人数按照“一门不及格人数”、“二门不及格人数”、“三门不及格人数”、“四门及以上不及格人数”四个等级进行分类,四个等级代表的学生学习能力也是递减的。两系按照不及格人数计算得出的不及格率均为32.6%,说明两系不及格人数所占比例相同,但是否意味着两系学生学习水平就一致呢?单从这一计算结果看,显然无法判断。而按照不及格人次计算得出的结果,可以看到两系的不及格率明显有了差距,电子与通信工程系不及格率高于数学系,虽然不及格人数所占比例相同,但前者不及格学生的学习能力要低于后者,而事实是两系不及格人数分布确实存在差异,这一差异在“不及格人次/总人次”这一公式中得到反馈。

(三)利用数据统计软件,全面分析学生成绩

通过有统计含义的计算公式对原始成绩数据进行整合、归纳、概括,教学管理者根据计算结果获得原始成绩数据的某些重要特征,通过这些特征了解考试结果的基本状况,对存在异常的数据作进一步分析。

1.利用excel描述统计工具进行分析。以2013级公共基础课“C程序设计”期末考试成绩为例,共有313名学生参加考试,运用excel描述统计工具,将原始成绩整理后得到表2。(因篇幅有限,本文只截取了20位学生的成绩)。

从表2的计算结果中我们可以很清晰地了解本次考试的基本情况,2013级公共基础课“C程序设计”期末考试成绩平均分为64分,最高分97分,最低分11分,中位数为66.5,偏度为-0.53113,小于零且接近于零,说明成绩分布略呈负偏态。若是偏度值过大,说明成绩偏高或者偏低,这时候应该用中位数代表平均值更为客观。

excel描述统计工具可以让信息参考者最便捷、最快速地了解课程成绩的基本情况,提高成绩分析效率。

2.利用excel统计函数进行数据分析。(1)频数值函数和正态分布函数值。还是以表2为例,为了更直观地了解学生成绩分布情况,根据上述计算结果,对原始数据按照“10以下”、“10—19”、“20—29”、“30—39”、“40—49”、“50—59”、“60—69”、“70—79”、“80—89”、“90以上”十个组段进行整理,利用excel统计函数“frequency”和“normdist”,计算得出各组频数、给定均值和标准差的正态分布函数值,绘制出直方图和正太概率分布图,如图2所示。从图2我们可以看到成绩分布曲线略呈负偏态,说明有极小值的存在,图中显示有4位学生成绩低于30分,偏离平均值较远,需要进一步查明原因:是因为批卷过程中出现的失误还是学生个人问题,如果是前者,那么要及时纠正错误;如果是后者,那么班导师、辅导员要对这些学生给予及时关注,深入了解学生的学习状态和生活情况,以便帮助学生顺利完成学业。

(2)列联表。列联表是观测数据按两个或者更多属性(定性变量)进行交叉分类时所列出的频数表。列联表可以用来分析多个定性自变量之间是否存在显著关联,比如某个班级不及格学生学习能力和生源的关系。以2012级制药专业1班为例,该班级在2013学年第二学期的不及格率超过了60%,为了进一步了解不及格率异常是否和生源存在联系,将原始资料整理统计后得出真实频数表,如表3所示,列变量代表学生学习能力,行变量代表生源地,运用excel统计公式计算得出期望频数即表4。

最后,利用excel函数“CHiteSt”和“CHiinV”,置信水平取0.05,计算得出两个重要的函数值:统计量x2和x2a临界值,结果分别是28.69823232和21.02606982,显然x2>x2a,表明不及格学生学习能力与生源,是显著相关的。

3.利用spss统计软件,深入成绩分析。对于简单数据分析,可以运用excel来完成,例如以上所举例子,但是当面对庞大烦杂的数据、步骤复杂的分析手段时,需要更专业的统计软件来实现对数据的整合、概括和分析,spss为繁琐、复杂的计算步骤提供了简便的操作,提高了分析效率。

(1)因子分析。因子分析是指通过提取公共因子的方式重新组成一组互不相关的综合指标,以尽量少的信息丢失来获得对原始数据尽可能多的信息。其在成绩分析中的目的就是利用降维思路,找出影响学生成绩(学习能力)的主要课程,并对这些课程加以说明,同时对学生学习方面提出建议。下面以2013级石油化工系91位学生大学一年级16门课程进行综合分析为例。

第一,将16门课程作为分析变量:“大学计算机基础”X1、“大学英语一级”X2、“高等数学(上)”X3、“实验化学(1)”X4、“思修与法律基础”X5、“体育(1)”X6、“现代基础化学(上)”X7、“C程序设计”X8、“大学物理(上)”X9、“大学英语二级”X10、“分析化学”X11、“高等数学(下)”X12、“实验化学(2)”X13、“体育(2)”X14、“现代基础化学(下)”X15、“中国近现代纲要”X16,得出16*16的原始数据矩阵(略),利用spss分析中的降维功能,进行相关设置,经过系统自动计算得出一系列计算结果。

第二,判断进行因子分析的必要性。根据变量相关矩阵(略),发现“大学英语”一级和二级、“现代基础化学基础上”和“高等数学上”、“高等数学下”和“大学物理上”之间的相关性最高,分别是0.780、0.716、0.769,且对应的显著性水平p=0.000,因此应进一步进行因子分析。另外根据Kmo和Bartlett的检验结果,Kmo=0.820以及Bartlett球形度检验sig<0.01,都表明变量之间有显著的相关关系,适合进行因子分析。

第三,根据旋转成分矩阵(见表5),提取较大载荷的变量,即影响因子的主要变量,绘制成表6。

第四,对表6进行说明和分析。在第一个因子中,“高等数学上”、“现代基础化学上”、“大学物理上”、“高等数学下”、“现代基础化学下”、“分析化学”这六门课程的载荷值较大,也就意味着第一个因子更能代表这些课程,由于这六门课都是理科类课程,因此将第一个因子命名为“理科课程”;在第二个因子中,“大学英语一级”和“大学英语二级”两门课程的载荷较大,因此第二因子命名为语言类课程;第三个因子中“体育1”和“体育2”的载荷最大,因此第三个因子代表身体素质课程;第四个因子中“实验化学1”和“实验化学2”的载荷较大,这两门突出了学生的动手能力,因此第四个因子代表了技术能力课程;第五个因子和第六个因子中,“大学计算机基础”和“C程序设计”载荷最大,且都属于计算机课程,因此这两个因子代表了计算机类课程;第七个因子和第八个因子中,载荷最大的分别是“中国近现代史纲要”、“思修和法律基础”这两门课程,可以将其归纳为文化素养课程。

另外结合数据窗口系统自动计算的因子得分,可以发现不及格学生的第一因子得分大多数偏低,由此可见,数理化基础课程是影响学生成绩的主要因素,这些课程不仅锻炼学生的思维能力,也是学好专业课程的基础,对学生将来的发展有着潜移默化的引导,因此应重视和提高数理化基础课程的教学质量。

最后,利用因子综合得分进行成绩排名。因子分析除了找出影响学生成绩的主要因素外,另一个意义在于对学生成绩的综合评价。由于因子分析已经考虑到了每个公共因子的贡献率,因此,综合得分更能真实反映出学生的学习能力,按照综合得分进行排名比平均值排名更为科学与客观。综合得分计算公式如下:∑(数据窗口系统自动计算出的各个因子得分×各个因子旋转后的方差贡献率)。

(2)相关分析。从表6中得知,理科类基础课程与第一个因子最相关,是影响和体现学生学习能力的主要因素,但是这六门理科类课程之间的相关性又是如何的呢?通过spss相关分析功能进一步解释这六门课程之间的关系。如表7所示,表中反映了高等数学等五门课程之间两两相关的程度,相关系数带有**的代表在0.01水平上显著相关,显著性(sig)是0.000,说明不相关的概率小于0.01,因此,这五门课程两两相关,彼此相互联系,互为基础,对这五门课程的学习应同等重视。

通过excel和SpSS软件统计功能,拓宽分析的角度:班级成绩分析、课程成绩分析、课程之间的分析等,使得成绩分析更为全面和深入,分析过程更为简便和有效率,分析结果更为有效和客观,为管理者制定政策、实行教学改革提供可靠依据,从而完善分析结果对教学管理的指导作用。

参考文献:

[1]向书坚,张学毅.统计学[m].北京:北京大学出版社,2007.

[2]蒲括,邵明.精通excel数据统计与分析[m].北京:人民邮电出版社,2014.

[3]李丽清.统计与统计分析[m].长沙:中南大学出版社,2011.

[4]王孝玲,赵心华.教育统计学[m].北京:北京师范大学出版集团,2008.

[5]张磊,姜孟瑞.教育统计分析方法[m].北京:科学出版社,2007.

[6]董毅.现代教育统计学[m].合肥:合肥工业大学出版社,2008.

数据统计分析学习篇4

[关键词]大数据;独立学院;统计学;教学改革

doi:10.3969/j.issn.1673-0194.2020.16.106

[中图分类号]G642[文献标识码]a[文章编号]1673-0194(2020)16-0-02

0引言

统计学是一门实践性很强的课程,旨在培养学生利用统计方法解决经济社会中实际问题的能力。由此可知,统计学的发展通过实际需求驱动。如今,数据已经渗透到各个职能部门,伴随着互联网和新型技术的迅速发展,数据已然成为一项资产,成为重要的生产要素,随之而来的数据处理技术也变得越来越丰富。企业对经济管理类学生的数据处理能力要求更高,使统计学原有的结构架构、理论体系等都遇到了前所未有的冲击和挑战。在该背景下,统计学教学必须进行改革,以适应时代的发展变化。如何使统计学的教学跟上时展,笔者所在学校统计学教学组教师在统计学教学过程中进行了一些有益尝试,主要针对之前统计学教学过程中存在的问题以及大数据背景下统计学课程教学目标两个方面开展。

1大数据时代传统统计学的变革

统计学者对大数据时代统计学教学改革问题做了大量有益的研究。从研究视角看,主要集中在以下两个方面:大数据时代对统计学的挑战与思考。邱东认为统计是一门数据科学,在大数据时代特别重要。这个推断逻辑上没有问题,但问题在于“统计学特别重要”不等于“统计学唯一重要”。他还指出大数据时代的统计重心发生了转移,如果原来的统计实务重心在于收集基礎数据,难点在于如何获取数据,那么在大数据时代,则更注重如何选择有用数据。如果原来重心是“做加法”———无中生有;那么现在重心则是“做减法”———有中生用。换句话说,原来统计学的特点是以小见大,现在则更在于由繁入简。朱建平、张悦涵认为,大数据的产生对统计学具有划时代的意义,大数据以其价值性、多样性、大量性、高速性的特征弥补了统计学高成本、高误差的不足,但这并不意味着统计学的时代结束了,人们进行搜索、聚类、分类大数据时还需要依赖统计学的方法,大数据离不开统计学。大数据时代的到来,提高了统计质量,降低了统计成本,拓宽了统计学应用领域,使统计学得以延伸,提高了统计学在自然科学和社会科学中的地位,这是大数据给传统统计带来的机遇。

大数据的到来使统计分析从小数据走向大数据,传统的统计学通过认识样本了解总体。大数据时代,统计学分析的对象可能是总体;传统统计学大部分研究可以用图表展示结构化数据,而大数据时代人们面对更多的非结构化数据;传统统计学虽然应用计算机软件,但大部分基于excel、SpSS软件,而大数据时代数据处理软件更多,比如,R语言、python、matLaB以及SaS等。这些都说明大数据给统计学不仅带来了机遇,也带来了一定的挑战。抓住机遇,迎接挑战,确保统计学跟上时代的发展步伐是每一位统计学相关人员的责任和使命。

2统计学教学中存在的问题

2.1讲授内容较多,学时有限

统计学的内容包括基本概念、基本理论、统计整理、描述性分析、参数估计、假设检验、相关与回归分析、时间序列分析等。之前笔者所在学院统计学学时为32学时,其中还包括软件的学习和操作,假设检验都无法完整讲授,更不用说相关分析、回归分析和时间序列及指数分析。如果学生不能充分在课后展开自主学习,学习效果将大打折扣。

2.2先导课程基础薄弱

统计学的先导课程为微积分、概率论与数理统计。对于经管类非统计专业的学生,大多数学生对公式不敏感,甚至头痛,常常死记硬背,上统计学时,关于概率论与数理统计的很多知识已经忘记,看到统计学课程包含公式、概率论等知识常常觉得痛苦。虽然目前已淡化了公式的相关计算,但在讲解原理时,如中心极限定理、方差分析思想时,学生仍觉得有一定难度。

2.3教学内容没有与时俱进

统计学的基本内容包括两大方面:一是描述统计;二是推断统计。在大数据时代,无论是描述统计还是推断统计都发生了变化,但实际课堂上,统计学的教学内容并没有与时俱进。以统计推断为例,传统的统计推断以概率论数理统计为基础,利用中心极限定理确定已知数据分布后,利用样本统计量推断总计特征,推断结果的评价由样本统计量的构造原理及样本数据的质量决定。而大数据时代,人们可以收集到海量数据,研究数据实际分布就是对数据进行分析计算。显然,当下统计学课程教学内容已跟不上时展的步伐,学校培养的学生不具备从事大数据研究的能力,这是不争的事实,毋庸置疑,统计学的教学改革迫在眉睫。在大数据时代,把大数据思想与精髓纳入统计学的教学体系中非常必要。

2.4注重理论教学,轻实践教学

统计学是与数据打交道的一门学科,从数据收集到最后的分析预测,都离不开数据,实践性很强,但掌握统计学数据分析方法,必须掌握一定的理论,如随机抽样、大数定理、中心极限定理、小概率原理等。在一些地方院校,这些内容的讲解会占用50%以上的学时,比如,在讲到推断统计时,统计量是非常重要的概念,教师为了让学生掌握这一概念,会从概率讲起,介绍随机抽样、抽样分布以及中心极限定理等相关内容,这样在总学时有限的情况下便会大大缩短实践时间。此外,不能保证上机时间,学生不能完全掌握数据分析软件的操作步骤,导致学习效果大打折扣,甚至学生无法将统计理论知识应用到实践中,这与教学目标背道而驰。

2.5考核方式單一

联合国教科文组织国际教育发展委员会出版的《学会生存》一书中说:“从理论上讲,考试的目的第一在于测量过去的成绩,第二在于评价一个人的未来的能力。”考试作为教学的最后一步,是对教师一学期教学质量的评价,也是衡量学生学习效果的重要手段。之前,笔者所在学校统计学主要采用“期末成绩(70%)+平时成绩(30%)”的考核方式,这种考核方式显然不合理,无法体现学生实践能力。

3统计学教学改革方法

统计学是一门兼具理论和应用的课程,特别是在大数据的背景下,学生在具备经济学、管理学等专业知识的基础上,需要掌握相关数据分析方法,并能熟练掌握相关统计软件,自觉地利用统计学知识思考和解决实际社会经济问题。因此,在统计学教学改革过程中,应着重从以下几方面进行改革。

3.1增加学时

笔者所在学校的经管学院在2017级人才培养方案修订过程中,将统计学学时由原来的32学时增加到56学时,实验学时由原来的4学时增加到16学时,大大缓解了内容多、学时少之间的矛盾。另外,由原来大班教学改成小班教学,提高课堂教学效果。

3.2转变教学观念

受新冠病毒肺炎疫情影响,全世界学生都进行在线学习,这是教育领域的一场革命。疫情过后,教学方式会发生很大变化,当然这种变化得益于信息技术的进步。以往的课堂总是“填鸭式”教学,教师滔滔不绝地讲一节课,学生参与度极低。随着在线平台的推广和普及,例如,慕课、网易云课堂等被学生青睐,所以高校教学观念也应随之转变。课堂上以学生为中心,课前通过网络给学生推送预习内容,包括在线平台视频。课堂上教师应用案例分析串讲知识,剖析重难点,使学生在案例学习中掌握理论知识。一方面,学生通过这种方式掌握理论知识;另一方面,节约时间,加强学生实践环节学习。

3.3加强教学实践

传统统计学虽设有实验,但是以excel、SpSS为主的统计软件处理一般统计学问题,比如,数据图表展示、回归分析等。这些分析方法远远不能满足大数据的需求。在大数据时代,机器学习、数据挖掘、模式识别、商务智能、人工智能都属于数据分析,这要求学生的软件应用能力足够强,不仅会傻瓜式操作,更要胜任算法设计和程序编码等。在条件允许的情况下,可以开设计算机课程,比如,数据库、数据结构、python等。

3.4优化考核方式

单一的卷面考核方式已经不能适应经济社会对统计人才的需求,在大数据时代,应该加强对学生实践能力的考核,将实践作为考核范畴。通过实际上机能力考核,引起学生高度重视,推动学生动手能力与社会需求相匹配。把实践纳入考核体系后,无论是教师还是学生,都会高度重视上机实践教学,不再流于形式。

3.5提高教师自身专业素养

教师是一个需要终身学习的职业,大数据时代的到来对统计学教师来说既是挑战也是机遇。教师要努力学习,掌握大数据相关内容,以跟上时展步伐。这要求教师把学习当作一种常态,经常参加教学科研活动。对于教学任务重、院校所在地较偏僻的教师,参加在线培训,听取一些专家在线直播的课程等不失为一种有效的学习途径。

数据统计分析学习篇5

摘要:基本活动经验是在学生参与数学学习的活动中慢慢积累起来的。在统计和概率知识的学习过程中,让学生参与活动全过程,体验到数据分析的经验积累都向着不确定思维方式的感悟,但是在不确定中又蕴含着一定的规律,让学生在体验、活动中感悟,帮助学生积累数据随机性经验,形成较为稳定的关于统计与概率的思维模式。

关键词:数学活动经验;数据分析;读图表

基本活动经验是在学生参与数学学习的活动中慢慢积累起来的。基本活动经验不同于基础知识,它是隐性的,属于缄默知识。数学活动经验的积累有助于学生建模,形成较为稳定的思维模式,也有助于提升学生的智慧。那么,在小学数学“统计与概率”领域的教学中如何帮助学生积累数学活动经验?

一、让学生经历数据分析过程,积累统计活动经验

“统计与概率”领域的教学,必须让学生经历数据分析的过程,也就是让学生亲历收集数据、整理数据、描述数据和分析数据的全过程。因为,对于小学生而言,数据分析观念的培养依赖于经验的累积,需要让学生在统计过程中亲历数据形成的每一步,从而使学生理解、体会数据中蕴涵的信息,让学生学会运用数据进行判断、分析问题,使学生会选择适当的方法与策略解决问题。

例如:在统计教学中,可以让学生统计“一个家庭一周丢弃垃圾袋的数量”,也可以统计“校门口的车流量”。

@样的活动贴近学生的生活实际,具有较强的可操作性,使学生在一次次经历数据收集与分析的活动中,积累统计活动经验,逐步体会到生活中充满着大量的数据,收集数据再通过分析做出合理决策。逐步树立数据与分析的角度思考问题的意识,以便在需要的时候利用数据进行决策,有利于学生数据分析意识的形成,从而使学生感受到统计方法,真正丰富他们的统计经验。

二、让学生经历读图表的过程,积累读图表的活动经验

义务教育数学教科书对统计与概率是按照螺旋上升的体系编排的,每一册中都有统计内容的学习,其中占主要地位的是有关统计图表的教学。在统计图表教学方面,课标要求学生能正确读图,看懂简单的信息后,能够进一步挖掘图意,通过推测找出图表中蕴藏的有价值的信息进行分析和判断,从而得出结论。让学生经历了统计图表这一完整的学习过程,为进一步解决实际问题积累更为广泛的数据分析经验。

例如:在学习四年级“折线统计图”时,让学生认真地读图后,读出图中所反映的信息,而且让学生体验、感受到折线统计图的优势:既可以看出数量的多少,又能够看出数量的增减变化情况。同时,教师引导学生去推测未来的温度变化情况。

在这一过程中,学生经历了读图的过程,感受到折线统计图中蕴含了很多的信息,体会到数据是随机的,但是通过整理这些随机的数据,会发现这些数据有了一些规律,而且使学生体验到根据规律我们可以做出预测和判断。

三、让学生经历数据的随机过程,积累概率的活动经验

数据的随机,就是指收集数据过程中每次得到的都是不可预见的,没有规律。但是,数据多了,让学生进行分类汇总数据,并进行分析归纳后,又总能找到一些规律。因此,在教学“统计与概率”这部分内容时,要让学生参与活动的全过程,让学生在体验、活动中感悟,帮助学生积累数据随机性经验。

例如:三年级“可能性”教学,可以分两个环节进行教学。

第一个环节:初步感知。

教师出示一个盒子,向学生说明:里面放5个白球,任意摸一个,摸出的是什么球?

学生:肯定是白球。

教师:为什么呀?

学生:因为里面都是白球。

第二个环节:理性认识。

在装有4个黄球4个白球的袋子里任意摸一个球,摸10次,将摸的结果记录在表格里。

师:观察这张表格,如果摸一次,是不是一定能摸到黄球?

生1:是。每组都有人摸出了黄球。

生2:看表格上记录可以看出,我们不一定能摸到黄球,因为里面有白球,也可能摸出的是白球呀。

师:说得有理有据,看来第几次摸到黄球能不能提前确定?

生:不能。

师:是的。像这样第几次摸到黄球不确定,但一直这样摸,总会摸到黄球,咱们就把这种情况叫做有可能摸到黄球。

结合学生已有的生活经验,对于能不能摸到黄球都有自己的想法,学生的理解和教师期待的数学实际是有一定距离的。从学生的课堂表现反映出学生思考问题不够深入,只是看到了表象,获得的活动经验是比较片面的。在上面的教学片段中,教师有效引导学生去观察、辨析、比较,帮助学生积累了丰富的直接经验,有效地促使学生学会思考。

数据统计分析学习篇6

1.1计算机技术应用于统计学是信息化发展的必然要求

传统的统计工作基本以统计人员的手工劳动为主,因此无论在信息量,还是统计数据的可靠性、准确性及时效性都已不能适应现代社会信息化发展的需要。而在信息化时代,从统计方法的选择到统计工作过程,即统计设计、统计调查、统计整理和统计分析四个阶段,在遵循客观规律和实事求是原则基础上,每个环节都需要渗透计算机技术,尤其是最后对海量数据分析阶段,需揭示事物的本质和规律,需要对数据进行深度挖掘,得出有用的决策方案和评价结论。离不开计算机软件处理,有的甚至需要编程寻求数据结果,数据结果的一般也是在通过该网络平台上进行的、所以,计算机技术应用于统计学是信息化发展的必然要求。

1.2计算机技术推动了统计学的发展

就统计数据本身而言,其不但渗透到社会生活的各个领域,而且数据量也快速增加,即所谓海量数据的处理,这就对统计学的发展和应用提出了更高的要求。例如在对一些理财产品的选择和风险投资领域,对这些数据处理最重要的要求就是快而准,唯有如此才能抓住盈利的时机,而电脑和网络技术的发展真正提供了这种可能性。计算机作为一种高速计算的电子计算机器,最重要的功能之一便是数据处理分析,不但能在时间复杂度上得到最大程度的优化,同时在完成基本数据运算之余,更能通过分析技术对数据做出合理分析,并在一定程度上通过对数据的整合完成对所关心对象未来发展的预测。所以,计算机技术不但能实现对数据的快速处理,而且在很大程度上推动了统计学的发展。

1.3统计学为计算机信息处理提供数据保证

在信息化时代,数据日新月异,层出不穷,计算机技术只是为信息时代的数据处理提供了高效手段,但只有信息是准确和可靠的,才能得出正确的处理结论,而这些数据是否真实、准确、可靠,完全依赖于统计学的调查方法和手段,依赖于统计学的不断发展。只有统计学,才能为计算机技术进行准确和及时的数据处理提供保证,也才能更好地促进信息社会的发展。

2计算机技术在高校统计学教学中的应用

统计学,以“概率论与数理统计”为核心理论支撑,包括诸如随机过程、抽样推断、时间序列、多元统计分析等各个细小分科,而作为与数据打交道的统计学,在通过数据挖掘来探求事物本质,发展状况与走向时,对数据的依赖是不容忽视的,对于海量数据的处理需要计算机技术、统计分析方法和统计软件。而在目前高校统计学教材和统计学学习中,学习的核心仍旧放在理论方面,在应用上投入时间少,尤其是对较为实用,较为前沿的技术介绍不够。下面介绍几种简单的计算机处理技术如何在统计学中进行应用。

2.1eXCeL在统计学中的应用

eXCeL是winDowS的成员,学习起来非常方便,极易被人们所接受,因高校中开设计算机文化基础课程,对此有所了解,因此尤其适合高校统计学中深入学习。eXCeL软件是一种功能强大的数据分析与管理系统,它提供了大量的函数,比如统计学中经常涉及到的平均指标(算数平均数、中位数、众数)、标志变异指标(标准差、方差、标志变异系数)、回归系数(一元、多元)、极值计算(最大值、最小值、峰值)、抽样推断(样本个数、置信区间)以及编制变量数列进行统计分组等等,都可以进行处理和计算,很直观,也很适合统计人员使用。另外,还具有很强的制图制表功能,同时可以对经济预测提供相应的数学模型,是目前高校统计学习中的一种重要数据处理工具。

2.2SpSS在统计学中的应用

SpSS是StatisticalpackageForSocialSciences的缩写,即社会科学统计软件包,是目前国际上广泛使用的统计软件包之一,主要分布在保险、医疗、制造、银行、证券、科研院所等各个领域。SpSS主要功能包括数据管理、数据分析、图表分析和数据输出等,集数据管理、分析与一体。主要内容包括均值比较、方差分析、主成分分析、回归分析、时间序列分析、因子分析、聚类分析等等,每类中都有多个细小的专项统计方法。SpSS也有专门的绘图系统,可以根据数据绘制各种图形。具有操作简便、编程方便、功能强大、全面的数据接口、灵活的功能模块组合等优点,为统计人员处理数据提供方便。

2.3SaS软件在统计学中的应用

SaS是StatisticalanalysisSystem的缩写,即统计分析系统,现已发展成为一个大型的模块化集成软件系统,融数据处理和统计分析于一体,具有数据仓库管理、数据挖掘和集成数据访问等功能,广泛应用于医药、卫生、经济学、政府、农业、教育部门等各行各业,几乎满足任何类型的数据和任何应用的需要。具有易学易用,操作简便、完整可靠的特点。在统计学方面,可以进行一元线性回归分析、相关分析、方差和协方差分析、时间序列分析、决策分析和经济预测等等。SaS具有绘图功能,能把存储的数据以图形的形式非常形象和直观地显示出来,不仅可以绘制直方图、散点图、扇形图等,而且还能绘制地图。另外,本身还有函数系统,用户可以根据自己的需要选择适合自己的模块。SaS提供了几乎所有最新的统计分析方法,其分析技术先进可靠,非常值得在统计学中学习和推广。

3统计软件运用过程中的相关建议

数据统计分析学习篇7

关键词:《生物统计学》统计软件教学新模式

《生物统计学》是一门理论性和实用性都很强的学科,是现代生物学研究不可缺少的工具,现已逐步成为高等院校本科生的专业必修课。通过学习统计学的基本原理、基本方法,学生可培养科学的逻辑思维能力,同时可提高分析问题、解决实际问题的能力。然而,由于该学科的分析方法和数学模型建立在比较抽象的科学假设上,计算公式繁多、分析过程烦琐,教学模式传统,使课堂索然无味,无法提高学生的学习兴趣[1]。近年来,大量统计软件的出现使繁重的计算工作变得轻而易举,同时也给教学带来了盎然生机。本课题组采用了excel、SpSS等几种统计软件来辅助《生物统计学》多媒体课堂理论教学和实习(实验)教学进行了多年的探索,实践证明,这一教学新模式大大激发了学生的学习兴趣,提高了学生的统计应用能力,并提高了教师的教学水平,教学效果显著。

一、《生物统计学》教学新模式的探索与实践

1.利用excel软件在多媒体课堂进行辅助教学。

我院有生物科学和生物技术两个本科专业,教学时数与达到培养目标所需完成的教学内容不相适应,繁多的公式的计算占去了大部分的课堂时间,老师精心安排的例题、认真的演算无法引起学生的兴趣,一堂课下来,学生感觉枯燥无味,老师感觉非常疲惫,且教学任务很难完成。针对此情况,我课题组大胆进行了新模式的探索。首先加强了软件在理论课堂上的演示,提高了学生学习的兴趣和解决问题的能力。

我们首先选用了较强的数据分析功能和统计绘图功能,易学易用,不用再另外购买就可以进行数据处理的excel软件,并且学生对此软件界面较熟悉,数据输入也相对比其他软件简单。在多媒体教学过程中,首先进行理论上的讲授,同学们在掌握了选择处理方法的基础上,利用excel数据处理功能来演示计算过程,这样节省了手工计算大量烦琐的公式的时间,然后重点对计算结果进行推断和分析,从而实现了教学内容与生物统计软件应用的有机融合,改枯燥的纯理论课为理论与实践相结合的课程。

课后布置作业,要求学生借助计算器分步计算和使用excel软件两种方法得出结果,同学们切身感受到软件的益处,大大提高了学习生物统计学的兴趣。

2.统计软件实习(实验)与理论课教学紧密结合。

2007年我系刚开设生物统计学课,我们首先对教学计划进行了大胆改革,增加了实习学时数,由原来的只有理论教学,过渡到在理论教学课堂上excel软件处理数据的演示,过渡到全部学完后再集中安排一至两次(3学时次)上机实习课,最后改为理论与实验学时数比例达到1∶1。虽然有了很大的进步,但造成了理论知识与实习的脱钩,同学们经常忘记了所学的知识,满脑空空地来到实习机房,费时费力,效果不太理想。因此,2009年我们一改传统的教学方式,采取理论课的教学与统计软件实习同步进行。例如,学完方差分析理论知识后,紧接着就安排方差分析实习课,通过课本例题和老师精心选择的习题让学生独立完成整个过程,包括该习题处理方法的选择、软件的使用方法、数据处理结果的推断和分析,提高了方差分析统计方法的动手能力。整个课程的学习一般给学生安排5次实习课,使学生能够比较系统地学习统计软件。这一改革受到了师生的一致欢迎,由原来的不到下课时间急着下课发展到了下课时间到了还不想下课。

3.加强多个统计软件的使用,扩大学生视野。

目前我们在实习机房电脑中安装了excel、SpSS、SaS、origin等多种软件,让学生对此都有所了解,然后选择自己喜欢使用的软件进行数据处理。但是想要学生同时掌握多个软件的使用是不现实的。四种统计分析软件各有优势及不足,SaS软件包几乎囊括了生物统计学的所有方法,但需要编程运行,初学者不易熟练掌握。SpSS是比较全面、实用的统计学软件,具有可操作性、不编程序的特点,它的优势不言而喻[2]。而excel数据分析软件包,是office组建的成员之一,因此在界面上及使用的方便程度上占有一定的优势,使用者操作起来会得心应手,所不足的是由于是excel附带的数据软件包,与上两个软件包比较起来功能上没有那么强大,比如:缺少多因素方差分析、方差分析后的多重比较、多元回归、多种曲线拟合,等等,但对于本科生来说,如果不需要很复杂的统计学测试,已是一个很方便实用的数据统计软件。origin软件操作容易、作图方便、速度快,但统计学功能不完善。实践证明,excel、SpSS两种软件包深受学生欢迎。在配有多媒体设备的计算机房进行练习,一人一机。教师在主机上边讲解边操作,学生可一边从大屏幕投影观察到具体的执行过程,一边在自己的机上进行相应的操作。学生强烈地感受到与以前用计算器相比,更快速、简便、准确、实用,这样一方面密切联系实践,真正提高了学生的应用能力,另一方面增强了学生的兴趣,使学生由过去不愿学生物统计学,到为了完成毕业论文不得学,但望而却步,到现在下课不愿意离去。在实验课中学生不仅学到了统计分析知识,而且在毕业实习中运用计算机来分析毕业论文中的数据,并为以后的科研打下了牢固的基础。

4.以教师科研促教学。

课题组成员根据理论教学大纲和教师的科研成果,精心编制了excel、SpSS两种软件的上机实习教材,通俗易懂,简单明了,学生很快就能掌握上机要领,效果良好。在学生进行上机实习的时候,所布置的上机作业的数据来自课本上的例题、课后习题和课题组老师的科研结果。因为学员在上机实习前已经系统地学习了上机内容的理论知识,并完成了课后习题作业。因此在上机实习时,学生就能够充分利用有限的上机时间而无需花费更多的精力和时间来熟悉所要求完成的实习作业。学生可将剩余的大量时间用在老师提供的科研数据处理上,使学生真正解决科研活动中遇到的问题,这样就拉近了与实际生活的距离,真正做到了学以致用,从而更进一步提高了学习的兴趣。

二、效果及意义

经过几年在理论教学和实验教学中的应用和尝试,教学效果良好,具体表现在以下几方面:(1)新的教学模式改枯燥无味的纯理论课为理论与实践相结合的课程,增强了实用性,提高了学生的学习兴趣。(2)根据不同层次不同专业的学生特点(包括生物技术本科、生物科学本科),按教学大纲实施不同的教学内容,以教师科研促教学,让学生做到学以致用。(3)以excel软件辅助课堂教学,多种软件在实验教学中开展,统计功能相互补充,扩大了学生的视野,提高了学生的素质。(4)理论与上机实习操作交替进行,学生能独立快速完成资料的统计分析工作,提高了对实际问题的动脑分析能力。

参考文献:

[1]范平,崔党群,詹克慧等.excel软件在生物统计实验教学中的综合开发应用[J].实验技术与管理,2003,20,(2):65-69.

数据统计分析学习篇8

但与初中数学其它教学内容相比较,与数据分析观念相关的统计与概率的教学内容在实际教学中问题仍比较突出,主要表现在以下几个方面:第一,在教学方法、手段方面.教师主要采用传统的讲授法进行教学,教学方式单一枯燥,很少体现出概率统计内容教学的特色.第二,过分重视对解题方法的训练,忽视对数据分析观念的训练和培养.学生对数据分析的步骤和方法不熟练,导致学生在实际生活中遇到相关数据分析问题仍无从下手,对数据没有亲近感,数据分析观念亟需提高.

通过与一线数学教师的交流和他们的课堂教学表现进行研究我们发现,大部分数学教师对初中学生的已有的数据分析观念水平掌握程度不够到位,对统计与概率的教学目标以及教学重难点把握不准确,数据分析相关内容的教学方法和其他内容的教学方法基本相同,没有根据统计与概率的教学内容特色和学生的认知水平安排教学设计.在课堂教学中,很少有教师按照《义务教育数学课程标准(2011版)》的要求,让学生去做一做,想一想,结合合理有效的情境创设,引导学生观察、操作、思考,去亲身经历、体验数据统计的过程.理由是课时压得太紧,没有时间安排;中考试卷中关于“统计与概率”这一部分的内容,以计算很简单的题目为主.

因此,系统地总结和分析中学生数据分析观念所处的具体水平,探讨在平时教学中提升初中生数据分析观念的教学策略,使学生具备一定的数据分析能力,对学生数学素养的提高和进一步发展都是非常重要的.

1合理创设情境,提高学生学习数据分析的积极性

数据来源于生活,数据分析应用于生活,与日常生活紧密联系.教师应该充分利用实际生活中与学生社会生活相关的信息,经过适当改动,开发为可利用的教学情境资源.在生活中,随时随地都能发现与数据分析有关的事例.如:天气预报报道今天下雨的可能性是80%,明天一定会下雨吗?买的中奖率为1%,买100张一定能中奖吗?商品房的销售价格增长分析,商家的打折促销活动、保险公司保险费的收取、国家延迟退休年龄至65岁的原因与理由等等.发展学生的数据分析观念,首先应该让学生参与到课堂学习中,因此,在教学中应注重设计贴近学生生活的情境,使学生经历数据收集、整理、分析等数据分析的全过程,逐步地提升数据分析观念.例如,在《频数分布表和频数分布直方图》中,通过“环保小卫士”选举,学生的学习积极性非常高,每个同学都参与到选举中,让学生再次经历数据收集与整理的过程,进一步体会数据整理与表示的必要性,结合具体情境引入频数和频率,易于学生理解并体会其意义.

通过活动学生明确了调查选举的一般流程,进一步体会数据整理与表示的必要性,同时学生很容易明白每个候选人的频数是指他们的得票数,每个候选人的频率就是他们的得票率,并在这个过程中让学生体会统计对民主决策的作用,发展学生的数据分析观念相关应用意识和能力.教师在数学课堂教学中应该创设合理的教学情境来提高学生参与学习的积极性,注重对影响学生的学习情感因素的引导,改变数学学习的态度和信念,进而提高学生的数学学习力.

2注重体验,让学生亲身经历数据分析的全过程

数据分析观念的培养离不开学生亲身经历数据收集、数据整理、数据描述、数据分析等过程,只有自己掌握条形统计图、扇形统计图等统计图形的制作方法才能更好地读取数据信息,更好地利用相关统计图表表示、描述相关数据信息.在概率等内容学习中,学生如果能够通过实验去探索、发现相关事件发生的频率,亲身观察事件发生的可能性,对于学生理解掌握事件发生的随机性和可能性是有很大帮助的.数学来源于生活,在实际生活中有着广泛的应用,学生数据分析观念的培养离不开学生他们在活动中亲身去用统计的眼光分析问题,并做出合理的判断[2],作为教师,我们应该为学生提供一个有利于他们思维发展的实践机会.例如,在《可能性》教学中,学生通过亲身摸球实验,感受到摸到白球和红球的随机性,摸的次数多了以后,学生能够根据摸到红球和白球的频数去估计可能性的大小.

教学片断:组织小组活动,不透明的袋子里面有质地相同的3个红球、3个白球.每次摸出1个,在摸球之前你能猜出会摸到什么颜色的球?每次你都能猜对吗?

活动结束时,老师询问:有没有每次都猜对的同学?(只有2人举手)

师:为什么我们那么多的同学没有猜对呢?

(让两个猜对的同学介绍方法.)

生:红球和白球摸在手里的感觉不一样,

师:是吗?我们一起来见证一下:

生:(摸出一球,先猜测是)红色;拿出后是白色,

师:什么原因?

生:这次没有感觉对.

生:如果第一次摸出来的是红球,第二次就猜是白球.

师:你刚才就是这样猜的,结果都对了吗?

生:连连点头.

师:你很神奇,我们一起试一试,

(生2摸出1个红球,放回.)

生:第二次一定是白球.

(第二次生2果真摸出一个白球,同学们有一部分认为他是对的.)

师:要不要再试一次?

生:下次该是白球了

(第三次生2摸出个红球.)

师:这个规律还成立吗?通过刚才的摸球游戏,你们发现了什么?

生:袋子里既有红球又有白球,摸出一个球,可能是红球,也可能是白球,具体哪种是不一定的.

通过案例活动,学生会发现摸到球有可能是白球也有可能是红球,既对于同样事情每次收集的到的数据可能是不同的,学生亲身经历事件发生的过程,对于他们感受、理解数据随机性的涵义是有非常大的促进作用的.

3合理运用信息技术进行数据分析辅助教学

《义务教育数学课程标准(2011年版)》指出“信息技术能向学生提供并展示多种类型的资料,包括文字、声音、图像等”.[1]可以创设模拟多种与教学内容相关联的情境,是从根本上改变学生数学学习方式的重要途径之一,必须充分利用.计算器可以处理复杂的数据.例如在学生计算一组数据的离散程度时,通过计算器可以很快求出平均数和方差,有的计算器可以直接求出方差;利用计算器辅助教学,将学生从繁杂的计算中解脱出来,可以使学生充分体会统计量的统计意义,将学习重点放在理解统计思想和进行统计活动上来,避免将数据分析过程变成单纯的数字计算,在提高学习效果的同时减轻学生学习负担.计算机可以记录、整理数据,利用excel表格可以将学生统计到的数据进行记录、整理、进行排序比较等,利用计算机进行统计图的制作、展示数据的变化趋势方面具有很大的优势.利用信息技术可以使学生有充足的时间来思考问题,使学生将主要精力放在对统计与概率意义的理解上.利用计算器和计算机等信息技术可以为我们教学提高有力的支持,使学生更直观、更有效地经历数据分析的相关操作,在平时的教学中,我们要合理地利用信息技术等多媒体设备,为教学服务,更好地提高学生的课堂学习效果.

4加强统计与概率知识之间以及与其它知识的联系

弗赖登塔尔针对概率教学指出:“学生刚刚学过分数以后,就可以把概率渗透到所有的数学中去.这样做不仅可为以后的概率教学带来方便,而且能使学生学的数学更加接近现实.”[5]从江苏科学技术出版社出版的初中数学教材内容设置以及徐州市中考数学试卷的考查试题两个方面进行分析,发现在初中阶段统计与概率知识的教学和考查是分开设置的,其中七年级《数据的离散程度》、九年级上册第八章《统计的简单应用》、九年级下册第九章《概率的简单应用》.从中我们可以看出,教材中统计与概率内容设置时间跨度较长,学生对于这部分知识的学习会出现一定程度的遗忘.为了更好地促进学生的数据分析观念的提升,在平时的教学中,我们要加强统计与概率之间以及它们与其它知识之间的联系.将统计与概率内容的教学渗透到平时的教学工作中去.例如,在学习了正方形的性质和三角形相似的性质之后,我们可以设置这样关于几何概型的试题.如图1所示,小华同学随机地在对角线为3cm和4cm的菱形区域内投针,则针扎到其内切圆区域的概率是多少?

如图2,已知等边aBC的面积为4,D、e分别为aB、aC的中点,若向图中随机抛掷一枚飞镖,飞镖落在阴影区域的概率是多少?(不考虑落在线上的情形)

通过对以上问题的解决不仅可以很好地解决统计与概率内容在教材中设置的中断所带来的知识遗忘,还可以更好地推进学生对不同数学思想的应用,理解数学知识之间的联系,进而建立稳定而正确的知识体系,进一步提升数据分析观念.

参考文献

[1]中华人民共和国教育部.全日制义务教育数学课程标准(2011年版)[S].北京:北京师范大学出版社,2011:6.

[2]史宁中.数学思想概论第1辑[m].长春:东北师范大学出版社,2008.

[3]李士崎,吴颖康主编.数学教学心理学[m].上海:华东师范大学出版社,2011.

[4]史宁中,张丹,赵迪.“数据分析观念”的内涵及教学建议[J].课程・教材・教法,2008(6):44.

数据统计分析学习篇9

关键词:数据挖掘;moodle

moodle网络学习平台,是基于社会建构主义教育理论而开发的课程管理系统(CmS)。我校自2006年开始学习和使用moodle平台来支持教学,积累了大量的复杂数据,如何充分有效地使用这些数据成为了一个新课题。在读了涂子沛老师的《大数据》后发现数据挖掘是一种有效利用这些数据的方法。目前,数据挖掘技术已经在商业领域得到了广泛使用,如银行、股市、保险、医药、零售等。将其应用于教育领域,势必成为教育信息化发展的一种重要趋势。

本研究选取本校利用moodle搭建的网络学习平台,以2007~2012年学生学习数据作为研究对象,平台(网址:http:///moodle)开设了初中阶段的全部课程,特别是信息技术课全程在平台上开展教学,学生通过moodle平台开展学习,并通过平台提交自己的学习成果,利用平台进行学习效果检测。选取2008级学生(2011年毕业)作全程跟踪研究样本。选取2007级~2010级学生作对比研究样本。

本研究立足于基础教育,以期在普通中学从事教学工作的教师都能从本研究中获益,所以只采用moodle平台本身提供一些表格,利用excel对研究样本开展moodle平台日志挖掘、测验数据挖掘和互动评价数据挖掘研究,以期探索网络学习活动分布特点,师生交互、生生交互的网络结构特点,为网络学习平台上辅助教学的开展情况及教师利用网络开展教学支持服务提供参考。

访问日志的数据挖掘

网络平台都提供了访问日志的功能,记录用户对平台的访问情况。通过分析这些数据,能了解学生的学习偏好、上网时间、感兴趣学科、影响网络学习的因素等。moodle平台对访问情况的记录包括日志、活动报表、参与报表三部分(moodle2.3变为“日志”、“时时日志”、“课程活动”、“课程成员”又添加一个“时时日志”,其他三项为翻译不同)。“日志”记录了全体用户所访问的平台模块、各种操作以及发生的时间;“活动报表”利用日志数据表,对该门课程中访问平台各个模块的具体情况进行分类汇总;“参与报表”可以得到具体学生和教师的访问平台模块和各类操作行为情况、学生的访问平台时间特点等,并对其进行统计和分析,将分析结果进行可视化表示。

1.对平台模块总体访问情况──日志

下页表1是同一门课程学习过程中,2007~2010级5个人数相等或相近班级,师生访问平台的统计结果。从统计结果可知,师生最初对平台的应用不是很熟练,局限于资源浏览、作业提交等操作;2009级9班和10班由不同教师分别设计上课,产生的数据差距说明课堂参与程度与教师对课程的设计是有关联的;2010级的两个班也是不同老师授课,但课程设计是在往年集体设计基础上的不断完善和改进。由此可见这种基于moodle平台的集体备课更容易实现资源共享和流程化的管理,可以更有效地通过技术来弥补教师人格魅力的不足,这样就可将教师的差异性对学生学习效果影响降至最低。

2.对活动的参与情况──活动报表

下面以2009级和2010级学生为统计对象,对同一学习主题的学生在各个活动模块中的参与情况进行统计,结果如表2所示,表中主要统计了五次“互动评价”活动和一次“测验”活动的参与次数。从表2可以看出,2010级学生的参与率远高于2009级,主要原因是因为教师在2010级设计教学时,实行了“代币制”奖励(奖励可以为一段有趣动画、一个能拨号上网的账号或一个QQ号等),学生如果在“互动评价”和“测验”中达到某个标准就能获得一个奖励,而前几级都是采用教师检查督促的方法。通过统计发现,实行“代币制”奖励后,学生参与活动的次数达到之前的2~4倍。说明对于初中阶段的学生这种“代币制”奖励依然有效,且由于moodle平台统计是即时性质的,学生只要达到要求,moodle平台将自动出现奖励,所以在网络平台上使用效果会更加及时有效。这一点可以通过完成此活动时间跨度的数据挖掘得以验证。

3.对具体模块的参与情况──参与报表

这一报表可以对具体学生,对具体模块的参与情况做出更加细致的统计,通过这些数据挖掘可以发现某个学生,对哪个模块感兴趣以及对应产生的效果。本研究选取了五名偏科生进行了研究,发现学生的学习成绩和学科模块的参与情况统计是正相关的,教师可以参照参与活动不活跃的学生,开展有针对的教学干预。如何利用moodle平台对其加以纠正,又将是进一步研究的一个方向。

从上述分析可知,通过挖掘moodle平台日志,我们可以了解moodle平台各模块的访问频率、了解学生在平台中所开展的各种活动的状况、发现学生的学习偏好,并依据学生的平台访问行为对学生进行归类,这些挖掘得到的信息将有助于教师改进教学活动设计和对学生学习情况的把握。

测验数据的挖掘

在传统教学中,教师一般通过考试分数对学生的学习效果进行评价,而对于试题分析、试卷分析、学生题目完成情况分析却由于传统纸质试卷统计上的费时费力,变得很难完成,从而使教学评价的作用不能有效发挥,网络学习平台在这些方面是有优势的。moodle平台的测验模块有很好的统计分析功能,既有全体学生整体完成情况统计,又有具体到每一位学生每一个问题的单项分析(如下页表3所示)。目前,采取数据挖掘技术对学生进行成绩分析,可以从以下几个方面入手:

1.试题分析

在测验结构分析中,对那些存在异常情况的试题(如30题平台会以红色显示)进行标记,并利用平台记录的数据对试题进行校正。每个试题的采用容易度指数在50%~70%之间均匀分布为最好。这一界限的设定将直接反应题目的鉴别能力。通过对题目进行难易程度的划分,可以对试题进行一个良性的评价,同时有利于对学生学习情况的科学评价,还有利于教师有针对性地对题目进行讲解。

2.试卷分析

如下页表3前两行所示,对本次考试总体成绩及试卷进行了分析,在数据挖掘中,对试题的难度使用首次答题平均分和成绩中值表示,这个数据将可以为试卷的组成提供选题的根据,从而对考试分数的分布偏度和分布形态产生直接的影响。理想情况下,整个试卷的分数分布偏度为0,本次测验为负偏度说明题目较容易。

3.学生分析

moodle平台的测验模式有多种,本测验设置了多次试答取最高分显示模式,以便学生在考试或者测试后立即获得成绩和排名,通过“回顾”找到自己学习知识点的优势和不足,及时调整下一步的努力方向。因此可以通过数据挖掘技术对学生的多次试答成绩进行分析,从而分析学生的进步情况、学习障碍、知识点和知识单元的掌握情况等,还可以利用一些更复杂的分析工具对其进行各科目测试成绩的横向比较。

总之,利用这些信息,教师可以持续地对测验进行维护。例如,教师可以删除不规范的题目,修改太难或太简单的问题。这些分析结果可为学生了解自己的学习状况、教师监控学生的学习状况提供参考,并为教师做出教学决策提供依据。

目前应用存在的主要问题有:①某些学科试题编辑的难度大,如数学、物理、化学等学科涉及一些特殊符号,在试题编辑时一些填空、证明、计算题设计有一定难度。令人欣慰的是moodle平台是个开放性平台,全世界对它感兴趣的人都在不断完善它,如wiRiS就是一个专门为数学开发的插件,利用它可以完成大部分数学试题编辑。②有些题目还无法实现自动判分,不能及时反馈,如语文、英语学科的作文就只能辅助以人工判分。

moodle平台的互动评价(workshop)的数据挖掘

“互动评价”是其他网络学习平台所不具备的,moodle平台的互动评价是为教学“量身定制”的,评价可以具体到学生作品的某个具体的点,并且能用具体的分数和等级体现。互动评价是同学间的评价。即由同班级学生,针对某个作品进行学习成果互评。在此过程中,学生的角色不再只是被评价者,不只是完成自己的作业,还要对别人的作品进行评价,因此要仔细欣赏别人的作品,表达自己的观点、提出批判及建议的同时也要学习别人的优点。而就被评者的角色而言,学生在接受别人的建议后,进一步修改作品。通过反复的评价及修改,在互动评价过程中,学生们可以借此不断地累积学习经验。所以互动评价不只是评价,其过程更是一个学习的过程。而“学生自评”顾名思义就是学生根据教师给出的评价标准和自己的完成过程及满意程度给自己的作品做出评价,是学生提高自我认识、促进自我反省的过程。对互动评价的数据挖掘主要从以下三方面进行。

1.教师参与情况统计分析

moodle2.0后的版本对互动评价进行了改写,将教师和学生置于同等位置,减小了教师对学生的评价干预。通过两种评价比较分析发现,如果评价设计合理,不仅能正确评价学生,并且更有利于培养学生公正评价自己和他人的态度。

2.学生评价对象分配统计分析

moodle2.0后的版本中学生的评价对象既可以随机分配也可以手动分配。为促使小组成员公正互评,防止恶评,可以进行分组用组成绩评价学生,分配时“启用防止同组学生互评”选项,每一个作品评价人数和每一个成员评价作品数都控制在5人以上,这样每一学生对同一作品评价行为都受到其他人制约。通过对不同版本评价的数据研究发现,在学生的时间允许情况下,参与评价的人数越多评价结果越趋于合理。

3.学生评价数据的统计分析

最初使用互动评价时,采用了让学生对评价作品打分方法评价作品。弊端是学生评价作品标准不同,而且学生很难区分分数细微差别。随着应用深入,在评价表中设计了“是/否”、“好/中/差”(3级)、“很好/好/中/差/很差”(5级)等评价标准,结合打分方法,使得学生对作品既有定量评价,又有定性评价。通过对比研究发现评价结果更加趋于合理。

总之,通过对网络课程的数据进行挖掘,可为教师提供如学生在线参与学习活动情况、学生的学习偏好、学习效果等信息,通过这些信息教师可以进一步改进教学策略,以提高教学效果和质量。通过研究发现教师在课程中的主导作用在逐渐淡化,成为了课程设计的“幕后导演”,虽然没有了“主演”的风光,却从更深层次决定了课程的质量。

参考文献:

[1]涂子沛.大数据[m].桂林:广西师范大学出版社,2012.

[2]黎加厚.信息化课程设计——moodle信息化学习环境的创设[m].上海:华东师范大学出版社,2007.

[3]魏顺平.moodle平台数据挖掘研究[J].中国远程教育,2011(01).

[4]王全旺,赵兵川.数据挖掘技术在moodle课程管理系统中的应用研究[J].电化教育研究,2011(11).

[5]李钊,熊威,李琪.数据挖掘在moodle平台中的应用浅析[J].计算机光盘软件与应用,2011(12).

数据统计分析学习篇10

关键词:云计算;学习行为;模式识别;在线教学系统

中图分类号:tp39文献标识码:a文章编号:1673—8454(2012)17—0014—03

一、引言

随着计算机网络技术的飞速发展,在线教学系统被大量应用到实际教学中,并已被学生和用户广泛接受,各种教学技术和教学模式经过几十年的发展也逐渐成熟。相比传统教学模式,远程教学系统突破了传统学习方式在时间和空间上的限制,使教与学不再受地域、时间的限制,但其依然存在诸多不足之处,例如:在线教学系统对个性化教学支持不够等等。随着应用的深入,一些原来课堂教学中没有出现的问题也暴露出来,例如:学生和教师分离的问题、学生学习评价的问题。因此,如何进一步改进远程教学系统和改善教学效果,已经成为当前教学研究领域的热点。

在线教学系统中最主要的问题是无法满足学生个性化学习的需要,由于在线教学系统学习者动态且不可控,而且教师和学生之间缺少交流,导致传统的教师人工介入很难在在线教学系统中真正运用,而学习者本身所具有的主观性、模糊性和随机不确定性等特点,又导致传统的学习模式很难满足要求。因此,如何完成对远程学习者学习行为模式的智能识别,挖掘其个性化学习习惯,并据此对在线学习模式进行动态调整,是建立真正的智能化在线个性学习系统的关键问题。

云计算在智能控制和预测、数据挖掘、概念提升以及数据聚类、系统评估、评价决策分析等领域已经得到了成功运用,这种先进技术和理念在教学领域的引入,可以提供海量的分析样本和强大的逻辑计算能力,从而为学习行为模式的智能快速识别提供了技术上的可能,很多在线学习系统改进方面的技术难题有望得到解决。

本文在云计算和模式识别的研究背景下,针对现有在线教学系统进一步改进中所存在的困难和问题,展开了对学习行为模式识别相关技术和理论的研究和应用工作,提出了一些解决问题的思路和方法。

二、研究现状

1970年,Carbonell等人(BoltBeranekandnewman,BBn公司)开发出教授南美洲地理情况的SCHoLaR系统,该系统研究了教学法策略和人类的似真推理,被认为是第一个有代表性的智能教学系统。尽管教育界对于能够识别学习者并提供个性化教学的教学系统一直保持着极大的兴趣,但由于早期计算机系统的性能对于适应性诊断和反馈来讲是非常有限的,很难满足智能教学分析的需要,因此这期间的研究,主要侧重于以实验性系统的教学理论研究。

进入21世纪后,伴随着教育技术的进一步发展,尤其是云计算等先进技术的广泛应用,智能教学研究继续向前发展。已有研究机构在具体的识别算法等方面开展了一些研究,如个性化信息需求特征的定义、个性化信息挖掘算法、个性化信息获取系统以及智能评价系统的研究等,并取得了一些成果。例如,南加州大学的RiDeS(rapiditSdevelopmentenvironment)是智能教学系统开发工具,北卡大学的inStRUCt(implementingthenCtmschoolteachingrecommendationsusingcollaborativetelecommunications)、斯坦福大学的mmap(middleschoolmathematicsthroughapplicationsprojects)是协作型教学模式的教学系统等等。

三、基于云的学习行为模式分析系统架构

传统的研究方式一般仅局限于单一教学系统的研究,因此即使建立了相对完整的分析算法,但受限于分析样本数量有限,得到的结果价值往往比较有限。所以,可以考虑将学习行为模式分析的范围从单一的教学系统扩展到互联网所有的教学系统中,利用云计算技术,将存放于不同区域、不同环境中的教学资源和功能通过服务的方式连接起来,通过建设统一的学习行为分析公有云来对学习者的学习行为进行分析,从而提高分析结果的准确性。这种分析方法本质上是采用了概率和数理统计的思路,通过利用云计算对海量数据的处理能力对大量样本的学习行为模式进行分析,从而区分出各种学习行为模式之间的差异,并从总体上区分出正面的学习行为模式。图1描述了基于云的学习行为分析网络架构。

在线教学系统的重要基础是网络,网络基础设施的情况直接影响着在线教学系统的应用效果。通过不同的基础网络将教学资源和学习行为数据分开,将教学系统架构在各自的私有云基础之上,把学习行为分析数据建设在公有云基础上。一方面,可以提供一个相对高速和可控的网络环境,满足教学资源访问和维护的需要。另一方面,可以减少建设独立的学习行为分析系统所需的软硬件投资。具体的学习分析功能在云端进行,并通过统一的服务调用中心为各个教学系统提供服务。教学系统只须将其学习行为数据提交到位于云端的学习行为分析系统,就可以充分利用云计算对海量数据的分析和处理能力,无须关心学习者的学习行为数据是怎么处理、怎么存放的,只要根据返回的分析结构对教学资源进行动态调整即可,从而实现了学习行为分析服务对各教学系统的透明性。

四、基于云的学习行为模式分析实现方案