首页范文大全数据分析工作经验总结十篇数据分析工作经验总结十篇

数据分析工作经验总结十篇

发布时间:2024-04-25 02:17:58

数据分析工作经验总结篇1

关键词:工业生产总值;上证指数;回归分析;格兰杰因果检验

我国股市是否确实起到了宏观经济的“晴雨表”作用,宏观经济数据与我国上证指数变动是否存在必然联系还是互为因果关系。选取工业总产值这一基本的宏观经济数据,借助于计算机科技,通过多元统计软件的应用,试图通过对该数据的挖掘进行回归分析,并在此基础上采用格兰杰因果关系检验的方法,探寻我国工业生产总值与上证指数的内在联系。

工业生产总值(GrossindustrialoutputValue),工业总产值是以货币形式表现的、工业企业在一定时期内生产的工业最终产品或提供的工业性劳务活动的总价值量。回归分析(regressionanalysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。多元线性回归格兰杰因果检验方法为2003年诺贝尔经济学奖得主克莱夫·格兰杰(Clivew.J.Granger)所开创,用于分析经济变量之间的因果关系。他给因果关系的定义是“依赖于使用过去某些时点上所有信息的最佳最小二乘预测的方差。”

样本为国家统计局公布的2009年至2012年的工业生产总值原始数据,数据处理与模型设计的简要思路为:

首先对工业生产总值对上证指数的一元回归分析,设有两个变量x和y,变量y的取值随变量x取值的变化而变化,接着对相关数据进行拆分,即将多个变量引进,将模型设定为一个多元回归模型,通过显著性检验,拟合度可接受范围内,进行模型变换及oLS回归分析及检验,最后在符合平稳性前提条件下,进行格兰杰因果关系检验。具体模型设计数据研究过程可参阅作者《2010年至2012年度我国工业生产总值与上证指数的因果关联的可能性研究》一文,在此特别感谢上海师范大学金融学院投资系主任张毅对该文章研究思路与检验方法提供的帮助与指导。

其中回归系数的t检验表面变量的变动对上证指数的走势有着显著地影响;F检验的检验结果表明解释变量与被解释变量之间有着显著地线性关系。在随机扰动项的标准差可以看出,工业生产总值的相关数据在预测上证指数是平均误差并不大。所以我国工业生产总值的波动确实会一定程度上影响我国上证指数。但是两者的拟合有度都相对较低,其中工业总产值同比增长比率所得出的数据更符合经济意义,由于上证指数本身存在的决定性因素较多,影响股票价格指数的原因会由政策因素、投资者心理、宏观经济现状等多个方面影响,所以众多因素无法用一个简单的数量化模型来计算得出的。所以拟合有度在0.3~0.5之间是一个可以接受的范围。通过oLS检验可以发现加入的两个变量中从检验结果可以看出解释变量轻工业的月度同比增长百分比的t值无法经过显著性检验,但是模型的拟合有度有所提升。

可以看出,上证指数与工业生产总值存在着相关关系。但是由于将数据细分后点的检验结果并没有使模型优化所以我们依旧选取单因素模型作为研究模型。其次两个数据间的相关性是否可靠,数据是否不平稳而导致所谓的“伪回归”现象还不明确。为了区分两个数据究竟谁因谁果,故需对结果进行格兰杰因果检验分析。

值得注意的是,进行格兰杰因果关系检验的一个前提条件是时间序列必须具有平稳性,否则可能会出现虚假回归问题。因此在进行格兰杰因果关系检验之前首先应对各指标时间序列的平稳性进行单位根检验。模型采用的平稳性检验方法为aDF检验。设工业生产总值增加额(X)、上证指数(Y)、工业生产总值同比增长百分比的对数(LoG(Z))、上证指数的对数(LoG(Y))、上证指数变换量(YC)等数据。在1%显著水平下,原4个时间序列均都通过aDF检验,表明原始序列存在单位根,是平稳序列。同时在显著水平为5%与10%时也同时通过了检验。根据aDF检验的最终结果以及本文格兰杰因果检验的实际意义出发,选取在1%显著水平之下通过平稳性检验的时间序列X、Y、LZ、LY这个4个时间序列进行格兰杰因果检验来探明工业生产总值数据和上证指数的因果关系。

在选定了研究变量之后,根据不同变量所代表的实际意义,本文将格兰杰因果检验的过程分为两个检验,一组将对上证指数和工业生产总值的增加值的因果检验,另一组是对上证指数和工业生产总值同比增长百分比这两个数据的对数做因果检验。通过检验分析得出上证指数的变动率是工业生产总值同比增长变动率的格兰杰因,而工业生产总值同比增长变动率却不是上证指数变动率的格兰杰因。

格兰杰因果检验的结果显示,股票价格的变动的确能够反映宏观经济趋势的变动,即稳重的上证指数的变动率确实能够反映工业生产总值的变动率。表明了股票市场在一定程度上起到了经济“晴雨表”的作用。但是工业生产总值并直接不能很好的反映股市,其存在一定的滞后性。这个也符合实际,工业生产总值所代表的中国工业将在5个月后逐步开始影响我国a股市场。同时也可能是2009年的中国股市快速下跌后这样使得广大投资者对于市场的信心开始不足,对于各类数据与经济预期存在着比较敏感的反应。致使中国的上证指数尽在47%的条件下对市场中的宏观数据中的工业数据产生影响。

这样看来,我国工业生产总值的增速变动将对我国的证券市场的波动起到了作用。投资者可以通过工业生产总值对股市进行预判,在5个月前若我国工业总产值开始下跌后投资者就可以对将来的股市可以进行预判,其中可以得知我国股市下跌的预期还是十分大的。

通过研究表明,我国的工业生产总值的走势确实会对我国的上证走势有着影响,其中工业生产总值同比增长值与上证指数为显著地正相关关系。这样可以看出,当我国的宏观经济总是发生变动其中一旦工业生产总值增速变动当工业总产值加速向上时这预期将会给投资者带来投资的预期。随着滞后反应的存在导致我国股市会上涨。工业生产总值在投资者中并不是一个广泛使用的宏观经济指标,所以两者的关系将会给投资者带来投资的机会。

但是从研究中发现,工业生产总值的增加值却和上证指数为负相关关系,这个相对比较难给出实际的经济意义。我认为随着我国经济的全球化得过程中,我国汇率的波动以及近几年通货膨胀率不断上升可能在工业总产值的数据中有所体现同时影响其对于上证指数的关系。所以从这个角度可以解释了我国的工业生产总值变动值和上证指数为负相关。

最后我们也要注意到几个解释变量的回归模型的拟合有度,模型的拟合有度相对较低,这说明影响上证指数的因素有许多。这样使得光光依靠工业生产总值相关数据对我国上证指数进行解释显得十分的片面。

数据分析工作经验总结篇2

关键词:数据统计;有指导判别分析模型;经济数据;比较分析

中图分类号:o212文献标识码:a

文章编号:1009-2374 (2010)21-0087-02

随着我国市场经济的深入发展与发达国家遭遇金融危机的重创经验表明我国经济持续、快速增长,引起了世界的关注,而作为衡量经济发展规模和水平的经济统计数据及其质量也成为国内外相关机构及研究者关注的重点。经济统计数据质量无论是对国家制定发展战略,还是对企业制定营销策略都起着不可或缺的重要作用。因此,对政府统计数据质量作出科学的评估,探讨其运用理论与模型显得尤为重要。

1经济统计的常用理论技术分析

1.1比较分析技术

经济统计数据质量的比较分析技术是通过实际执行的统计过程及结果与相应的理想统计过程及统计真值进行比较,从而找出统计数据质量存在的问题及差距,确定数据质量水平,并制定相应的控制措施的技术方法。我国经济统计数据质量控制比较分析技术体系包括以下四种类型:

1.1.1统计工作程序法此方法是以我国经济统计工作规范或制定的统计方案为标准检验经济统计数据搜集和整理各环节的实际工作质量,据以评估统计数据质量。叶长法、岑国荣提出,根据工作规范检验统计数据的采集和整理各环节的实际工作作为依据,评估统计数据的质量。对全面调查取得的数据,以现行的统计制度规定为依据,从指标的范围、口径、资料来源渠道、计算方法等方面进行检验;对抽样调查取得的数据,以国家统计制度规定的有关调查基础工作范畴为依据,从抽样方法、抽样误差、抽样调查技术操作等方面进行检验。

1.1.2统计数据标准法此方法是以统计工作实际获得的统计数据与相应的统计数据质量标准或统计数据的真值,以及客观存在的各种真值的数量关系进行比较,从而评估统计数据质量。实际应用中包括与独立来源的统计数据进行比较,利用逻辑关系进行分析比较,与统计指标真值之间客观存在的相关关系进行比较分析,与统计指标的影响因素进行分析评价,动态趋势对比评价。

1.1.3复查检验与抽样评估方法此方法是对需要检验其数据质量的某些指标重复进行调查,将原调查的数据与重新调查的数据进行比较,揭示原来调查数据的误差。

1.1.4数理统计检验法此方法主要是利用数量统计方法所形成的一些理论公式或经验公式,将调查汇总完毕的数据带入公式,计算相应的数据,与规定的标准值比较或与其他国家,其他地区同一指数比较,据以评价数据质量,主要方法包括抽样调查法,回归分析法,趋势预测法,方差分析。

比较分析方法的优点在于该方法是建立在统计工作及其结果的实际数据与统计标准和统计数据真值比较的基础上的,对统计数据更加直接和具体,有助于对统计数据质量水平作出切合实际的评价。同时,比较分析的方法原理简单易于理解;局限性在于其应用条件是统计数据质量证据和标准,但在实际工作中,获得质量证据以及统计数据真值比较困难。

1.2探索性数据分析技术

随着探索性数据分析方法的产生和发展,探索性数据分析技术与方法已日益成为统计数据质量控制比较分析技术中的重要构成部分。有研究以我国开发区高新技术企业主要经济指标的数据为例,就探索性数据分析方法特别是茎叶图法用于统计汇总数据质量进行了探讨。首先用茎叶图法找出汇总数据中的极端值,然后从横向和纵向两方面判别极端值是否存在数据质量问题。

2有指导判别分析模型在经济统计数据质量控制中的应用

判别分析、二元选择模型和神经网络都是根据以往的资料积累或质量记录,通过建立模型来判断新数据的数据质量是否存在质量问题,可以称作有指导判别或建模判别。统计汇总数据的质量控制由于是处于调查工作过程之中,工作量大,如果对汇总数据的质量能够利用模型来进行,则可以实现成批量地进行控制并且可以节约时间,进而可以减少工作量,提高数据质量控制的效率。下面将具体探讨判别分析模型在经济统计数据质量控制中的应用:

2.1判别分析模型的原理

设有m个总体,G1,G2,Gm,它们的先验概率分别为q1,q2,qmm,密度函数为f1(X),f2(X)……fm(X)

(在离散情形是概率函数),在观测到一个样品x的情况下,可用贝叶斯公式计算它来自第g个总体的后验概率:

并且当p(h/x)maxp(g/x)时,判定X来自第h个总体。另外,有时为了合理考虑错判所带来的损失,还使用错判损失最小的概率确定判别函数。但由于实际应用中,经常在数学模型中假定各种错判的损失皆相等,这样,寻找h使后验概率最大实际上等价于使错判损失最小。根据上述思想,在假定协方差矩阵相等的条件下,即可以导出判别函数。

2.2判别分析模型的基本思想

逐步判别模型和通常的判别分析一样,也有许多不同的原则,从而产生各种方法。这里讨论的逐步判别分析方法是在多类判别分析基础上发展起来的一种方法,判别准则为贝叶斯判别函数。其基本思路类似于逐步回归分析,采用“有进有出”的算法,即按照变量是否重要,从而引入变量,每引入一个“最重要”的变量进入判别式,同时要考虑较早引入的变量是否由于其后的新变量的引入使之丧失了重要性变得不再显著了,应及时从判别式中把它剔除,直到判别式中没有不重要的变量需要剔除,剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。也就是说,每步引入或剔除变量,都作相应的统计检验,使最后的贝叶斯判别函数仅保留“重要”的变量。

2.3判别分析模型应用的可行性

判别分析所要解决的问题是在已知研究对象用某种方法分成若干类的情况下,确定新的观测数据属于已知类别的哪一类。因此,如果在统计汇总之前,根据以往的资料积累或质量记录,得到上报数据中有质量问题的类和没有质量问题的类,据此建立判别模型,则该模型可以用于对未来的上报数据直接进行质量判别,进而可以对有数据质量问题的地区进行数据质量控制。

2.4判别分析模型应用的措施

在经济数据统计中,我们按经验将统计工作分2个层次,分别是进行基础数据收集的基层,将基础数据进行汇总后形成的高层。现分析不同层的特点:(1)基层:由于我国国情决定,基层统计工作者的统计水平不高,而且基层获得的大多是没有经过汇总处理的原始数据,不宜建立回归分析或判别分析等比较复杂的统计模型去判断或预测基层数据质量的好坏。而且基层数据量往往是整个统计过程中最初始的也是最重要的部分,如果没有一个准确且高效的质量检测和控制系统很难在基层把好关。所以笔者建议在基层使用探索性数据分析方法和神经网络方法。因为探索性数据分析方法易于理解、操作简单,而神经网络方法适于大规模数据的分析工作且对数据类型的要求也不像其他方法一样严格。两种方法的应用和相互验证可以为整个统计工作把好第一关。(2)高层:高层阶段,数据已经进行了初步的汇总,此阶段的数据大多集中在官方的综合统计机构,统计专业人员素质较高,能熟练运用各种高级统计分析方法,因而比较分析技术在这个阶段更适用。同时,由于在实际的数据质量控制应用中,可能无法根据以往的资料积累或质量记录获取关于数据质量的历史数据,所以可以首先应用探索性数据分析方法找出极端值,对可能存在质量问题的数据先有一个直观的了解,再运用应用比较分析技术对数据质量进行进一步的判别和预测。最后,将各种判别方法的判别结果进行交叉验证,对相互验证后有3~4个方法都认为有质量问题的个案加强监督,找出问题存在的原因;对在1~2个方法中都表现出有数据质量问题的个案首先要求该个案进行自我检查,同时相关控制部门应从数据特征着手,找出数据质量存在的原因并加以控制,这样会使我国经济统计数据质量控制体系更加完善,从而能够提高统计数据的质量。

总之,随着经济的发展,经济统计数据理论与模型中的许多问题在今后还需要继续深入地研究与探讨,特别是随着未来经济统计技术水平的提高,经济统计机构外部环境的变化,经济统计数据用户需求的变化,以及信息产业的高度发达,这些都会对经济统计数据理论与模型水平,统计数据理论与模型技术产生影响和提出挑战。

参考文献

[1]常宁.imF的数据质量评估框架及启示[J].统计研究,2004,(1).

[2]陈颖.税务稽查选案技术方法研究[D].硕士学位论文,天津大学,2004.

[3]成邦文,师汉民,王齐庄.多维统计数据质量检验与异常点识别的模型与方法[J].数学的实践与认识,2003,(4).

[4]达摩达尔.n・古扎拉蒂著,费剑平译.计量经济学基础[m].北京:中国人民大学出版社,2005.

[5]傅德印.从管理学角度看我国经济统计数据质量[J].兰州商学院学报,2003,(2).

数据分析工作经验总结篇3

关键词:因子分析;聚类分析;判别分析:经济发展

一、引言

当今社会是一个信息爆炸的时代,社会中存在多种不确定性,所以要正确使用数据分析方法进行数据分析,有效提取信息是生活中决策的关键。我国经济发展水平是大家都很关心的问题,它关系到人民的生活水平,社会的发展程度以及国家的综合国力,因此研究我国各地区的经济发展水平非常有必要。

因子分析、聚类分析和判别分析是多元统计分析中三个重要的分析方法。本文针对2005年全国31个省市自治区直辖市(除港澳台地区外)的主要经济发展指标,先后运用因子分析方法、聚类分析方法和判别分析方法,进行分析评价。

二、文献综述

目前,针对区域经济的研究很多,随着研究地不断深入,越来越多的定量方法被引入进来。吴玉鸣在采用因子分析法对我国31个行政区划的第三产业综合发展水平进行了评估,提出实施第三产业非均衡协调发展战略。梁晓俐对全国30个行政区划的经济发展水平进行了主成分分析,根据因子加权综合得分进行分类排序,得到全国的经济发展水平总体上呈现东高西低的地域分布。这几篇文章都只是对各地区经济发展水平进行了排序,并没有很好地进行分类,不利于看出各个地区经济发展的快慢情况。陈佳、吴润衡、刘喜波先后运用因子分析方法和聚类分析方法针对2004年全国31个省市自治区直辖市(除港澳台地区外)的26个主要经济发展指标进行分析评价。王维、李仕明、肖磊先后运用因子分析方法和聚类分析方法,对全国31个省、市、自治区的地区经济发展水平进行动态分析。这几篇文献使用的数据都已经比较陈旧,不能反映近几年的经济发展。为了弥补以上不足,本文对全国2006年的经济数据进行分析,首先对所选的经济指标做因子分析,科学有效地缩减指标规模,得出三个意义较为明确的公共因子,再用聚类分析方法,得到各地区经济发展层次分布状况,最后用判别分析方法看所选方法的判断准确性。

三、样本数据

本文选取了2005年全国地区23个主要经济发展指标(数据来源:《中国国家统计年鉴2006》):年底人口数(万人);就业人员(万人);职工人数(万人);地区生产总值(亿元);人均地区生产总值(元);商品房销售额(万元);竣工房屋面积(万平方米);房屋住宅销售面积(万平方米);职工平均工资(元);旅游外汇收入(百万美元);社会消费品零售总额(亿元);各地区货物周转量(亿吨公里);各地区货运量(万吨);各地区客运量(万人);城镇居民平均每人全年总收入(元);农村居民平均每人全年总收入(元);城镇居民全年最终消费支出(亿元);农村居民全年最终消费支出(亿元);城镇固定资产投资(亿元);外商投资总额(亿美元);税金总额(万元);利润总额(亿元);工业增加值(亿元)。

四、统计分析

本文采用SpSS11.5进行统计分析。

(一)对原始数据的因子分析和主成分分析

1、Kmo检验与Bartlett球度检验(见表1)。Kom值是用于比较观测相关系数值与偏相关系数值的一个指标,其值越逼近于1,表示对这些变量进行因子分析的效果越好。本样本的Kom值为0.792,适合因子分析,而且可以得到比较满意的结果。而且,Bartlett球度检验的显著性概率为0.000小于显著性水平0.05,也说明适合因子分析。

2、旋转后的因子载荷矩阵。利用SpSS提取了三个因子,因为未经旋转的载荷矩阵中,因子变量在许多变量上都有较高的载荷,为了使因子更具直观含义,所以运用方差极大法对因子载荷矩阵旋转。因子1包括年底人口数、就业人员、职工人数、地区生产总值、房屋住宅销售面积、社会消费品零售总额、各地区货运量、各地区客运量、城镇居民全年最终消费支出、农民居民全年最终消费支出、城镇固定资产投资、利润总额和工业增加值,主要反映经济总量和人民生活水平,所以可以命名为经济总量因子;因子2包括人均地区生产总值、商品房销售额、竣工房屋面积、职工平均工资旅游外汇收入、城镇居民平均每人全年总收入、农村居民平均每人全年总收入、外商投资总额和税金总额,反映的是全社会各方面收入情况,可以命名为收入因子;因子3只有各地区货物周转量这一个变量,这个变量对于我国经济发展具有重要作用,所以可以命名为经济发展因子。

3、因子得分函数。根据因子得分矩阵,可以得到因子得分函数:

(二)对综合得分数据的聚类分析

对全国各地区经济发展水平进行3-6类的聚类分析,类间距离为类间平均链锁法,样本间距离为欧式距离平方法。通过对比发现分为四类是比较恰当的,能够体现各省市经济发展的快慢情况。分成四类时:北京和上海属于第一类;江苏、浙江和山东属于第三类;广东属于第四类;其他属于第二类。我们分析不同类的地区时同样采用指标平均值。

通过分析各类均值结果,可以得出各类地区所选取的经济指标方面发展的水平情况,综合分析就可得出各类地区的发展水平。

(三)对各类进行判别分析

因为本身所选的样品就比较少,所以没有从中抽调一些分析,这样我们可以用交互验证的方法来判别聚类效果优劣(见表2)。

表2显示了交互验证结果。可以看到该判别函数的准确率为100%,交互验证的结果和自身验证的结果完全相同,因此该判别函数是较为稳定的。

五、结论

应该说本文的分析结果对于宏观地考察地区经济发展状况以及对各地区制定和调整经济发展战略是具有一定的实际意义的。

从因子分析的结果来看,因子l包含了全部信息的65.136%,这说明我国经济的发展主要是经济总量的增长。

以下几个问题值得我们注意:城镇固定资产投资额的载荷较高,所以投资热问题是我们一直比较关注的;人口因素的载荷也是比较高,说明人口因素在中国经济增长中所起的作用不容忽视;交通运输量相关指标的载荷很大,这说明交通在经济发展中起了很重要的作用,而且从目前来看,各个城市都比较重视交通的发展。

因子2反映了一个我们现在比较关注的问题――城乡差距问题。此外,商品房和住房指标的载荷也很突出,说明2005年我国的房地产业的发展非常突出,从目前的形式来看,房地产仍然是非常热门的。

从聚类分析的结果,可以得出如下结论:2005年,经济发展最快的省份是广东;其次是江苏、浙江、山东三省;发展中等的是北京、上海;其他省份发展相对比较慢。

从判别分析的结果来看,以上分类的结果是比较理想的。

数据分析工作经验总结篇4

摘要:本文在对纺织品采用手工分解法进行含量分析时,采取经纬纱根数比取样的方式进行试验并计算,所得数据与常规方法所得数据基本一致,该方法大大缩短试验时间,提高了工作效率。

 

关键词:纺织品;纤维含量分析;重量法;方法改进

1引言

对纺织品含量的分析方法主要有溶解法和重量法(即手工分解法)。溶解法主要是针对不同纤维在不同试剂中的溶解性能,将不同种类的纤维分离出来,再通过计算得出各组分的含量[1]。而手工分解法是通过手工的方法将不同组分的纤维分离出来,计算出各组分含量。两种方法相比较而言,溶解法的覆盖面更为广泛,而手工分解法缩短了试验时间,但存在着一定的局限性;在试验过程中,溶解法所使用的化学试剂对人体和环境都有一定的危害,并且在溶解过程中会出现溶解不充分、样品掉色等问题,引起分析结果的系统误差,而手工分解法不存在这些问题。两种方法各有利弊,在样品符合手工分解法的条件下最好采用该方法进行试验,本文就如何改进手工分解法进行试验与探讨。

 

2试验

2.1试验原理

鉴别出纤维组分的纺织品通过适当的方法去除非纤维物质后,用手工分解法分解纺织品中不同种类的纤维,通过烘干、干燥、称重,得到各个组分在原试样中所占百分比[2]。

 

2.2适用范围

织物各个组分单独存在,通过手工分解方法可以分离不同种类的纤维的各种纺织品。

2.3试验仪器

分析天平(精度0.0001g);恒温鼓风烘箱(105±3)℃;干燥器(装有变色硅胶);称量皿;拆样用挑针;镊子;绒板。

2.4试样准备

棉/聚酯纤维/氨纶、棉/氨纶混纺的机织面料。

2.5试验步骤

方法一:依据标准GB/t2910.1—2009进行取样拆分;将拆分完毕的式样分别放入称量皿,做好标记。在烘箱中烘干至恒重,在干燥皿中冷却至室温,称重,计算[3]。

 

方法二:根据经纬纱的根数比,拆分总量约1/3的经纬纱;将拆分完毕的试样分别放入称量皿,做好标记。在烘箱中烘干至恒重,在干燥皿中冷却至室温,称重、计算。

3结果与讨论部分

3.1结果计算

(1)

式中:

pi——第i组分净干质量分数,%;

mi——第i组分净干质量,g;

mz——试样总净干质量,g。

3.2试验结果

按照上述两种方法对样品进行定量测试,结果如表1所示。

3.3试验讨论

3.3.1理论分析

以棉/氨纶试样为例(见图1),其中t方向为棉,w方向为聚酯纤维/氨纶。计算公式为(2)和(3)。

mZ=mt+mw=mc+ma+mb(2)

mZ=mtC+mwC+mwa=nt×dtC+nw×dwC+nw×da(3)

其中:mZ——式样的总重量;mt——经纱的重量;mw——纬纱的重量;mc——棉的重量;ma——氨纶的重量;mb——聚酯纤维的重量。mtC——经纱棉的重量;mwC——纬纱棉的重量;mwa——经纱氨纶的重量;nt——经纱根数;nw——纬纱根数;dtC——经向棉单根重量;dwC——纬向聚酯纤维单根重量;da——纬向氨纶单根重量。

 

3.3.2方法分析

以试样1数据为例(如表2所示)。该试样总重为0.2574g,其中经纱(棉)共328根;纬纱(聚酯纤维/氨纶)共204根。经纱纬纱根数比约等于8:5,所以取经纱109根、纬纱68根得到第二组数据。数据显示,第二组重量约为第一组重量的1/3,两组数据最大偏差仅为1.0%(小于FZ/t01053—2007《纺织品纤维含量的标识》所规定的含量允许偏差,即纤维允许偏差为±5%,当纤维含量≤15%时,纤维含量的允许偏差为实测值的30%)[4],而拆分时间缩短了一半。

 

试样3(见表3)试样总重为0.2271g,棉/氨纶一共171根,按照方法二拆分了1/3(即57根)的棉/氨纶混纺纱,在计算时氨纶重量乘以3再除以总重。数据显示,两组数据偏差为0.1%,证实了方法的可行性。

 

4总结

1)理论和试验表明,采用按经纬纱根数比取样进行含量分析的方法可行,两次试验的含量差均小于标准中所规定的含量允许偏差。

2)采用按经纬纱根数比取样的方法进行定量分析,大大缩短了取样时间,提高了工作效率。

3)该方法同样适用于粘纤/聚酯纤维/氨纶、棉/锦纶/氨纶等同种织造类型的织物。

参考文献:

[1]GB/t2910.1—2009纺织品定量化学分析第1部分:试验通则[S].

[2]aatCC20a—2007Fiberanalysis:Quantitative[S].

[3]FZ/t01053—2007纺织品纤维含量的标识[S].

数据分析工作经验总结篇5

1、手工做账会计实习:

手工做账会计实习,是我们模拟一个真实的企业(**股份有限公司),按照公司的经营过程、根据不同业务的发生、依据原始凭证逐笔完成该公司一个月的会计业务工作以及后续的结账、对账和财务报表工作。

2、手工财务管理实习:

手工财务管理实习,是我们根据一个企业(**股份有限公司)的历史报表数据以及一些以往的经验数据,对该公司的报表进行分析比较以及财务分析、销售预测、筹资还款分析、投资可行性分析和最佳订货批量的预定等工作。

3、用友u8会计电算化实习:

用友u8会计电算化实习,是按照手工做账会计实习的整个业务过程,从新建帐套开始,经过初始化、期初操作、填写业务凭证、科目汇总、签字、记账到最后的对账结账、出报表。与手工相对进行比较。

4、财务管理计算机实习:

财务管理计算机实习,是运用计算机操作,以excel软件为处理平台,实验内容与手工财务管理实习相同。以初始数据为基础,对表格进行编辑公式、表间取数、直接拖动获取公式定义等操作,从而最终完成最后的分析过程。

二、会计、财务管理专业实习的过程及内容:

1、手工做账会计实习:

手工做账会计实习是建立在我们对会计专业知识充分学习和认识后的实践工作。该实习历时三周时间,分为以下几个步骤:

①订立账簿:按照公司实际业务的需要,选择合适的帐页,把需要涉及

到的会计科目加盖会计科目印章(一级科目),填写会计科目的明细(二级及二级以下科目)。最后把需要的帐页装订好,即用绳系牢。其中共有四个账本,包括:总分类账、存货及固定资产明细账、成本费用帐、三栏账。

②录入期初余额:根据实习资料的数据,将该企业2007年各科目的期末余额填列到相应的总账或明细账中,摘要栏加盖“上年结转”印章。

③日常业务处理:根据实验资料所给的原始凭证,填写记账凭证。填写时要注意业务发生的日期,附件张数。另外还要注意每笔业务需要的凭证张数,需要一张以上凭证填列时,需在凭证编号后再加上一个分数(第*张凭证/共#张凭证)。最后需要在凭证下方的制单处签上制单人的姓名。做完的凭证还应拿给他人审核,审核无误后签名。

④科目汇总:当日常业务做到15号时,我们就需要对1—15日的业务进行科目汇总。首先应根据每张凭证填写科目汇总附表,然后再填列科目汇总表(汇一)。之后的汇二(15—30日业务)、汇三(31日业务)同理即可完成。

⑤记账:记账包括两个部分,即登记总账和登记明细账。我们先根据科目汇总表登记总账的借贷方发生额,再根据每一张记账凭证登记相应的明细账,此时要注意在每一笔记过帐的凭证中应作上记账标记,并在凭证右下角记账处签上记账者姓名。

⑥对账:当完成本月所有业务后,我们就需要进行对账,即总账与明细账核对,各个对应科目余额相一致时对账工作就可结束。如果出现总账与明细账科目余额不相同的情况时,应查看该科目所涉及到的每笔业务的原始凭证,查出错误并进行改正。改正时应注意用红笔划横线划去错误的,再在其上写出改正后的结果。

⑦结账:经过对账的工作后,我们可以基本保证该账务处理的正确性。因此我们就可以做结账的工作了,即把所有账簿中会计科目的余额都给结出来,并加盖“本月合计”印章,同时还需要在本月合计处划两条红线,一上一下,上线划到头,下线划到合计处。

⑧填制财务报表:财务报表包括三个部分,即利润表、资产负债表和现金流量表。以下做具体分析:

ⅰ利润表:利润表的编制相对比较简单,我们可以从总账中轻松找到与之对应可会计科目,其中:营业收入=主营业务收入+其他业务收入,营业成本=主营业务成本+其他业务成本,财务费用和资产减值损失须要根据明细账填列(这是因为这两科目有红字出现,总账只能表示出余额而不反映借贷关系),其他均可由总账得数。

ⅱ资产负债表:资产负债表的编制主要根据总分类账填列,其中应收账款、预收账款、应付账款和预付账款须要根据明细账填列,是因为以上科目可能借贷都存在余额。另外未分配利润=净利润-盈余公积-上年应付股利。

ⅲ现金流量表:现金流量表的编制需要从记账凭证开始,首先从记账凭证中找到涉及到现金流量科目(库存现金、银行存款和其他货币资金)的凭证,然后再把这些凭证中涉及现金流的金额归类到现金流量表的大类中,最后把他们加总求和,按合计数填列现金流量表。

2、手工财务管理实习:

手工财务管理实习是建立在我们对会计、财务管理专业知识充分学习和认识后的实践工作。该实习历时一周时间,分为以下几个部分:

①财务分析报告:在财务分析报告中,包括三方面内容:水平分析、垂直分析和财务效率指标分析。水平分析是对连续两年的报表历史数据进行分析,进行横向数据对比,通过差异额及差异率对企业经营的变化作出分析。垂直分析是对连续两年的报表历史数据进行分析,通过纵向的相对指标看出各项目对总资产的影响,再通过差额比较出两年数据间的不同而得到企业经营状况的差异及趋势。财务效率指标,通过对企业两年的偿债能力分析、营运能力分析、盈利能力分析和增长能力分析得到企业在各个方面的能力,尽管这些指标存在一定的误区,但也能从一定程度上了解到企业的很多实际情况。

②预算报表:预算报表是全面预算管理的一部分内容,根据经验数据(销售量、单价),先计算出销售总额得出了预计的首先计划;再凭借着以销定产的思路,抛出库存量,计算得到生产量及需要采购的量,而得到费用支出计划表;然后再依次算出预计直接人工、预计制造费用、预计销售及管理费用,从而可填列现金预算表。通过上述工作,我们就可以计算得到预计的资产负债表和利润表。

③还款及筹资计划表:根据实验资料的要求,企业预计的借款及还款金额和时间,我们可以填制还款计划表:由资金的总需求量减去利润留用和折旧(非付现成本)剩下的就需要外部融资,正如该公司向银行举债。

④投资财务可行性分析报告:该报告是假设企业投资一条新生产线,而在未来五年生产经营而取得收益。同样我们用以销定产的思路,先根据销售量估算出现金收入估算表,然后在估算出直接材料、直接人工、制造费用销售及管理费用,再得出现金流量估算表,最后根据上述数据就可以计算得到净现值、获利指数、内含报酬率和投资回收期这些财务指标。再通过这些财务指标的数据来分析得出此投资是否可行。

⑤流动资产运营分析报告:该分析报告先测算出现金的最佳持有量,运用了两种不同的分析模式:存活模式和成本分析模式。然后计算最佳经济订货批量,假设了两种不同情况:不存在数量折扣和尊在数量折扣。最后填列信用条件评价表,同样也是两个方面:存在现金折扣和不存在现金折扣。

⑥预计利润分配表:根据预测的净利润进行加减调整得到未分配利润预测数。

3、用友u8会计电算化实习:

用友u8会计电算化的实习是建立在对会计专业知识的掌握和财务软件用友u8一定了解的基础上进行的实习。它是将计算机运用到会计工作以提高会计工作质量的一个软件系统。我们在进行该项实习时,是根据手工会计实习的公司及其业务来完成的,其具体步骤上述手工会计实习中已于说明,这里主要讲述其与手工的不同之处和其自有特点,主要包括以下几个方面:

①新建帐套:以admin注册进入u8系统管理,然后根据试验资料设定用户和权限,最后即可新建帐套,录入实习资料所给的帐套信息。

②初始化设置:启用总账和固定资产模块,设定部门档案、客户档案、供应商档案等,在设置会计科目,根据企业会计准则的要求及公司的情况需要设置一级科目及其明细,在输入会计科目时应注意所输入的科目是否有辅助核算,是否是数量金额式,借贷方向等问题。(注:以上初始化设置均可用总账工具进行复制。)

③期初余额录入:根据实习资料所给录入期初余额,注意有辅助核算的在明细中录入,是数量金额式的应先录金额再录数量。

④日常业务操作:内容与手工相同,在这里不再阐述。但要注意这里填制的凭证需选择适当类型(现金、银行、转账),并且凭证可以修改,删除,审核凭证和主管签字均可成批进行。科目汇总时直接输出即可。

⑤固定资产模块:进入模块时要进行初始设置,录入固定资产卡片。计提折旧和资产增减可直接在此模块生成凭证。

⑥记账:在凭证均已签字之后就可以记账,用拥有此权限的用户登陆进行操作。完成后,就可以先转账定义,然后转账生成结转损益,分两部分:结转收入和结转支出。之后再进行记账操作,最后再填制计算、结转所得税的两张凭证。(注:结转所得税的凭证可以直接转账生成)。

⑦对账与结账:在所有工作结束后就可以进行结账操作。先到固定资产模块进行月末处理—对账,之后再结账,然后再到总账系统进行对账,接着即可进行最后的结账操作了。

⑧财务报表:用友u8已提供了财务报表模板,但其为旧企业会计制度,会计科目与新制度不符,因此需要进行修改或是全部重编。这里三张表为:

ⅰ利润表:从格式—报表模板中引入新企业会计科目中的利润表,按试验资料所给的报表模式对其进行调整,然后修改其公式:主要修改科目编码即可,而特殊项财务费用和资产减值损失需要修改为取对方科目发生额函数(即取在本年利润的发生额),这是由于财务费和资产减值损失存在有红字,会将发生额冲销的原因。修改完之后整表重算或是录入关键字即可得出数据。

ⅱ资产负债表:同上引入资产负债表模板,进行格式及科目编码修改,完成后即可整表重算或录入关键字。

ⅲ现金流量表:新建报表,录入试验资料所给的报表项目和格式,然后编辑公式,报表取数编辑公式用友财务函数—现金流量科目,然后根据不同类别,进行取值,定义好之后进行整表重算或是录入关键字即可。

4、财务管理计算机实习:

财务管理计算机实习是建立在财务管理知识和一定的计算机知识—office办公软件excel的应用基础上的一项实习工作。历时四天时间、内容和手工财务管理实习相同,这里主要阐述几点与手工相比其不同之处或是特点:

①填列数据:使用excel对数据进行操作,同样也需要填列一些原始数据,这时候我们可以用tab和回车键或是方向键来移动光标使输入更加快捷。

②表间或表外取数:在填写原始数据的时候,一些值属于变量,我们就需进行表间或表外取数,具体操作是:选中要填写的单元格键入“=”,然后打开数据所在表,直接选择回车即可获取。

③拖动取数:在我们填入一个数据之后,在光标变为黑十字时拖动鼠标即可获取与原数据相关的数据,若原数据只是数字,则拖动取到的数据也为数字;若原数据为公式,所得的新数据是同理公式定义下的数据。

④公式定义:有的数据需要我们进行大量复杂繁琐的计算才能得到,有的甚至是手工无法完成的。这时我们就可以用函数来定义公式,excel提供了多种函数:数学、统计、财务等等。

⑤综合上述内容,我们不难看出使用excel进行财务管理实验的很多优点:方便、快捷、准确等。因此,我们除了学好专业课外,像计算机这样的辅助型的工具我们也应该学好、会用,以提高我们的学习、工作效率。

一、会计、财务管理专业实习的收获体会:

1、手工做账会计实习:

通过手工做账会计实习,对实际会计业务的操作,首先让我们又再次更好、更深入的学习和掌握了会计知识;另外,让我们理解明白了作为会计的谨慎性,不仅仅是在处理某些业务的时候,而是在各个方面都必须做到仔细,认真,还需要又足够的耐心。还有就是会计数据的真实、完整,即便是做错了,也应该按照规定进行修改,要让他人知道错误所在。最后,应该强调的是任何的实务操作都需要基础理论的支持,会计也是如此,通过实习我也看出了我的会计专业知识的匮乏,不够仔细和深入,在今后的学习及工作中还应继续努力。

2、手工财务管理实习:

通过手工财务管理实习,让我认识到了作为一个企业,财务管理的决策占据十分重要的地位。主要表现在以下几个方面:

①通过对财务报表、财务指标的分析,我们可以看到企业历史的经营情况和发展趋势,以找到更好的管理决策方法改进原有的经营管理模式,提高企业的发展能力及社会的知名度。

②通过科学的预算管理,我们可以早一步知道企业未来的经营情况,如有不足之处即可尽快进行调整,尽早弥补损失。

③通过投资可行性分析,我们就不会出现盲目上项目的情况,只有充分可行的项目,在考虑了各种风险的基础上,我们才能予以考虑项目可行。

④通过流动资产运营分析,我们可以掌握更好的现金持有量、最佳订货批量,选择适当的现金折扣条件。

⑤总之,财务管理能让公司更加科学的管理和决策。

3、用友u8会计电算化实习:

将计算机的快捷、方便、准确运用于会计的实务操作,对会计的发展来说是一个突破性质的飞跃,但同时也暴露出很多会计电算化的弊端,比如说会计电算化就需要一个对财务权限管理严格、明确的环境以及对数据具有良好管理的环境。而针对个人来说,同样也需要具备良好的职业道德,在会计电算化中,我们可以对凭证进行无痕迹修改、个人的用户密码容易被窃取或泄漏……但从总体上说,会计电算化有其独特优化的一面,就拿用友u8来说,具有很多手工会计不可及的优点:

①可以严格进行用户权限控制,出现越权时计算机就会出现提示或是禁止该项操作。

②会计科目拥有辅助核算和科目受控系统,这样既方便了会计工作,又可以使会计的具体工作责权分离。

③各个模块的初始化工作为今后的业务处理提供了很大的方便。

④填制凭证时,计算机会自动算数,不平或有其他问题时,禁止保存。

⑤用友u8还为用户提供了各种帐表,适合不同类型的查询。

⑥记账的便捷:计算机在几秒钟内即可完成较手工来说繁琐而又容易出错的记账工作。

⑦自定义结转:对于每月都会发生的业务,可用自定义结转来定义公式,到时自动生成,大大简化了工作量。

⑧报表模块:一般情况下,用友u8提供的报表模板可直接引用,重算即可得出企业所想要的财务报表,即便是需要进行调整也是非常方便快捷的。

4、财务管理计算机实习:

财务管理计算机实习同样是运用了计算机的快捷、方便和准确,让我们的工作变得更加轻松、简单。其优点在上述实验过程和内容中已作阐述,这里不再累赘。但其优点背后也存在不少弊端:

①加密系统不够完善,可轻松破译;

②操作人员无权限控制,可任意进行操作;

③操作人员可以无痕迹修改数据,破坏财务工作的真实性;

数据分析工作经验总结篇6

【关键词】试验室;试验数据;管理系统

一、前言

随着社会对用电的需求不断加大,电网的覆盖度不断扩大,电力设备也随之增多,为了设备运行更稳定可靠,相应的试验量也不断增加。电网系统生产单位试验室每年产生大量的试验数据,如何有效地管理好、使用好这些试验数据不仅体现了生产单位的经营管理水平,还有助于管理单位的科研学术水平的提升。

二、意义

1.工作效率的提升

随着电网的不断扩展和线路电压等级的不断提高,相应地需要进行专业监督的设备数量也不断增加,试验室的业务量在不断增加,试验室分析仪器逐年增加,原有工作站对试验数据的管理是分开放置,各自独立,这样会造成同样设备的试验数据却分开放置管理,在进行检索和分析的时候还需要把多台工作站各自的数据先汇总,然后再进行分析,非常不方便,效率很低,不利于突发状况下的快速分析和决策,而且也不利于对设备的运行状况进行监督管理,所以需要建立统一的试验数据管理系统,各个工作站相互联网,试验数据统一管理起来,同时这个试验数据管理系统还可以直接服务于整个生产单位,在生产单位的任意一网电脑上,只要有相应的权限,就可以登录到该试验数据管理系统内获取所需数据,做到随时随地获取所需的试验数据和设备信息,方便相关部门进行决策和分析。

2.数据安全性提升

采用权限管理来确保数据的安全性,数据的产生、处理、改动都有权限限制,任意改动都有记录可查,数据的检索查询都需要相应的权限,这样可以最大程度地保证试验数据的准确性和安全性。采用统一管理的中央数据库系统还可以大大方便试验数据的备份和保存,提高数据的安全性。

3.生产经营决策里科学性的提升

建立试验数据管理系统,通过对数据库数据的挖掘和整理,可以把生产经营中的部分决策放置到一个更科学化更数据化的基础上,比如对设备运行状况的判断,对设备采购过程中的筛选,对专业监督工作的总结等等,把这些业务决策放在试验数据的基础上开展起来会大大地提高决策的科学性和方便性。

三、数据管理系统在油务监督中的应用

目前,油务机存储,不方便工作人员检索、查阅,数据存储、打印格式单一,试验人员工作结束后需再次对数据进行编制录入、试验人员工作量且该系统无加密措施,不能确保试验完整性及准确性。为了能够克服上述不足,班组将采用ZtGCC-2000(最新9.0版)工作站,该工作站操作简单更加人性化,界面美观,专家故障诊断系统更加完善和精确,而且,它实现了网络连接后的数据共享,可远程查询、检索数据、实现无纸化办公,加入权限管理功能,确保数据可靠性。同时,它自定义报告格式及报表格式到microsoftoffice中打印,确保了试验报告数据的真实性,大大提高了工作效率。

ZtGCC-2000(最新9.0版)工作站构建开放式数据库结果,方便工作人员之间网上传送,实现了油务监督数据库现代化管理;采用专家系统理论分析法、标准故障数据比较法、三比值法(导则法、改良电协法)和发展趋势法等多种诊断方法,实现了计算机人工智能故障诊断;连接试验室两套以上工作站的网络,实现了数据汇总,解决了数据的分散保存,并可同时实现远程查询、检索等操作。该数据管理系统的应用,使油务监督管理水平处于领先水平。

数据分析工作经验总结篇7

在科学研究中,数据的收集、分析和统计处理,需要用到医学统计软件包。目前常用的优秀的医学统计软件包有SaS,SpSS等。这些软件大都具有强大的数据管理能力、全面的统计方法、高精度的计算以及独特的多平台自适应技术,功能强大。但是这些软件的使用相对比较复杂,没有经过培训很难应用自如,充分发挥这些软件的作用。excel是由microsoft公司开发的一种功能很强的电子表格处理系统,它除了具备一般表格软件的功能以外,还包括文字处理、数据库管理和图表处理功能,同时还提供了统计与工程分析、决策支持分析的工具[1]。在我们的医学数据处理中,最常用的大都是要做一些简单的统计描述,或者进行方差分析、t检验及回归分析等等[2],作这些统计分析时,我们可以使用excel“数据分析”工具来完成。

1excel中加载“数据分析”工具

首先,启动excel,点击工具菜单中的“加载宏”选项,在出现的对话框中选中“分析工具库”,确定安装后,在菜单栏的“工具”下会出现“数据分析”选项。

2使用excel进行数据统计描述

用excel可进行数据的统计描述,包括:(1)集中趋势(集中指标),它包括算术平均数,中位数,几何平均数,众数等。excel提供有现成的公式及内置函数可进行这几个指标的计算。如首先输入一组数字,然后建入公式=aVeRaGe(常数),=meDian(常数),和=moDe(常数),按回车健可得到算术平均数,中位数和众数;(2)离散趋势(变异指标),它包括全距,百分位数,四分位数间距,方差,标准差,标准误,偏度系数和峰度系数等。而其中以方差,标准差,百分位数和标准误较为常用。同样在电子表格中建入公式=VaRp(常数)和=VaR(常数)两函数可计算总体方差和样本方差。建入公式=StDeVp(常数)和=StDeV(常数)便可得到总体标准差和样本标准差。

3t检验

t检验是医学统计分析中最常用的统计分析方法,用来检验标准试样测定结果的平均值与标准值之间是否有统计学意义。excel“数据分析”中提供了多种不同条件的t检验工具,如“平均值的成对二样本分析”,“双样本等方差假设”,“双样本异方差假设”及其他统计分析工具,当样本中的观察值存在配对关系时,可以使用“平均值的成对二样本分析”t检验。例如对一个样本组在实验前后进行了两次检测,为确定实验前后样本均值是否相等,应使用成对t检验,此t检验并不假设两个总体的方差是相等的。例如,用某药物治疗高血压患者10名,治疗前后舒张压变化如下:

在工作表中输入上面的数据,比如数据区为a1至J2。分析时,在“工具”菜单中,单击“数据分析”命令。在数据分析对话框中,选择t检验:平均值的成对二样本分析,拉出平均值的成对二样本分析对话框,其中有如下输入项:变量1的区域:输入需要分析的第1个数据区域的单元格引用。该区域必须由单列或单行数据组成。可单击输入框右面的按钮,回到电子表格上自数据开始的单元格向结尾的单元格拖动。此时变量1的区域(a1~J1)自动进入输入域中。然后单击输入域右面的按钮,回到原对话框。变量2的区域:输入需要分析的第2个数据区域的单元格引用。该区域必须由单列或单行的数据组成。输入方法同前。变量2的区域为(a2~J2)。假设平均差:在此输入期望中的样本均值的差值。缺省为0值,即假设样本均值相同。标志:如果输入区域的第1行或第1列中包含有标志项,应选中此项:如果输入区域没有标志项,excel将在输出表中生成适宜的数据标志。这里选中此项。α在此输入检验的统计意义水平。该值范围为0~1之间。缺省为0.05。

输出区域信息可选择如下单选项:输出区域和新工作簿。我们选择新工作表,结果为平均95.88889,方差80.86111,观测值9,泊松相关系数0.881366,假设平均差0,df8,tstat5.230769,p(t≤t)单尾0.000396,t单尾临界1.859548,p(t≤t)双尾0.000792,t双尾临界2.306004。两组比较差异有统计学意义(p

4方差分析(analysisofvariance,anoVa)和卡方检验

在数据分析工具库中提供了3种基本类型的方差分析:单因素方差分析、可重复双因素分析和无重复双因素分析,现简单介绍方差分析的应用。

单因素方差分析:在进行单因素方差分析之前,须先将试验所得的数据按一定的格式输入到工作表中,其中每种水平的试验数据可以放在一行或一列内,具体的格式如表,表中每个水平的试验数据结果放在同一行内。数据输入完成以后,操作“工具-数据分析”,选择数据分析工具对话框内的“单因素方差分析”,出现一个对话框,对话框的内容如下:(1)输入区域:选择分析数据所在区域,可以选择水平标志,针对表中数据进行分析时选取;(2)分组方式:提供列与行的选择,当同一水平的数据位于同一行时选择行,位于同一列时选择列,本例选择行;(3)如果在选取数据时包含了水平标志,则选择标志位于第一行,本例选取;(4)α:显著性水平,一般输入0.05,即95%的置信度;(5)输出选项:按需求选择适当的分析结果存储位置。双因素无重复试验方差分析与单因素方差分析类似,在分析前需将试验数据按一定的格式输入工作表中。数据输入完成以后,操作“工具-数据分析”,选择数据分析工具库中的“双因素无重复方差分析”,出现一个对话框,对话框的内容如下:(1)输入区域:选择数据所在区域,可以包含因素水平标志;(2)如果数据输入时选择了因素水平标志,请选择标志按钮;(3)显著性水平α:根据实际情况输入,一般选择0.05;(4)输出选项:按需要选择分析结果存储的位置。

可重复双因素分析:双因素可重复方差分析与双因素无重复方差分析数据输入的区别在于对重复试验数据的处理,就是将重复试验的数据叠加起来。数据输入完成以后,操作“工具-数据分析”,选择数据分析工具库中的“双因素可重复方差分析”,出现一个对话框,对话框的内容基本与双因素无重复方差分析相同,区别在于每一样本的行数选项,在此输入重复试验的次数即可。若须对数据进行方差分析时,在输入区域选择数据所在区域及因素水平标志,在每一样本的行数处输入3,即每种组合重复3次试验,显著性水平选择0.05。在输出选项中可以按照需求选择分析结果储存的位置。选择确定以后分析结果。在工具菜单中均有现成的这3种分析工具。

5非参数检验

excel也没有提供非参数检验的分析工具,但可利用其提供的函数和公式可进行分析。如利用iF(指定要执行的逻辑检验函数)和CoUntiF(条件函数)进行编秩。利用=SUmiF(条件单元格求和函数)计算正负秩和。=CoUnt(个数函数)利用=aBS和=SQRt计算绝对值和z值。

6相关回归

为了反映两个或多个变量之间的关系,描述相关关系的方向与密切程度,需采用相关分析;为了反映两个或多个变量之间的依存关系,建立回归方程,采用回归分析。先将数据输入工作表中,然后用excel提供的函数可进行线性回归(linearregression)又称简单回归的分析和Spearman等级相关分析,用菜单中的“工具数据分析相关糸数可进行相关分析。用“工具数据分析协方差工具可进行协方差分析。用excel的XY散点图工具可以进行散点图的绘制。

excel是一种使用极方便的电子表格软件,它有强大的数据管理功能,不仅能够根据需要分类管理数据信息,能进行数据统计、筛选、排序、汇总、汇制图表等,还能利用其强大的函数功能以及分析工具库为建立复杂的统计或计量分析工作带来极大的方便。

参考文献

数据分析工作经验总结篇8

关键词:加工贸易;经济增长效应;收入分配效应

据统计,我国加工贸易出口总额从1981年的11.31亿美元,占贸易总出口额的5.14%,增加到2008年的2967.36亿美元,占贸易总出口额的47.2%(数据来源于《中国统计年鉴》)。因此可以看出加工贸易作为另一种贸易方式,对经济增长具有比较大的影响。因此,笔者将在前人的基础上对加工贸易的经济增长效应进行实证分析。

一、变量选择

(一)因变量的选择

对于经济总量增长的衡量,笔者认为采用国内生产总值作为因变量最为合适,因为它不但可以反应一个国家的经济表现,更可以反应一个国家的国力与财富。

(二)自变量的选择

郭芳和冷洛在《国内生产总值影响因素的计量分析》中将最终消费支出,资本形成总额,货物和服务净出口,外商直接投资(实际利用外资金额),人民币汇率(1美元兑换人民币)最为自变量。根据其分析结果,笔者将选取最终消费支出,资本形成总额,一般贸易净出口额,加工贸易净出口额作为自变量。

(三)模型设定

引入多元线性回归模型

Y=C+*X1+*X2+*X3+*X4

Y-----国内生产总值(亿元)

X1----最终消费支出(亿元)

X2----资本形成总额(亿元)

X3----一般贸易净出口总额(亿元)

X4----加工贸易净出口总额(亿元)

(四)数据来源

本文采用1985年至2009年每项变量每年的数据。数据来源《中国统计年鉴》以及CSmaR数据库。对于自变量X3,X4,由每年净出口总额(亿美元)乘以当年人民币相对美元汇率得到。

(五)模型确定

1.初步回归

可以得出,该模型R^2=0.999672,-R^2=0.999603可决系数很高,F检验值14481.30,明显显著。但是在显著性水平=0.05下,查表得,当n=24,k=5时,t=2.093,因此,X3不显著。

2.多重共线性

(1)多重共线性的检验

从相关系数矩阵可以看出,个解释变量相互之间的相关系数较高,存在严重的多重共线性。

(2)多重共线性的修正

a.采用逐步回归法,分别做Y对X1,X2,X3,X4的一元回归,其中X2的-R^2最大为0.993156,以X2为基础,顺次加入其他变量逐步回归经比较,新加入X1的方程?R^2=0.999294,改进最大,而且个参数的t检验显著,选择保留X1,再加入其他新变量逐步回归,在X2、X1基础上加入X4后的方程?R^2增大,而且各个参数t检验都显著。加入X3后不仅?R^2略有下降,X3参数的t检验也不显著,说明X3引起严重多重共线性,应将其剔除。

最后修正严重多重共线性影响的回归结果为:

^Yt=97.61626+1.074190*X1+0.723868*X2+1.945420*X4

3.异方差

(1)异方差的检验

由white检验判断模型是否存在异方差

显著性水平=0.05下,得临界值x20.05(9)=16.9190nR^2=22.7449,因此模型存在异方差。

(2)异方差的修正

对于异方差的修正,笔者考虑将模型变换成如下形式:

Y=C+*lnX1+*lnX2+*lnX4

对于小于0的样本观测值,舍弃同年的数据,因此模型的数据从1989年至2008年。

再次使用white检验,此时,nR^2=16.6179显著性水平=0.05下的临界值x20.05(9)=16.9190,模型不存在异方差。

修正异方差的回归结果为:

^Yt=0.814964+0.599546*lnX1+0.351711*lnX2+0.048024*lnX4

4.自相关

(1)自相关的检验

采用Dw检验法对模型进行自相关检验

Dw=0.864609

在显著性水平=0.05,n=20下的临界值:DL=0.998DU=1.676

所以0Dw=0.864609DL=0.998,模型存在正相关。

(2)自相关的修正

笔者考虑一阶差分法对模型的自相关进行修正。

lnY=C+*lnX1+*lnX2+*lnX4

回归结果:Dw=2.042217

在显著性水平=0.05,n=19下的临界值:DL=0.967DU=1.685

所以DU=1.685Dw=0.8646094-1.685,模型不存在自相关。

修正自相关影响的回归结果为:

lnY=0.006349+0.768275*lnX1+0.213429*lnX2+0.020681*lnX4

二、模型分析

lnY=0.006349+0.768275*lnX1+0.213429*lnX2+0.020681*lnX4

Y-----国内生产总值(亿元)

X1----最终消费支出(亿元)

X2----资本形成总额(亿元)

X4----加工贸易净出口总额(亿元)

由最终的模型可以看出加工贸易的净出口额的增长对国内生产总值的增长是有一定影响的,但是由模型中的三个系数:0.768275、0.213429、0.020681可以看出加工贸易的经济增长效应远远小于最终消费支出和资本形成总额的经济效应。因此,在一定程度上可以看出我国经济水平的高速发展,国内生产总值的迅速增长主要还是依靠国内自身消费水平的提升,而不是主要靠贸易。这在一定程度上反驳了西方国家认为我国的经济发展在很大程度上依靠出口到发达国家。同时,也为政府在制定政策时更加注意如何提高最终消费的水平,以促进经济的发展。

参考文献:

[1]郭芳,冷洛.国内生产总值影响因素的计量分析[J].2008,(3).

数据分析工作经验总结篇9

【关键词】警察心理压力;量表;因素分析;信度;效度

1引言

警察工作压力是指由于警察的职业特性,在其所处的环境中,出现威胁性情境或不良事件时,警察表现出生理或心理上的紧张状态。据公安部统计,从1990年以来,因公牺牲的民警就有6819人,平均每天1.2人,负伤的人数达到了120783人,平均每天20.7人[1]。警察的职业特点是高强度高风险,与不同种的职业相比较,警察属于高度心理压力的职业[2]。

目前国内对警察心理的研究起步晚,数量少,论文研究不到40篇,多偏重定性研究,描述警察心理压力来源,提出缓解压力的措施[3,4];少数定量研究的论文,采用研究方法比较简单,只做了简单的相关研究[5],也没有相应的警察工作压力的测量工具。本研究采用因素分析的方法,编制苏州地区警察工作压力量表。

2对象与方法

2.1被试本研究随机抽取苏州市区及下属的5县各级公安机关的警察,共计295名警察接受问卷调查,涉及刑警、交巡警、治安民警、派出所等警种。

2.2程序①根据研究目的与假设,收集所需资料。研究者按统一的提纲对部分警察进行访谈,整理访谈记录,归纳警察心理压力的代表性的问题;同时查阅相关文献,提出警察工作压力理论维度,工作、社会、家庭、个体4个维度。②形成初步问卷。根据前期结果,总结警察工作压力的109个项目,形成初步问卷。采用Likert5点自评式量表,从“完全不符合”至“完全符合”5等级记分制。③试测。选取被试100名进行预测,在施测时注意收集被试对量表的反应,并征求有关专家及警察的意见和建议,对不合理的项目进行筛选,共删除22个项目,形成87个项目的工作压力量表。④正式施测,对结果进行分析。

2.3数据处理工具采用VisualFox6.0、SpSS11.5进行数据分析处理。

3结果

3.1项目分析参与分析的项目共有87个。计算出每个被试的总分,按照总分的高低排序,找出高低分组总人数之27%处的分数,分为高低两组,进行独立样本的t检验,将结果不显著的项目删除,删除18个题目。参与因素分析的项目有69个。

3.2因素分析

3.2.1线性检验因素分析要求观测变量之间呈线性关系,在进行因素分析前先进行变量的线性检验,Kmo和巴莱特检验结果见表1。

检验结果表明数据呈较好的线性,适合进行因素分析。在进行因素分析过程中,按照以下标准删除项目:①共同度小于0.35;②载荷小于0.35;③因素包含项目不足3个。删除共19个项目,最终正式问卷含有50个项目。

3.2.2因素分析的结果见表2。对施测所得结果进行探索性因素分析,以确定各分量表的因素结构。本研究采用抽取固定因素个数的方法,根据特征根分布图,在第7个和第8个因子处有明显的转折,而且抽取8个因子时,方差贡献率达到45.655%。结合问卷编制的结构,本研究抽取8个因素。

3.2.3因素命名通过对每个因素所含项目的分析概括,结合警察工作的具体情况,命名如下:组织压力(13题)、个体压力(7题)、任务压力(5题)、挫折压力(4题)、时间压力(5题)、社会压力(5题)、人际压力(7题)、经济压力(4题)。

3.3问卷构成

3.3.1问卷项目问卷共有50个项目,其中反向记分项目有18个。记分分五等级。

3.3.2信度说明

3.3.2.1分量表的内部一致性检验内部一致性检验结果表明:每个项目得分和所属分量表总分的相关系数均存在0.05的显著水平,说明每个分量表的内部一致性较好。见表3。

3.3.2.2总量表与8个分量表的克朗巴赫系数见表4。

如表4所示,总量表的α系数为0.8927,各分量表的α系数在0.5925~0.8637之间,表明每1个分量表上的各项目之间有较高的正相关,它们所测到的是同一种心理特质,每1个分量表的项目在构思上具有良好的一致性。

3.3.2.3分半信度把量表以奇、偶数题号分为两半,采用SpearmanBrown分半相关系数计算方法,所得分半信度系数为0.845,表明项目测定内容具有同源性。

3.3.2.4重测信度选取130名警察作为重测对象,时间间隔为4周,结果发现量表前后两次测试的相关系数是0.83,说明量表有很好的重测信度。

3.3.3效度说明

3.3.3.1内容效度本研究采用的SCL-90作为效标量表,SpSS软件求得新编量表与校标量表的pearson相关系数为0.813(n=130,p

3.3.3.2结构效度检验量表的结构效度可考察其因素的内部相关,表5给出了8个内容量表的pearson相关系数矩阵。

8个分量表之间的相关介于0.169~0.489之间,有的相关达到0.01的显著水平,属于中低相关,显示分量表的方向比较一致,但彼此独立。分量表与总量表之间的相关介于0.539~0.728之间,达到0.01的显著水平,呈现中高度正相关,显示各分量表与整体的概念一致,表明全量表具有良好的结构效度。

3.3.3.2构想效度因素分析结果可以看出,8个因素总的方差贡献率达到45.7%,说明问卷结构效度可以接受。因素分析过程中,选择负荷值>0.35的标准删除项目,实际结果是50个项目负荷值在0.359~0.699之间。较高的负荷,表明各项目与对应因素的相关较密切,问卷有效性较好。共同度取值在0.494~0.707,从另1个侧面保证结构效度。

4讨论

本研究按照心理测量的原理、技术编制,问卷的信度和效度较好;50个项目均具有较好的区分度;通过因素分析发现,警察心理压力主要由8个因子构成,这8个因子压力顺序依次是:时间压力、任务压力、经济压力、个体压力、组织压力、挫折压力、社会压力、人际压力;对数据进行比较分析后,初步发现:男、女警察在个体压力因子上的压力得分存在显著差异(p

数据分析工作经验总结篇10

蔬菜农残检验是一个复杂的过程,所有检验必须经过抽样、样品登记、样品检验、报告输出、数据汇总几个阶段.首先在样品登记阶段时,检验机构抽样人员必须对进入蔬菜批发市场的蔬菜品种进行抽样,然后立即进行登记,登记内容包括业主的身份及车辆等信息.样品登记后应该进行样品检验,检验数据应输入管理系统中,经校核后作为最终检验结果存档,然后出具检验报告.所有检验数据必须于第二天上报检验机构总部,再由检验机构总部上报市政府备案.因为本部距离农残检验站很远,这段工作通常是第二天由专人开车到农残检验站获取检验记录单再回质检机构总部录入汇总,这种工作方式费时费力,无法满足工作要求,需要设计出即时数据传输功能.另外检验报告出具后需在检验机构总部存档,因此还需设计出检验数据查询功能供管理者和使用者对检验数据进行查询统计.

二、pRim的体系结构

pRim系统的架构分为数据库部分和客户端部分和数据上传部分,数据库部分采用mSSQL数据库,客户端采用.net技术开发.数据库安装在服务器,客户端装在检验部门、总部管理部门,登记人员、检验人员、管理员和总部管理人员根据各自权限分别可进行登记、检验、检验数据处理、权限设定、各种查询、数据上传等工作.总部可以实现远程监控检验机构的检验行为和及时调用、查询、分析检验结果.通过开放接口,实现总部实验室管理系统和现场实现对接,从而提高检验数据上报时间,简化操作步骤.检验数据保存后,通过pRim系统提供的接口,使相关工作人员可以调出检验数据进行查询、分析、汇总,提高了数据的使用效率.另外,使用者可以通过查询统计调用需要的数据.

三、系统模块设计

3.1基础模块

基础模块包括数据库设计、人员设置、基本信息设置等部分,数据库部分可以采用aCCeSS、SQL等数据库,aCCeSS数据库数据处理和统计分析十分方便,利用aCCeSS处理十万条级以下记录数据时速度快且操作方便.但是如果处理大的数据(百万条记录以上)以及复杂查询aCCeSS有时不稳定易导致系统崩溃,另外,aCeeSS数据库适用于单用户还可以,在处理多用户时就显得数据处理能力不够.相比较而言,mSSQL具备相对稳定处理大数据的能力,但是查询设计代码编写复杂,不容易被开发掌握,作为一个重要的检验管理系统,稳定是第一要的,而且每天处理的数据量达到几千条,很快就会超过几十万条记录,所以农残检验管理系统采用SQL数据库是合适的.客户端采用.net作为编程语言.

3.2报告输出模块

报告输出的形式有多种,可以采用数据链接的方式实现管理系统与oFFiCe文档的输出,这种方法的优点是开发方便,适应性强,缺点是不稳定,有时会出现乱码现象.第二种方法是采用.net语言把报告写在编码里,这种方法比较繁琐,开发周期长,但是功能强大.系统工作稳定,不会出现乱码现象,所以报告输出方面采用.net编程方式进行.

3.3数据汇总查询

在进行信息查询和统计时,经常同时牵涉到几个数据表,这就必须考虑数据表之间的数据关联性[1].数据汇总的实现可以通过多个途径实现,首先可以编程实现,即通过aDo.net实现各种查询统计的功能,在多层次查询时可以采用普通的组合查询方式,也可采用“SHape...appenD”以及“SHape...CompUte”等高级语句生成关系层次和参数化以及组合层次进行复杂条件的查询.其次,也可采用在数据库实现编写存储过程再调用的查询方式.数据远程传递是一个复杂过程,它涉及到诸多方面的问题,包括远程服务器和本地服务器的硬件对接,数据的实时性、数据传递的便捷性、数据的大小、及远程查询等诸多软件对接问题,对此,作者专门开发了LDtD(LonGDiStanCetRanSpoRtData)技术,用于处理远程数据传递问题.远程数据传递应注意的问题是数据传输以4096个字节为一个单位,所以每次数据传递尽量优化在4096个字节以下,这样的传输才能快捷.

四、应用实例

是按照鞍山市产品质量监督检验所要求开发的pRim系统的运行界面.抽样登记人员从登录窗口登录主界面后,输入基本信息后,系统自动生成产品检验编号,然后通过任务界面提交检验申请并发送,这样,检验员接到任务后开始检验并出具检验报告,然后上传检验结果.在所有的检验测试数据都输入到系统数据库进行保存后,检验员还可以查询登记情况和检验结果.管理人员及其他需要用到检验测试数据的人员可以通过查询统计模块进行查询、统计,并可以生成相应的分析图,使得相关部门可以直观地看到农产品农药残留情况.甚至还可以预测一定时期内农产品农药残留的走势,为其做出相应决策提供可靠的依据.没有使用pRim计算机管理程序之前,检验人员做完实验后用word文档出具一份检验报单告需5min左右时间,200份检验报告需要1000min左右.加上汇总及改错等时间,处理检验的时间需要一个人用大致1040min去完成.而使用pRim计算机管理系统后,处理一份报告平均只需1min完成,200份检验报告共需200min左右时间,同时出错率低,数据实时上传,无需汇总,合计共省去约940min宝贵时间,处理检验报告工作量是未使用计算机管理程序时工作量的1/5.经使用单位使用,5个人的工作量可以4个人完成,极大地提高了检验工作效率,得到了使用单位的认可.

五、结束语