科学计数法规则十篇

发布时间:2024-04-29 16:10:46

科学计数法规则篇1

1关联规则的数据挖掘分析方法在计算机教学中的作用

数据挖掘作为一种全新的计算机运用技术,在各个应用领域都发挥巨大的潜力。通常情况下,数据挖掘分析方法主要是有关联规则分析、序列模式分析以及分类分析等方法。笔者经过一些分析方法的对比,在系统开发过程中,选择关联规则算法进行相应的探讨。为了能够进一步说明关联规则的数据挖掘方法,同时有效地结合实践过程,通过对以下两个案例进行深入分析,希望能更好地了解数据挖掘方法的运用。例如,在“男同学-高分”的关联规则中,这种表示方法是在考试过程中,男同学和女同学相比得高分的几率更高,在一个具有一万条记录的事物数据库中,只有将近300条记录包括得到高分的男同学,说明这种关联支持度为3%,这个支持度相对来说较高。但是,也不能因此来做出这个关联的意义,若通过科学的统计发现其中有6000条的记录包含男同学,使可以计算出男同学的置信度为300/6000=5%,从此方面来看,这个关联规则的置信度并不是很高,同时也就不能做出这种关联的实际意义。但是,如果是此记录中只有600个是“男同学”,这样就可以知道有将近50%的人得到高分,值得关注。又如,可以针对不同类别教师所教学生的成绩进行统计。根据图中数据显示,可以假设,甲类教师-学生高分,设置为X-Y,可以知道,其支持度为50/310=16.13%,其置信度则为50/105=47.2%。因此,可以通过这种方法,以此来推导出其他的关联支持度以及置信度。

2教师因素对挖掘计算机学生成绩数据的促进作用

当前,我国计算机教学考试主要采用无纸化考试,其阅卷工作可以在计算机上自动完成,其成绩也可以由省教育厅逐一下发,通过这样的方式,可以更好地开展数据挖掘工作。例如,可以利用关联规则法研究学生a科成绩和B科成绩的关联:①在对可信度的运行过程中,学生在a科成绩为优秀时,B科也为优秀的概率;②在对支持度的运行过程中,可以描述学生a和B科目的成绩为优秀的概率;③在对期望可信度的运用过程中,可以在没有任何约束的情况下,加强对学生a和B科目成绩为优秀的概率分析;④在作用度的分析上,作为一种可信度和期望可信度的比值,当学生在a类成绩为优秀时,可以对B科目的优秀影响进行深入分析。从以上的分析中可以看出,可信度能够衡量关联规则的准确度,而且在关联规则中,支持度是当前关联规则中最为重要的衡量标准。

3关联规则推导技术的有效运用

数据挖掘所得出的关联规则只是作为数据库中的数据之间相关性的描述,同时也可以作为一种分析工具,通过历史数据来预测各种未来的行为。但是,数据挖掘所得出的结果只是作为一种概率,由于不同探究问题的类型和规模有所不同,只有灵活地运用数据挖掘技术才能进行补充。在划分方法上,可以将数据库中分成几个互不相干的模块,并且可以单独考虑到每个分块生成的所有的频集,之后可以通过所产生的频集合并生成所有可能的频集,计算出这些项集的支持度。可以针对分块规模的大小来选择被放入的主存,而且在每个阶段只需要被扫描一次,有效降低挖掘时间,提高挖掘效率。

4结语

科学计数法规则篇2

关键词:数据挖掘;遗传算法;关联规则

中图分类号:tp18文献标识码:a文章编号:1009-3044(2008)34-1747-02

miningStudentsinformationwithassociationRulesBasedonGeneticalgorithm

CHenJian-cheng1,2,tUang-yan3,XUXue-gui2

(1.SoftwareinstituteoftongjiUniversity,Shanghai200092,China;2.DepartmentofComputer,ZhejiangindustrypolytechnicCollege,Shaoxing312000,China;3.CenterofComputer,ShaoxingUniversity,Shaoxing312000,China)

abstract:thispaperdescribestheapplicationofgeneticalgorithmstothedataminingassociationruleswithspecificstudentinformationdatabase.throughspecificcodingdesign,structuringfitnessfunction,processingdatabase,settinggeneticalgorithm’sparameters,manyusefulrulesarefound.thishelpsteachersmanageandguidestudentsscientifically.itcanimprovethequalityofteachingandtheaccomplishs,andplaytherolesofusingthelittletogetthebigfortheothercoursesorstudentsdatabasemining.

Keywords:datamining;geneticalgorithm;associationrule

1引言

遗传算法在解决问题时以混沌、随机和非线性为典型特征,为其他科学技术或难以解决的复杂问题提供新的计算模型。遗传算法是有效解决大量数据中嘈杂无序的特征的有效方法之一。遗传算法是模拟自然进化的通用全局搜索算法,避免了搜索过程中局部最优解,用在规则发现方面,有希望发现真正有用的规则。

关联规则apriori算法的核心思想是发现最大项目集,这个过程是全局的搜索过程,而遗传算法是一种全局最优算法,将遗传算法用在规则的发现和提取方面能够发现真正有用的规则。本文将遗传算法应用到关联规则的提取方面,结合具体的学生成绩数据库系统的应用实例,将常见的二进制编码转换为实数编码,对适应度函数进行构造,得到一些有用的规则,并将其应用于学生的培养和教育,便于教师有针对性地对学生进行科学的管理和指导,有助于科学教学及今后的教改方向,从而提高教学质量和教师素养。

2遗传算法中的个体表示

2.1编码方法

应用遗传算法进行规则开采,编码是要首先解决的问题,也是遗传算法的关键步骤,直接影响遗传算法的运行效率。

实数数组的元素个数与事务数据库中的字段个数对应,实数数组的元素值则代表了字段的属性值,如表1所示。

用一个元组为n的数组来表示如表1所示的个体编码,a[1]表示字段a,a[2]表示字段B,……,a[n]表示字段n;各属性值用数值型的值表示,各字段的属性值在各自不同的范围内取值,如字段a的属性值在[a1,aL1]之间取值,字段B的属性值在[B1,BL2]之间取值,……,字段n的属性值在[n1,nLn]之间取值。由于处理后的数据库的属性值大于零,则用与所在字段的属性值的编码长度等长的由“0”组成的字符串表示,表示此属性与其他的属性无关联。

表1所示的数据库的个体编码如下所示:

用实数编码,不仅编码简单、易于实现,而且也便于遗传算子的操作,编码后的遗传算子的操作变成了对数组的操作。

2.2适应度函数的构造

适应度函数是遗传操作中进行选择操作的唯一依据,使算法避免了随机的盲目搜索,它的设计好坏直接影响Ga的性能和效率。关联规则中支持度的大小衡量了规则的重要性,支持度越大,规则越重要,反之,规则不重要。可信度是对关联规则准确度的衡量,对可信度很高而支持度很低的关联规则,由于该规则使用的机会很少而显得不重要。因此,在适应度函数的构造中,采用这样的方法:先根据支持度筛选规则,再在满足最小支持度的规则中确定它的关联程度和关联性。适应度函数的形式定义如下所示:

其中,s'为经过Ga形成的一条新规则的支持度,s为用户给定的支持度的阈值,当ri为符合要求的规则时,它的适应度函数值大于1,值Vs表示被选中,否则在下一代中规则造淘汰,用Vd表示。

3应用实例

3.1数据库的数据处理

本文采用的是学生信息数据库。数据库的各字段说明如表3所示。

学年的取值范围为[1,4],分别表示大一、大二、大三和大四四个年级,性别编码,男:1,女:2,添加科目性质一列:属性值为:偏文用1表示,中性用2表示,偏理用3表示,偏艺术(如健美操、演奏系列、绘画系列)用4表示。

3.2遗传算法中的参数设置

Ga中需要选择的运行参数主要有个体编码串的长度L、群体大小m、交叉概率pc、变异概率pm、终止代数t等。这些参数设置对算法的运行性能影响较大,下面进行具体分析:

1)编码串长度L。编码的长度与所用的编码的方法有关。本文使用的是浮点数编码,编码串长度L与决策变量的个数相等。在本文中,我们要找的是表2中的八个字段之间的关联,编码的长度为8。

2)群体的大小m。群体的大小m对算法的影响很大,若m较小,虽可提高遗传算法的运算速度,却降低了群体的多样性,会引起早熟现象的发生;相反m的值较大,则遗传算法的运行效率降低。权衡利弊,且本例有的决策变量的取值范围很大,因此初始种群的个数取100。

3)交叉概率pc。交叉操作是遗传算法中产生新个体的主要方法,交叉概率取值过大会破坏群体中的优良模式,对进化运算不利;取值过小,产生新个体的速度减慢。在本例中,有的决策变量的取值范围很大,把交叉概率取较大的值0.8。

4)变异概率pm。变异使得群体保持它的多样性,变异概率取值过大,虽能够产生较多的新个体,可能会破坏优良的模式,使得遗传算法的性能近似于随机搜索算法的性能;取值过小,无法保持群体的多样性,且易出现早熟现象。与前面参数类似,考虑到有的决策变量的取值范围很大,变异概率取较大的值为0.05。

5)终止代数t。终止代数是Ga运行到指定的进化代数之后停止运行,将当前群体的最佳个体作为最优解输出,是Ga运行结束条件的一个参数。在本例中,求的是满足用户给定阈值的规则,最后输出的解是一个符合要求的规则的集合,根据适应度函数以及遗传算子选择出的规则表示的是所有具有关联性的属性,但无法分辨出具体是如何关联的。但包含的所有规则中未必每条规则符合可信度要求,因此需对规则进行筛选,对符合最低可信度阈值的规则输出,否则丢弃。

3.3算法设计

利用下面的算法对数据库的数据进行规则提取:

Step1:初始化的过程包括下列两个过程:

随机生成一个初始群体p={a1,a2,…,am};(m=100)

获取用户给定的支持度s,可信度c;

Step2:对当前种群p中的每一个个体计算适应度值,f(ai)=s'/s(i=1,2,…,m);根据适应度值对个体进行筛选,若f(ai)>0则保留该规则进入下一代,否则删除并淘汰该规则,并计算保留下来的个体数n。

n=0(初始化)

Fori=1tomdo

iff(ai)>0then

n=n+1

reserve该规则

else

discard该规则

endif

endfor;

Step3:ifn

随机生成m-n个个体

else

跳过Step3这一步

endif

Step4:初始化池pond和后代offspring(下转第1754页)

(上接第1748页)

pond=Ф

offspring=Ф

Step5:复制

Fori=1tomdo

pond=pond∪ai(将当前种群中的所有个体复制到池)

endfor

Step6:交叉

Fori=1tom/2do

随机地从池pond中选择两个个体aid和aim作为父本和母本,按照交叉概率pc进行交叉

pond=pondC{aid,aim}

offspring=offspring∪{aid,aim按照交叉概率pc交叉的后代}

endfor

Step7:变异:在当前种群中按照变异概率pm选择pm×m个个体进行变异操作。

Step8:终止条件判定:

与终值代数t进行比较,若符合终止条件,则终止并输出最优解,否则跳到Step2。

Step9:进行规则提取。

3.4结论

根据以上算法,在上述的学生数据库中发现部分关联规则如下:

?圯(1.30%support,2.33%confidence)

?圯(1.30%support,62.79%confidence)

?圯(1.30%support,30.23%confidence)

?圯(1.30%support,0%confidence)

?圯(1.30%support,0%confidence)

?圯(1.30%support,62.16%confidence)

?圯(1.30%support,37.84%confidence)

?圯(1.30%support,0%confidence)

规则表明偏文(编码为1)的课程邓小平理论(课程编码为87),文科班中文师范00级01班(班级编码为01),优秀(编码为6)为2.33%,良好(编码为5)为62.79%,中等(编码为4)30.23%;理科班数学教育00级02班(班级编码为09),优秀为0%,良好为62.16%,中等为37.84%,两个班不及格均为0%情况。

对偏文的课程,文科班的成绩相对好一些,但并不突出,这里需要说明的是虽然是同一偏文的课程,但考试的要求并不同,文科班的要求较高一些,考试的难度相对高一些。对中性科目文科班的成绩较理科班的成绩有很大的突出。

4小结

本文结合学生信息数据库对关联规则的挖掘算法进行了探讨,提出将遗传算法应用于关联规则的提取。使用了实数数组的编码方法,方便了交叉、变异和选择算子的操作;根据不同的专业性质、年级、科目性质、课程、选修情况、学分、性别与成绩的关系,对学生成绩数据库进行数据挖掘,发现有用的知识,用同样的方法,对不同内容的学生资料数据库进行关联规则的数据挖掘,并把它们应用到学生的培养和教育上去,教师可以根据各种题型的失分多少发现学生的薄弱环节,从而加强薄弱环节的教育;发现某些基础学科和另外一些难度较大的学科的关联性,通过加强某些基础学科的教学来提高另外一些难度较大的学科的学习成绩,这有助于教师对学生的科学管理,进行有针对性地科学指导,提高教学的质量和素质;可以根据某些课程的优秀情况判断学生以后的就业去向,从而加强某些课程的教育。

参考文献:

[1]DavisL.Handbookofgeneticalgorithms[m].newYork:Vannostrand,1991.

[2]陈明,王静,沈理.基于遗传算法的Fuzzy规则自动获取的研究[J].软件学报,2000,11(1):85-90.

[3]遗传学编写组.遗传学[m].北京:中国大百科全书出版社,1983.

科学计数法规则篇3

关键词:关联规则分析数据挖掘数字图书馆

近年来,数据挖掘(datamining,也称知识发现(knowledgediscoveryindatabases,简称KDD),受到当今图书情报领域的广泛重视,其主要目的就是设计算法,用于从海量数据中发现未知的、潜在的、读者感兴趣的有用信息。关联规则是数据挖掘研究中的一个重要的研究课题。

1.关联分析规则基本原理

agrawal等人(1993年)[1]最先发现了顾客交易数据库中的项集间存在关联规则,其核心方法是基于频集理论的递推方法,它侧重于确定数据中不同属性域之间的联系找出频繁的数据属性域之间的相互关系。定义为:

此后人们对关联规则的挖掘问题进行了大量研究,包括对apriori算法优化[2]、多层次关联规则算法[3]、多值属性关联规则算法[4]等,以提高算法挖掘规则的效率。

关联规则的挖掘一般可分成两个子问题:①找出所有支持度≥最小支持度阈值的频繁项集。②由频繁模式生成满足可信度阈值的关联规则。第二个问题比较容易,它在第一步的基础上很容易实现,因此关联规则挖掘算法的性能主要由第一个问题决定。因为这个问题的挑战性在于数据量巨大,所以算法的效率是关键。

2.关联规则分析在国内图书馆学领域的应用

关联规则分析经过十几年的发展,目前已经在各个领域广泛应用。从国内已有的研究成果来看,国内图书情报界越来越重视关联规则分析在图情领域各类优化问题的定量应用,并针对不同主题进行了一系列的探讨和研究,涉及的主题主要包括关联规则分析在流通信息、个性化推送、文献计量、信息检索、知识管理等方面的应用。

2.1在流通信息统计中的应用

在读者日常借阅记录事务中,每天都有大量的借还记录汇入数据库中。读者借阅的对象是文献资源,根据长期的读者借阅历史数据,我们会发现读者对文献的借阅存在着一定的关联,不同学科之间也存在着关联,以及不同的读者对文献的借阅存在着一定的模式。挖掘出这些数据之间的关联,有利于合理配置资源和提高资源的利用率,以提高图书馆的服务水平。图书流通量是反映图书利用率的最重要的技术指标,更是反映图书馆服务质量的重要因素。影响图书流通量的因素是纷繁复杂的,这些因素不仅包括馆藏图书种类和数量的多少、借阅方式的差异、读者群体的大小、借阅权限的区分,而且包括由于读者个体间的差异和不同性别、年龄、不同专业及知识层次的读者对读物产生的不同需求。显然,在上述复杂而又相关的各因素中,既有大量已知信息,又有不少未知信息、非确知信息。图书流通系统的这种既含有已知信息,又含有未知的、非确知的信息,实际上是一种灰色系统[5]。关联规则的挖掘可以发现图书馆流通数据库中一组借阅书籍之间某种关联关系的规则,其作用在于对图书流通的关联性分析和相关借阅图书的推荐。这样可以优化图书馆馆藏结构、馆内书籍分布,不仅可以帮助师生的学习教研工作,甚至可以发掘不同学科间的隐藏联系[6]。

珵继华[7]等认为多维数据空间数据的稀疏性,在低层或原始层的数据项之间很难找出强关联规则。在较高的概念层发现强关联规则很可能提供普遍意义的知识。而多层关联规则挖掘是直接面向海量数据库系统的,这类数据库通常有上百个属性和数百万个记录,并且数据表之间包含复杂的关系,这就必然导致数据挖掘过程中搜索维数和搜索空间的激增,利用高性能分布式计算机设计分布式多层关联规则算法来进行高效的分布式挖掘已经成为当前数据挖掘的一个迫切需要解决的问题。

聂珍[8]在分析单数据库多层关联规则算法Smam的基础上提出了分布式多层关联规则挖掘算法pmam,使得其具有较高的分布式特点。在pmam算法中利用全局频繁与局部频繁之间的关系减少候选集,并利用概念间的层次关系及项集长度的分布规律对事务表进行约减。这样可使算法的效率得到提高,改善了内存的使用率。

2.2在个性化推送中的应用

未来图书馆的发展趋势是数字化的,然而目前,国内图书馆技术与应用基础薄弱,起步较晚,网络个性化服务发展更是滞后,其应用仍处于初始探索阶段。鉴于数据挖掘技术在数据的组织、分析与发现等方面存在巨大的潜力,学术界普遍认为它可为数字图书馆的个性化服务提供关键技术。

图书推荐服务是图书馆个性化服务的一种,在图书馆巨大的馆藏资源中,每个读者感兴趣的只能是其中的一小部分,如何高效率地找出对读者有用的书目是图书馆学要研究的问题[9]。数字图书馆个性化服务是基于用户的行为、习惯、偏好、特点及特定需求,向用户提供满足其个性化需求的信息内容和功能的一种服务[10]。

鲍静[11]运用apriori算法通过对读者借阅数据的关联挖掘,挖掘出各年龄层次、各职业、各学历层次及不同职称的读者对图书馆图书资源利用的关联规则,并引入兴趣度,对挖掘出的关联规则做进一步分析,分析正相关关联规则、负关联规则,并根据兴趣度来分析规则的有效性,提出了基于关联挖掘的读者个性化服务模型,由借阅记录数据库、数据挖掘引擎、图形用户界面、匹配器、规则库等部分组成。

韩开来[12]等利用读者五年内书籍的借阅数据,在apriori关联挖掘算法的基础上,对事务集中每个项集按每个项的最小支持度从小到大排列有序,最小支持度的值采用根据每个项的值结合用户指定的最小支持度上限和下限来计算。针对新书推荐特点,采用新书推荐关联规则挖掘隐藏在借阅历史数据中的有价值的信息。为个性化服务平台的构建打下基础;转换图书馆的服务模式,由被动转为主动,建立以读者为中心的个性化服务体系。

2.3在文献计量中的应用

在文献计量学的研究中,通常需要通过定量分析以确定核心期刊、核心作者、核心情报源等等。对最优目标或某种具体要求的量化数据列,即标准数据列或最优数据列,来源一般有两种方式[13],一种是人为指定,另一种是从被分析的项集合的指标值中选取最优值。用关联分析法进行处理,相较其他方法具有更为广泛的适用性,只要是由某些指标数据来对目标项或要求进行优化排序的均可用此法。方法简单,原理直观明了,计算量较少,对指标因素无任何限制,因此应用广泛。

科学文献的编排格式为文献计量学提供了可统计的外部特征。邹常诗[14]从引文、关键词、分类号等外部特征入手,采用文献计量方法分析了文献的关联性——相关文献群和相关著者群,并阐述了两个相关群的实际应用。

杨代庆等[15]分别从合著者、共关键词、共引三个角度对来自于万方数字化期刊群、SCi、ei的院士期刊文献进行关联性分析,通过期刊及院士作为媒介,最终映射到学部之间的关联关系。根据生成的关联图从关联广度、关联孤立性、关联强度分析了学部之间的关联程度及原因,并揭示了作为合著者的外部文献特征与作为关键词、共引的内容特征在学部关联性上的差异。

曹志杰[16]等提出了基于共词分析的隐性关联知识发现方法,用于发现这些尚未被发现的联系或复现这些被主观隐藏的特定联系,揭示出技术发展动向,以提高情报研究质量和情报工作地位。

徐慧[17]等利用频数统计、关联规则算法,对中国中医药期刊文献数据库中1984~2007年病毒性心肌炎文献涉及的主题词和副主题词进行分析,抽取隐含规律,为病毒性心肌炎的临床诊疗及科研提供思路。

2.4在信息检索中的应用

金玮[18]等针对web信息检索系统在海量数据下的服务质量和效率问题,讨论了数据挖掘技术在internet信息检索中的运用,在经典的关联规则算法研究基础上,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法aRmLL用于提高web信息检索质量。实验结果表明该算法是可行的,有较高的效率。

黄名选[19]等以关联规则挖掘技术的发展为主线,将目前的研究方法归纳为五类:项无加权关联规则挖掘、项加权关联规则挖掘、项完全加权关联规则挖掘、负关联规则挖掘和增量挖掘,对这五类挖掘技术进行整体性阐述和比较性研究,指出了挖掘技术的局限性。

刘俊熙[20]认为搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,对搜索引擎的相关技术(搜索技术、索引技术、检索技术和接口技术)进行关联分析。

于春[21]等介绍相关性是信息检索科学的核心概念,用户观点则是相关性研究的主要观点;从用户角度研究相关性理论,以试验法为研究方法,力图证明存在一个核心的、可以跨不同用户类型、问题情境和信息源环境的关于信息用户在信息需求检索中的相关性判断的因素集,以此阐述如何提高信息检索的准确率,指导信息用户能够及时、准确地查找到所需信息。

2.5其他方面

除以上几个方面外,关联分析还应用在图书馆学领域的诸多方面。有的学者运用灰色关联度分析法对所调研图书馆读者满意程度进行对比分析,并进一步对读者满意度评价指标进行灰色关联分析,得出影响图书馆读者满意度的主要指标[22]。还有学者将关联规则分析应用在期刊评价、馆藏建设、专利分析等方面。

3.关联规则分析在国内图书馆学领域应用的总结和思考

从关联规则分析在国内图书馆学领域应用的文献数量来看,国内学者越来越重视这种分析工具的应用。从近年来文章的主题来看,关联规则分析在国内图书情报领域应用的研究主要集中在以下几个方面:(1)在流通信息统计中的应用;(2)在个性化服务推介方面的应用;(3)文献计量分析;(4)信息检索方面的应用;(5)读者满意度满意度评价,此外还包括期刊评价、馆藏建设、专利分析、编目规则、文献采访、学科馆员选拔、知识管理和竞争情报等。

通过对国内研究的分析,可以看到该主题的研究越来越丰富,应用越来越广泛,既有理论研究,又有实践探讨。但是同国外相比,国内的理论探讨不够深入,实证研究相对比较少,因此不论从理论还是实践上都需要向国外借鉴和学习。

参考文献:

[1]agrawalR,SrikantR.miningassociationrulesbetweensetsofitemsinlargedatabases[a].prcoaCmSiGmoDint’lConfmanagementofdata[C].washingtonDC,may,1993:207-216.

[2]agrawalR,SrikantR.Fastalgorithmsforminingassociationrules[a].prco20thint’lConfVeryLargeDatabase[C].Santiago,Chile,Sept,1994:487-499.

[3]SrikantR,agrawalR.mininggeneralizedassociationrules[a].proceedingsofthe21thinternationalConferenceonVeryLargeDatabases[C].Zurich,Switzerland,Sept,1995:407-419.

[4]尹阿东等.基于数值属性的关联规则挖掘算法[J].微机发展,2003(4):67-70.

[5]高波.对高校图书流通的灰关联法分析[J].辽宁师范大学学报(自然科学版),2001(03):327-330.

[6]王磊,刘东苏.关联规则挖掘在图书馆信息服务中的应用[J].情报杂志,2008(2):154-158.

[7]珵继华,施鹏飞.多层关联规则的有效挖掘算法[J].软件学报,1998(12):937-941.

[8]聂珍.分布式多层关联规则在图书流通优化中的应用[J].科技情报开发与经济,2008(22):1-3.

[9]夏南强,张红梅.基于数据挖掘的数字图书馆个性化服务[J].图书馆学研究,2006(1):32-34.

[10]马文峰.数字图书馆个性化信息服务检索[J].图书馆杂志,2003(4):65-67.

[11]鲍静.关联规则挖掘及其在图书流通数据中的应用研究[D].合肥工业大学,2007.

[12]韩开来.关联规则在图书馆新书推荐中的研究[J].科技信息,2008(6):10-13.

[13]李荫涛.关联分析法在情报学中的应用.情报理论与实践,1990(1):5-8.

[14]邹常诗.科学文献计量分析与文献关联性研究[J].情报资料工作,2000(4):18-20.

[15]杨代庆等.从院士期刊文献对学部关联度的挖掘探索[J].情报杂志,2009(8):26-29.

[16]曹志杰,冷伏海.共词分析法用于文献隐性关联知识发现研究[J].情报理论与实践,2009(10):99-103.

[17]徐慧等.病毒性心肌炎主题词和副主题词关联规则分析[J].世界科学技术:中医药现代化,2009(4):593-596.

[18]金玮等.web信息检索技术中关联规则挖掘算法应用研究.情报杂志,2007(01):39-42.

[19]黄名选,陈燕红.关联规则挖掘技术研究[J].情报杂志:2008(4):119-121,115.

[20]刘俊熙.搜索引擎的搜索、索引和检索技术的关联分析[J].图书馆学研究,2005(09):84-86.

科学计数法规则篇4

一、学习目的和要求

本章主要从两个方面阐述会计核算所需的基本知识:一方面,阐述会计科目和账户的设置;另一方面,阐述复式记账的理论与方法。学习本章,要求理解设置会计科目的意义、原则以及会计科目的分类,进而重点掌握账户的基本结构和账户的基本数量关系;理解复式记账的原理和特点,重点掌握借贷记账法的账户结构、记账规则、账户的对应关系、会计分录的编制以及借贷记账法的试算平衡原理。设置会计科目和账户以及复式记账是会计核算特有的方法,是《基础会计学》的核心内容。通过本章的学习,要能深刻理解和熟练掌握账户和借贷记账法,从而为以后各章的学习打下坚实的基础。

二、课程内容

第一节 会计科目

(一)设置会计科目的意义

会计科目的涵义;设置会计科目的意义。

(二)设置会计科目的原则

1.统一性原则

2相关性原则

3.实用性原则

4清晰性原则

(三)会计科目的分类

1.会计科目按归属的会计要素分类

资产类、负债类、所有者权益类、成本类和损益类等五大类。

2.会计科目按所提供指标的详细程度分类

包括总分类科目和明细分类科目两类。

第二节 账户

(一)账户的涵义

账户的涵义;开设账户的必要性;账户与会计科目的关系。

(二)账户的基本结构

账户应当包括的基本内容:“t”型账户的格式。

(三)账户的基本数量关系

期末余额=期初余额+本期增加额-本期减少额

第三节 复式记账原理

(一)记账方法

记账方法的涵义;单式记账法和复式记账法。

(二)复式记账法

1.复式记账原理

复式记账法的涵义;会计等式的平衡关系与复式记账原理。

2.复式记账法的特点

复式记账法的两个主要特点。

第四节 借贷记账法

(一)借贷记账法的涵义

借贷记账法的涵义:“借”、“贷”两字作为记账符号的发展过程。

(二)借贷记账法的账户结构

借贷记账法的账户基本结构。

1.资产类账户与负债和所有者权益类账户的结构

借贷记账法的账户基本数量关系;各类账户的正常余额方向。

2.收入类账户和费用类账户的结构

(三)借贷记账法的记账规则

“有借必有贷,借贷必相等”记账规则的具体表述;运用借贷记账法的记账规则记录经济业务的两个步骤。

(四)账户对应关系与会计分录

1.账户对应关系

账户的对应关系与对应账户的涵义;账户对应关系的作用。

2.会计分录

会计分录的涵义;简单会计分录和复合会计分录。

3.会计分录编制举例

(五)过账

过账的涵义;过账举例。

(六)借贷记账法的试算平衡

1.试算平衡原理

试算平衡的涵义;发生额试算平衡和余额试算平衡原理。

2试算平衡表的编制

3.试算平衡表的作用

试算平衡表的作用以及不影响借贷双方平衡的账务处理错误。

三、考核知识点

(一)会计科目

(二)账户

(三)复式记账原理

(四)借贷记账法

四、考核要求

(一)会计科目

1.识记:会计科目的涵义。

2.领会:(1)设置会计科目的意义;(2)设置会计科目的原则;(3)会计科目的分类,工商企业主要会计科目表。

(二)账户

1.识记:账户的涵义。

2.领会:(1)账户与会计科目的关系;(2)账户的基本内容;(3)“t”型账户的格式;(4)账户的基本数量关系。

(三)复式记账原理

1.识记:(1)记账方法的涵义;(2)复式记账法的涵义。

2.领会:(1)会计等式的平衡关系与复式记账原理;(2)复式记账法的特点。

(四)借贷记账法

1.识记:(1)借贷记账法的涵义和记账符号;(2)借贷记账法记账规则的具体表述;(3)账户对应关系和对应账户的涵义;(4)会计分录的涵义;(5)简单会计分录与复合会计分录的涵义;(6)过账的涵义;(7)试算平衡的涵义;(8)发生额试算平衡和余额试算平衡的涵义。

2.领会:(1)借贷记账法的账户基本结构;(2)资产类账户与负债和所有者权益类账户结构的特点;(3)收入类账户和费用类账户结构的特点;(4)借贷记账法的账户基本数量关系;(5)运用借贷记账法的记账规则记录经济业务的两个步骤;(6)账户对应关系的作用;(7)登记账簿的过程;(8)试算平衡表的作用。

科学计数法规则篇5

关键词:粗糙集;时间序列;静态表;粒度决策演化模型;最小二乘法

中图分类号:tp18

利用粗糙集理论[1]对形成的静态决策表信息系统[2,3]进行属性约简和规则提取是一个有效处理数据的方法。文献[4]虽然在决策信息表中考虑到了时态属性,但仍然落脚在静态表上,没有研究决策信息表的演化性;在时态数据方面,文献[5-8]在时间序列数据挖掘和预测相关领域进行了研究。针对具有时间序列特征的决策表信息系统,引入多重时间粒度[9],并对其性质和发展趋势进行研究,建立了粒度决策演化模型。有关文献研究了移动平均和回归分析算法,但移动平均的数据拟合度不太好,回归分析的计算比较复杂。因此本文在粒度决策演化模型的基础上,结合最小二乘法[10]设计了模型的预测方法,相对于回归分析[11],该算法降低了复杂度,提高了数据的拟合度。

1相关理论

本部分主要是粒度决策演化模型的定义和性质,具体的定义和性质参考文献[12,13]。

定义1:在时间点Xi、Xi+1下,设决策信息系统SXi=(U,CXi∪DXi),SXi+1=(U,CXi+1∪DXi+1),SXi的值域分别为VcXi和VdXi;SXi+1值域分别为VcXi+1和VdXi+1,其中c∈CXi+1,d∈DXi+1,若满足:

(1)CXi+1=CXi;

(2)DXi+1=DXi;

(3)VcXi+1=VcXi;

(4)VdXi+1=VdXi;

则称决策信息系统SXi到决策信息系统SXi+1的变化为同源演化;否则称为多源演化。

定义2:设决策信息系统S在时间序列上相邻的两个粒度区间为gi和gi+1,由gi和gi+1得到具有相同决策属性值的决策规则分别记为Decision_lgi和Decision_lgi+1,gi+1相对于gi的属性继承度ina(gi+1|gi)(简称属性继承度)记为:

(1)

其中,Decision_lgic⌒Decision_lgi+1c表示Decision_lgi+1和Decision_lgi中具有相同条件属性c的个数,Decision_lgi表示Decision_lgi的所有条件属性的个数。

定义3:设决策信息系统S在时间序列上相邻的两个粒度区间为gi和gi+1,由gi和gi+1得到具有相同决策属性值的决策规则分别记为Decision_lgi和Decision_lgi+1,gi+1相对于gi的属性值继承度inaV(gi+1|gi)(简称属性值继承度)记为:

(2)

其中,Decision_lgi+1cv⌒Decision_lgicv表示Decision_lgi+1和Decision_lgi中具有相同条件属性并且属性值相同的条件属性cv的个数。

定义4:设由粒度gi推出的决策规则Decision_l中存在条件属性c,c相对于决策规则Decision_l的支持度Sup_D(c|Decision_l)(简称属性支持度)记为:

(3)

其中,Decision_lc表示条件属性c在所有决策属性值为Decision_l的决策规则中出现的次数,Decision_l表示所有决策规则的总数。

定义5:设由粒度gi推出的决策规则Decision_l中存在条件属性c,属性值为cv,则条件属性c的属性值cv相对于决策规则Decision_l的支持度Sup_DV(cv|Decision_l)(简称属性值支持度)记为:

(4)

其中,Decision_lcv表示条件属性c所对应的属性值cv在所有决策属性值为Decision_l的决策规则中出现的次数。

定义6:对决策规则所有的Decision_l的支持度Sup_D(c|Decision_l)=1的条件属性组成的集合称为决策规则Decision_l的属性支持核,记为coreS(Decision_l)。

定义7:对决策规则所有的Decision_l的属性值支持度Sup_DV(cv|Decision_l)=1的条件属性值组成的集合称为决策规则Decision_l的属性值支持核,记为coreSV(Decision_l)。

性质1:决策规则Decision_l的属性支持核在时间点Xi和Xi+1分别为coreSXi(Decision_l)和coreSXi+1(Decision_l),则有coreSXi(Decision_l)coreSXi+1(Decision_l)。

性质2:决策规则Decision_l的属性值支持核在时间点Xi和Xi+1分别为coreSVXi(Decision_l)和coreSVXi+1(Decision_l),则有coreSVXi(Decision_l)coreSVXi+1(Decision_l)。

性质3:在时间点Xi下,c1,c2coreSXi(Decision_l),cv1,cv2coreSVXi(Decision_l),若有Sup_DXi(c2|Decision_l)Sup_DXi(c1|Decision_l),Sup_DV(cv2|Decision_l)Sup_DVXi(cv1|Decision_l),则prio(c2)prio(c1),prio(cv2)prio(cv1),其中prio(c)表示属性c的优先级。

2基于最小二乘法的决策演化模型方法

2.1基于决策演化模型的最小二乘法

定义8:设在总体数据中,影响粒度决策演化模型的预测值y变化的因素完全可以由自变量x以线性形式解释,即粒度决策演化模型可以表示成y随x线性变化的关系,n对观测值(xi,yi)之间的关系符合yi=β0+β1xi+εi(i=1,2…n),这里xi表示粒gi和粒gi+1之间进行比较,且xi=i,yi表示对应的预测值。xi,yi是一个随机变量,它的随机性是由εi造成的,当x取xi时,相应的yi来自于一个概率分布,它的均值:

e(yi)=e(β0+β1xi+εi)=β0+β1xi(5)

即e(yi|xi)由于无法对全部数据进行研究,只能通过一次抽样来估计β0和β1,记β0、β1的估计值为=b0,=b1,假定通过某一方法找到了b0,b1,则有线性估计方程:

=b0+b1xi(i=1,2…n)(6)

与实际观测值yi的偏差记为ei,即ei=(yi-),要达到好的预测效果应使残差的平方和最小。即∑ei2=∑(yi-)2=∑(yi-b0-b1xi)2min,分别求关于b0,b1的偏导数,并令之为零,解出b0,b1,这就是基于最小二乘法的粒度决策演化模型预测方法。其求解的公式如下:

,(7)

,(8)

,(9)

,(10)

测定系数[14]是指可解释的变异占总变异的百分比,用R2表示,有[10]

(11)

从测定系数的定义看,R2性质如下:

(1)0≤R≤1。

(2)当R=1时,SSe=SSt,原数据的总变异完全可以由拟合值的变异来解释,并且残差为零(SSe=0),即拟合数据与原数据完全吻合。

(3)当R=0时,回归方程完全不能解释原数据的总变异,y的变异完全由与无关的因素引起,SSe=SSt。从相关度来看,拟合变量与原变量y的相关度越大,拟合直线的优良度就越高。

2.2基于最小二乘法的决策演化模型预测方法

结合粒度决策演化模型和最小二乘法,本文提出了最小二乘法预测方法(LSmpre),用以预测下一个粒度相应的决策规则和粒度属性值。具体步骤如下:

输入:决策信息表S=(U,C∪D)。

输出:下一粒度相应决策规则和预测值。

步骤1:使用传统静态表的规则对每个子粒gi进行提取得到相应的决策规则。

步骤2:整理决策规则,把具有相同决策属性值的决策规则归纳在一起构成新的决策树。

步骤3:设置初始计数器:i=1。

步骤4:处理第i个决策下的所有决策规则,计算每个属性的属性继承度和属性值继承度。

步骤5:根据求得的两两相邻粒度决策中条件元素形成新的数列,xi表示粒gi和粒gi+1之间进行比较,且xi=i,yi表示对应的属性继承度。

步骤6:应用公式(6)求条件属性在下一个时间粒的ina(gi+1|gi)。

步骤7:依据求得的两两相邻粒度决策中条件元素形成新的数列,xi表示同上,yi表示对应的属性值继承度。

步骤8:应用公式(6)求条件属性值,计算下一个时间粒的inaV(gi+1|gi)。

步骤9:ifi

步骤10:依据计算的不同决策属性值下各个条件属性的ina,inaV及Sup_D,Sup_DV,计算得到下一个粒度时间的ina和inaV,预测下一个时间粒可能出现的决策。

步骤11:输出这些决策和预测值,并根据预测值和测量值绘出效果对比图。

分析知算法的时间复杂度为o(n)。

3实例研究

文献[9]和[11]分别利用移动平均和回归分析对数据进行预测,但复杂度和数据拟合度不太好。因此本文在粒度决策演化模型的基础上提出了最小二乘法,并用实例来验证其效果。

设决策信息系统S=(U,C∪D),条件属性C={m,n,x,y,z},决策属性D={?},每个属性的值域为{0,1,2}。运行LSmpre步骤1将决策信息系统S=(U,C∪D)进行粒度划分得到U={g1,g2,g3,g4,g5,g6,g7,g8,g9,g10,g11},运行LSmpre步骤2对每个子粒度gi进行处理,得到粒度相应的决策规则,如表1。

表1时间序列下各粒度的决策规则

粒度决策规则粒度决策规则粒度决策规则

g1mon1x1y2f0

m2n0x2y2f1

n2x1y2z0f2g2n1x1y2f0

m1n0x2y2z0f1

m2n2y2z2f2g3m0x1y2z2f0

m2n0x2f1

m2x1y2f2

g4m0x1y2f0

m2x2y2z1f1

m2x1y2z2f2g5n1x1y2z0f0

n0x2y2z2f1

m1n2x2y1f2m0n1x1y2z2f0

n1x2y2z1f1

m1n2x2y1f2

g6

g7m0n1x1y1z0f0

x2y2f1

m2n2y1f2g8m0n1x1y2z2f0

n0y2z1f1

m2n2y2z2f2g9m0n1x1y1f0

n0x2y2z2f1

m1y2z1f2

g10x1y1f0

n0x2z2f1

m2y2z2f2g11m0n1x1y2f0

n1x2z2f1

m1n2z2f2

运行LSmpre步骤3,将表1中具有相同决策属性值的决策规则归纳到一起得到表2。

表2经过整理的粒度决策表

决策f0f1f2

决策规则mon1x1y2f0

n1x1y2f0

m0x1y2z2f0

m0x1y2f0

n1x1y2z0f0

m0n1x1y2z2f0

m0n1x1y1z0f0

m0n1x1y2z2f0

m0n1x1y1f0

x1y1f0

m0n1x1y2f0m2n0x2y2f1

m1n0x2y2z0f1

m2n0x2f1

m2x2y2z1f1

n0x2y2z2f1

n1x2y2z1f1

x2y2f1

n0y2z1f1

n0x2y2z2f1

n0x2z2f1

n1x2z2f1n2x1y2z0f2

m2n2y2z2f2

m2x1y2f2

m2x1y2z2f2

m1n2x2y1f2

m1n2x2y1f2

m2n2y1f2

m2n2y2z2f2

m1y2z1f2

m2y2z2f2

m1n2z2f2

由实例知LSmpre步骤4外层循环为for(i=1;i≤n;i++)(n=4)。当n=1时表示对决策f0进行处理。

运行LSmpre步骤5,在决策f0下属性继承度分别为:ina(g2|g1)=3/4,ina(g3|g2)=2/3,ina(g4|g3)=3/4,ina(g5|g4)=2/3;属性值继承度分别为:inaV(g2|g1)=3/4,inaV(g3|g2)=2/3,inaV(g4|g3)=3/4,inaV(g5|g4)=2/3。

当i=3时,运行LSmpre步骤6得新生数列1={(x1=1,y1=3/4),(x2=2,y2=2/3)}。运行LSmpre步骤7,得:b1=-1/12,b0=20/24,,e3=1/12,R2=1。

当i=4时,运行LSmpre步骤6得新生数列1={(x1=1,y1=3/4),(x2=2,y2=2/3),(x3=3,y3=3/4)}。

由新生数列1的数据,运行LSmpre步骤7和步骤8,得:

b1=0,b0=13/18,,e4=1/18,R2=0.9。

同理可得,=0.67,e5=0;=0.65,e6=0.05;=0.60,e7=0;=0.59,e8=0.01;=0.56,e9=0.04;运行LSmpre步骤9,并绘出表3和数据拟合效果图1:

表3真实值与预测值的对比图

i实际值预测值

10.75

20.67

30.750.58

40.670.72

50.670.67

60.600.65

70.600.60

80.600.59

90.500.56

图1数据的拟合效果

根据效果图的趋势可以说明此方法适合于本模型数据的预测,回到LSmpre步骤10执行下一次循环。

由于i

4结束语

从实例研究可知,最小二乘法适合于粒度决策演化模型的预测,相对于移动平均和回归分析,该算法更好地贴近原始数据,计算复杂度较低,是一种比较好的预测方法,因此下一步对于在实际生活中的应用将是研究的重点。

参考文献:

[1]张文修,吴伟志,梁吉业.粗糙集理论与方法[m].北京:科学出版社,2006:1-25.

[2]黄海,王国胤,吴渝.一种不完备信息系统的直接约简方法[J].小型微型计算机系统,2005(10):1761-1769.

[3]徐凤生,李海军.不相容决策表的求核方法[J].计算机工程与科学,2007(29):84-85.

[4]马志锋,邢汉承,郑晓妹.一种基于Rough集的时间序列数据挖掘策略[J].系统理论工程与实践,2001(12):22-29.

[5]孟志青.时态数据采掘中的时态型与时间粒度研究[J].湘潭学报(自然科学版),2000(22):1-4.

[6]BerberidisC,walidaG,atallahm.multipleandpartialperiodicityminingintimeseriesdatabases[C]//the15theuropeanConferenceonartificialintelligence.Lyon,France:ioSpress,2002:370-374.

[7]国宏伟,刘燕驰.多变量时间序列的模糊决策树挖掘[J].计算机应用研究,2009(26):54-55.

[8]胡玉文,徐久成.时间序列下决策表信息系统的最终形态研究[J].河南师范大学学报(自然科学版),2010(38):49-52.

[9]胡玉文,徐久成.多粒度时间序列下粒度决策的演化模型研究[J].计算机工程与应用,2011(20):117-120.

[10]王惠文.偏最小二乘回归方法及其应用[m].北京:国防工业出版社,1999:14-32.

[11]胡玉文,徐久成,张倩倩.决策表信息系统演化模型的回归分析预测算法[J].煤炭技术,2010(09):152-153.

[12]胡玉文,徐久成,李双群.粒度决策演化模型的博弈选择研究[J].计算机工程与应用,2012(48):51-54.

[13]胡玉文,徐久成,孙林.粒度决策演化模型的决策稳定性研究[J].计算机科学.2012(39):233-236.

[14]郝鹏飞.我国台风灾害损失分类与估计[D].哈尔滨工业大学,2008(10):43-45.

科学计数法规则篇6

小二乘估计。

关键词:自相关自回归模型参数折扣最小二乘

社会经济现象在较短时期内的结构稳定性一般总是优于较长时期,分析对象在两个较为接近的时期,其结构的相似性一般总是大于两个相距较远的时期。而结构稳定性是成功预测的关键,因此,在预测时,就要相对地强调近期资料,即遵守“近大远小”原则。

“折扣”最小二乘准则是“折扣残差平方和最小”,即

达到最小,其中α是折扣系数,α∈(0,1),由上式可以看出就是利用αn-i进行加权,对近期拟合误差给以较大的权数,对远期拟合误差给以较小的权数,一般对于波动较大的时间序列,折扣要打得大一些,对于波动较小的时间序列,折扣要打得小一些。

【引理1】二元线性回归模型:y=α0+α1x1+α2x2+e,运用“折扣”最小二乘准则,使得ε■■=■an-i[yi-(α0+α1x1i+α2x2i)]2=min达到最小,分别对α0,α1,α2求偏导数,得到正规方程组:

利用克拉姆法则便可得α0,α1,α2的“折扣”最小二乘估计公式。

【引理2】三元线性回归模型,y=α0+α1x1+α2x2+α3x3+e,运用“折扣”最小二乘准则,使得ε■■=■an-i[yi-(α0+α1x1i+α2x2i+α3x3i)]2=min达到最小,分别对α0,α1,α2,α3求偏导数,得到正规方程组

利用克拉姆法则便可得α0,α1,α2,α3的“折扣”最小二乘估计公式。

1线性自回归模型

已知时间序列{Xt},X1,X2,…,Xn,建立线性自回归模型:Xt=α+βXt-1+μt(μt=ρμt-1+υt)

有:Xt=α+βXt-1+μt(1.1)

Xt-1=α+βXt-2+μt-1(1.2)

用(1.1)-(1.2)得:

Xt-ρXt-1=α(1-ρ)+βXt-1-ρβXt-2+μt-ρμt-1

因μt=ρμt-1+υt,

则:Xt=α(1-ρ)+(ρ+β)Xt-1-ρβXt-2+υt

“类比”引理1得到正规方程组:

利用克拉姆法则可求得未知数α(1-ρ),β+ρ,-βρ,从而可得α,β的“折扣”最小二乘估计公式。

2幂函数自回归模型

已知时间序列{Xt},建立幂函数自回归模型Xt=αX■■expμt(μt=ρμt-1+υt),则

用(2.1)-(2.2)得

“类比”引理1得到正规方程组:

利用克拉姆法则可求得未知数(1-ρ)α,β+ρ,-βρ,从而可得α,β的“折扣”最小二乘估计公式。

3指数函数自回归模型

已知时间序列{Xt},建立指数函数自回归模型Xt=αβ■expμt(μt=ρμt-1+υt),则lnXt=lnα+lnβXt-1+μt(3.1)

lnXt-1=lnα+lnβXt-2+μt-1(3.2)

用(3.1)-ρ×(3.2)得

因μt=ρμt-1υt,则

“类比”引理2得到正规方程组:

利用克拉姆法则可求得未知数(1-ρ)α,β,ρ,-βρ,从而可得α,β的“折扣”最小二乘估计公式。

4对数函数自回归模型

已知时间序列{Xt},建立对数函数自回归模型Xt=α+βlgXt-1+μt(μt=ρμt-1+υt),则

用(4.1)-ρ(4.2)得:

“类比”引理2得到正规方程组:

利用克拉姆法则可求得未知数(1-ρ)α,β,ρ,-βρ,从而可得α,β的“折扣”最小二乘估计公式。

参考文献:

[1]孙敬水.计量经济学教程[m].清华大学出版社,2005.

[2]刘娟娟等.一类非线性椭圆方程爆破解的渐近行为[J].南通大学学报:自然科学版,2012(2):82-87.

[3]徐阳等.线性自回归模型的自回归分析[J].高等函授学报(自然科学版),2010(02):90-92+94.

[4]曹彩娟,宗序平.冬天极端低温回归时间的长程相关性[J].南通大学学报:自然科学版,2011,10(04):68-71.

[5]吕效国.自回归预测的改进方法:变换数据列[J].统计与决策,2007(03):139-140.

[6]郭跃华.水资源短缺的风险因子识别模型[J].南通大学学报:自然科学版,2011,10(04):79-82.

基金项目:

科学计数法规则篇7

摘要本文从提升医院统计的地位和作用、增强统计数据的时效性、准确性和操作性、提高统计人员业务素质三方面讲述了如何提高统计工作质量,使之更好的为医院管理服务。

关键词医院管理统计质量提高

当今,我国医疗改革不断深入推进,医疗市场竞争日趋激烈,都要求医疗管理必须适应新的形势和要求。而要实施科学有效的管理,则离不开高质量医疗信息的支持。因此,提高医院统计工作质量,在现代医院管理和医疗建设中尤为重要。医院管理要从以下几点做好统计工作。

一、提升医院统计的地位和作用

医院统计作为统计工作的一个分支,是医院管理层制定各项计划的基础,它包括医院的医疗动态、医疗服务质量、住院患者医疗费用等等问题。我们应充分发挥医院统计在医院管理中的作用。

1.坚持用《统计法》指导和规范统计工作。我国颁布的最新《统计法》对统计工作的作用、内容以及方法都作了明确的规定。统计人员要认真学习领会《统计法》规定要求,遵循以《统计法》为基本开展工作,强化依法统计的意识,始终站在贯彻国家法律法规的高度来落实卫生统计工作,坚持用《统计法》规范工作内容、程序和方法,使统计工作更加适应医院发展。

2.建立责任明确、协调顺畅的工作机制。医院统计是一项技术性、政策性强,协调多的工作。要适应医院信息化建设的发展,统计工作必须建立一套完备的工作机制。医院可以建立在院长直接领导下的信息科和质量管理委员会,配备统计、信息员和病案、医疗质量管理人员,形成以信息科为核心,以科室为辅助,以点带面的信息管理网络。工作中要依据统计工作制度,明确工作职责,提出工作目标,完善奖罚制度,使统计工作在一个良好的工作轨道上前进发展。

3.主动作为,高效为决策者和管理层服务。现代医院管理需要准确、科学的统计数据来支持。统计人员要根据职能要求和形势需要,在做好日常数据搜集、监测和汇总的同时,树立管理意识,主动对医院整体数据进行分析,针对医院运行过程中出现的新问题、新情况,及时归纳总结,合理评价分析,向决策者和管理层提出合理化的建议意见,促进医院科学发展。医院信息系统HiS的应用,为统计人员参与管理提供了一个良好的可操作性平台。通过信息简报、专题分析、综合评价等形式,将问题和信息反馈给不同层次的管理者,以此提高统计信息的利用度。

二、增强统计数据的时效性、准确性和操作性

统计的根本在于数据的及时、准确、真实。如果数据不真、不实,医院决策者将无法做出科学、正确的判断,必然会对医院整体发展规划产生误导。确保数据的及时、准确、真实,要从以下几点做起:

1.最大限度减少人为因素。统计人员要树立质量意识,坚持贯彻实事求是的原则,坚决反对和制止弄虚作假,减少人为因素对数据的影响。结合职务、职称晋升把统计工作与个人绩效挂钩,增强统计人员的责任心,使统计人员认真细致进行统计,并且对生成的每一份数据高度负责,确保统计数据的真实准确、全面及时。

2.坚持关口前移原则。医院的主要数据分别通过医生站和护士工作站等录入,每天都有新情况,变化无规律。数据录入是否及时准确,直接关系到统计数据的质量。因此,要及时改进并监督源头统计工作,把纠错工作关口前移到科室原始数据的录入与核查上,督导科室医生、护士工作站信息录入员认真履行原始数据录入和核查双重职责,把错误消灭在原始数据录入的关口上,把医院信息核查与纠正工作做在科室数据汇总之前,不断提高统计效率。

3.规范完善原始记录。医院统计数据主要来源于门诊挂号、住院登记、病房医生工作站、护士工作站。如果其中的一个环节出现问题,则直接影响统计分析的准确性。因此,一定要规范操作,统一原始记录、基础登统计表格的填写要求,如要求医生书写疾病诊断一律遵循

规定标准,并利用各级查房进行检查和指导。建立健全原始记录填写、上缴、查阅、归档、保存等制度,使统计资料收集管理做到系统化、科学化。

三、提高统计人员业务素质

统计人员身兼多职,工作岗位不固定,业务素质参差不齐,是影响医院统计工作发展的主要因素。统计人员由非专业人员改行、业务上没有接受系统培训、缺乏协调管理和综合分析能力等问题,严重束缚了统计工作的服务范围和内容。因此,要提高统计工作质量,就必须要提高统计人员业务素质。

1.统计人员要熟练掌握统计分析方法。能否提供高质量的统计分析报告是统计人员综合能力的体现。科学管理离不开准确的数据和科学的分析,统计分析方法的科学性和合理性,会直接影响统计结果,进而影响到管理者决策的方向。因此,统计人员要加强学习和交流,拓宽知识面,善于在工作中不断积累工作经验,丰富自身综合分析能力,让信息服务具有高度的科学性、准确性和实用性。

2.统计人员要提高自身统计分析能力。医院各科室每天都会产生大量的数据,这些原始数据表现只是数字的加减,并不能反映各科室工作内在性质和规律,这就需要统计人员通过对医院信息系统中的数据进行整理和纵横向对比,合理地运用统计知识,综合成每月、季度、年度的统计分析报告。统计人员综合分析能力的高低,直接影响统计分析报告质量的好坏。由此可见,综合分析能力是统计人员必备素质,医院统计人员要积极学习借鉴同行好的统计分析报告,从中积累和丰富工作方法;并培养和树立多观察与多思考的意识,留心每一个数据,清楚数据之间的内在联系,使统计分析能切中要害,有的放矢。

3.统计人员要注重实践锻炼。要把工作过程转变为学习提高的过程,做到重视信息交流,积极加强与临床科室的联系,针对工作的疑点、难点,及时向科室了解、咨询,对统计数据做到心中有数。并将工作中遇到的疑点问题记录下来,及时进行研究解决,避免工作出现差错。同时注意把处理重点数据的程序、方法、原则记录下来,以便今后遇到类似问题时能参考借鉴。再者,统计人员在工作中要善于思考,及时总结探索经验,在不断创新中提高工作能力。

参考文献:

[1]戴云洁.抓数据源头确保统计质量.中国医院统计.2008.15(2):169.

科学计数法规则篇8

[关键词]社会经济统计学;数理统计学;关系;分析

[Doi]10.13939/ki.zgsc.2016.16.215

当前的统计理论学界对社会经济统计学和数理统计学两者之间的关系看法主要分为两种,一种看法是分的关系。该看法认为应该将社会经济统计学和数理统计学分别依照各自的理论基础、内容结构向前纵向发展,但也不是完全地分离,两者之间还是可以互相借鉴学习,共同进步。而另一种看法则认为两者之间是合的关系。该看法认为应该把社会经济统计学和数理统计学两者合为一体,使其既可以用来对自然现象进行认识,也可以成为对社会现象进行认识的工具。所以,对社会经济统计学和数理统计学两者之间的关系进行认识,有利于统计工作人员更好地学习和工作,了解自然现象的规律和社会现象的规律。

1社会经济统计学和数理统计学的概念分析

1.1社会经济统计学的概念

社会经济统计学可以被划分为社会科学类,经济、工业、商业以及农业统计学都是社会经济统计学所包含的分科,这一说法在我国统计学界是得到一致认同的。然而被用于概括与运用社会经济领域,并被划分在社会科学的各个专业统计学的相关原理、原则以及基本概念和方法,从逻辑上来说也从属于社会科学类。通常说来,一门科学其性质都具有分层次的特性,社会经济统计学中的社会性属性与阶级性属性就属于第一层次的特性,也是最根本和核心的特性。无论社会经济统计学是高层次的实质性科学还是低层次的方法论科学,社会经济统计学作为原理分科的科学,首先都应当对其社会属性进行承袭,如果社会经济统计学对其自身的社会性属性与阶级性属性进行否认,那么从其原理方面和逻辑方面都是说不通的。简单来说,社会经济统计学主要是对社会经济统计活动的相关规律与办法进行研究,是一种调查活动和研究活动。

1.2数理统计学的概念

数理统计学就是运用模型和新技术对通过社会调查收集起来的数据进行统计分析和处理。在一些比较前沿的科技问题以及国民经济问题中,都可以利用数理统计学对这些复杂的重大问题进行预先推断和判断,以此为决策与行动提供可靠的依据和建议,除此之外,对于社会与政府中存在的问题,也可以应用数理统计学对其进行分析和处理。因而,数理统计学是一门应用十分广泛的基础性学科。对于数理统计学来说,其分支学科主要有:第一类,主要有抽样调查学与实验设计学,这一阶段主要学习数据收集的理论和方法;第二类,该类分支学科较多,其学习任务均以学习统计数据推断的原理与方法为主,其中统计数据的推断形式、统计数据观点以及理论模型或是样本结构的构建都是特定和固有的。而对参数的估计与检验假设是特有的统计数据的推断形式;贝叶斯统计观点和统计决策理论观点是特有的统计数据观点;非参数统计模型、多元统计分析模型、回归分析模型则是特有的理论模型。数理统计学在具体解决某一问题时,其步骤主要有以下四方面。一是建构数学模型;二是收集数据并进行整理;三是对统计数据进行推断;四是进行最后的统计预测与决策。

2社会经济统计学和数理统计学的关系

2.1二者渊源分析

社会经济统计学在原始社会末期,奴隶社会早期就已经开始萌芽,主要是对人口数量与土地的丈量进行统计,伴随着社会和经济的发展,社会经济统计学在封建社会就已经初具规模,在资本主义时期,其发展更是到了上升时期。社会经济统计学的发展离不开人类的实践活动,在实践中逐渐成熟。直到在统计学中引入了概率论以后,才使统计学诞生出一门新的学科,即数理统计学。

2.2二者共通之处

社会经济统计学和数理统计学都是对事物的统计规律进行研究,并且在研究方法论方面具有共通性,两者都是利用归纳推理的研究方法而不是演绎推理的研究方法。在许多教材中,在对数理统计学的学科性质进行阐述时都明确表示数理统计学是对随机现象的数据进行统计,并对其规律性进行研究与揭示。而关于社会经济统计学的研究对象,在统计学术界还存在一些争议,一部分学者认为,社会经济统计学属于独立的社会科学类,主要是对具体时间、具体地点条件下的社会经济现象中的数量表现进行研究和统计,并揭示其数量规律,认为其数量表现和规律就是社会经济统计学需要研究的对象。还有一部分学者则认为社会经济统计学属于统计方法论科学类,重在对社会经济现象下的数据进行收集、整理、统计与分析,认为其统计方法论就是需要研究的对象。而经过长期的实践来看,社会经济统计学和数理统计学两者在研究对象上其实具有同一性,这两门学科都是在对事物的统计规律进行研究和揭示。首先,从“研究对象”的本身含义来看,把某一人或是某一事物当作自身行动和思考的目标,才叫研究对象,这就表示研究对象由两个不同部分构成,一部分是研究目标;另一部分是研究客体。所以,把事物的统计规律性作为统计学的研究对象,符合“研究对象”的本义。当然,要想达到最终的目的,方法的使用也很重要;对于统计学来说,其研究方法都是来源于哲学科学中的归纳推理法,核算方法则是从哲学和数学共同的方法论中衍生而来。因此,说对事物的统计规律性进行研究是统计学的研究目标,自然和社会现象是统计学的研究客体是非常正确的。归纳推理法是对具体的事实进行原理概括,命题具有个别性特点,结论则适用于普遍性和一般性,且结论的内容远远大于前提。利用归纳推理法对自然和社会现象的统计规律进行研究和推断,能够从局部预先对总体有一个清楚的认识。所以,社会经济统计学和数理统计学均采用归纳推理法进行相关工作。

2.3两者差异之处

第一,研究范围不同。对于社会经济统计学来说,主要是对社会经济现象进行研究,而对于数理统计学来说,除了对自然现象进行研究以外,还可以对社会现象进行研究。社会经济统计学虽然只对社会经济现象进行研究,但是社会经济现象包含的领域非常多,内容也非常丰富。从广义的角度来看,社会经济现象除了有人类自身的再生产活动,还有物质、精神、自然环境的再生产活动,这些活动互相影响和制约,紧密结合又不可分离,所以社会经济统计学还需要对这四类再生产活动之间的关系进行研究。从研究层次和研究内容来看,社会统计经济学涉及对人类生产生活的各个领域的研究。数理统计学研究的对象均属于自然现象,也就是随机现象。而社会经济统计学研究的社会经济现象除了具有随机现象以外,还有确定性现象。

第二,理论基础不同。概率论是数理统计学最重要的理论基础,尤其是抽样推断更是以概率论的大数法为基础和核心,在大多数的随机现象中,大数法具有稳定性,大量且独立的随机因素组成了研究总体,这些因素对研究总体的影响非常小,使其抽样平均数接近总体平均数。社会经济统计学在研究方法上也把概率论当作理论基础,而在客体研究上则是把经济学理论当作理论基础,利用马克思的社会再生产理论、劳动价值理论、现代货币理论等哲学理论作为社会经济统计学的思维方式。

3结论

通过本文的分析可以知道,社会经济统计学和数理统计学两者都是统计学的重要分支,两者在研究对象和方法论上都具有共通性,但是在研究范围方面和理论基础方面又具有一些差异。所以在学习统计学时,不可以将这两者分离开来。

参考文献:

科学计数法规则篇9

本书共7章:1.命题逻辑:从公理和推理规则的证明。通过生活中的一个逻辑实例引入本节重点,依次介绍了纯命题演算、基于微积分的证明示例、纯正蕴涵命题演算、布尔逻辑等相关内容;2.一阶逻辑:量词的证明:包括一阶纯谓词演算与证明方法、平等谓词的相关介绍;3.集合论:脱离、对位和矛盾的论证:包括集合与子集的相关概念、并集与交集、笛卡尔积、函数与反函数、等价与序关系等相关基本知识;4.数学归纳:归纳法的定义和证明:包括整数、无理数、有限/无限基数的储备知识介绍,数学归纳法的引入与证明;5.形成集:通过超限归纳法证明已经有序集。包括超限的方法、超限集和序数及相关规律的介绍;6.选择公理:用超限归纳法证明。通过最优排序准则、集合的交叉与合并、策梅洛原则及其他相关公理证明选择性公理;7.应用:集合、功能和关系在诺贝尔奖获奖(nobel-prizewinning)中的应用的。引入了博弈论、匹配度及箭头的不可能性定理,解释诺贝尔奖运作过程的具体原理。

作者Yvesnievergelt是华盛顿大学数学系教授,曾于华盛顿大学获得数学硕士和博士学位,主要研究兴趣包括应用分析(数学应用于化学、医学诊断成像、物理),复杂分析、数值分析(科学规划数学)等。

本书包含大量的文献资料及相关文档的历史,主要包括逻辑、证明、集和数字理论,在理论方面逻辑严谨,内容详实,实例方面极具吸引力,可以作为一个独立的学习参考资源。本书适合数学,逻辑和计算机科学以及社会科学领域的本科二年级以上学生、感兴趣者或研究人员阅读。

科学计数法规则篇10

“计算”是一个无人不知无人不晓的数学概念。无论是人们的日常生活,还是平常的生产实践和科学研究,都离不开计算。同时,“计算”也是一个历史悠久的数学概念,它几乎是伴随着人类文明的起源和发展而起源和发展的。但是,真正能够回答计算的本质是什么的人恐怕不会太多。应该说,在20世纪30年代以前,还没有人能够说得清计算的本质是什么,以及什么是可计算、什么是不可计算的等问题。30年代中,由于哥德尔、丘奇、图灵等数学家的工作,人们终于弄清楚了计算的本质,以及什么是可计算的和什么是不可计算的等根本性问题。由此也就形成了一个专门的数学分支——递归论或可计算性理论。在此我们就是以这一理论为背景,概括出计算的本质,并阐明其他一些根本性问题。

计算首先指的就是数的加减乘除,其次则为函数的微分、积分、方程的求解等等;另外还包括定理的证明推导。抽象地说,所谓计算就是从一个符号串f变换成另一个符号串g。比如说从符号串12+3变换成15,这就是一个加法计算。如果符号串f是xx,而符号串g是2x,从f到g的计算就是微分。定理证明也如此,令f表示一组公理和推导规则,令g是一个定理,那么从f到g的一系列变换就是定理g的证明。从这个角度看,文字翻译也是计算,如f代表一个英文句子(由英文字母及标点符号组成的符号串),而g为含义相同的中文句子,那么从f到g就是把英文翻译成中文。这些变换间有什么共同点?为什么把它们都叫做计算?

为了回答究竟什么是计算、什么是可计算性等问题,人们采取的是建立计算模型的方法。从30年代到40年代,数理逻辑学家相继提出了四种模型,它们是递归函数、λ演算、图灵机和波斯特系统。这种种模型各不相同,表面上看区别很大,它们完全是从不同的角度探究计算过程或证明过程的。但事实上,这几种模型却是等价的,即它们完全具有一样的计算能力。在这一事实基础上,最终形成了如今著名的丘奇—图灵论点:凡是可计算的函数都是一般递归函数(或都是图灵机可计算的,或都是λ演算可计算的,或都是波斯特系统可计算的)。这就确立了计算与可计算性的数学含义。这一表述过于抽象,下面我们给出一个比较直观的说法:所谓计算,就是从已知符号串开始,一步一步地改变符号串,经过有限步骤,最后得到一个满足预先规定的符号串的变换过程。现已证明:凡是可以从某些初始符号串开始而在有限步骤内计算的函数与一般递归函数是等价的。这就是说,所有可计算的函数都是通过符号串的变换来实现其计算过程的,即计算就是符号(串)的变换。(1)

与计算具有同等地位和意义的基本概念是算法。从算法的角度讲,一个问题是不是可计算的,与该问题是不是具有一个相应的算法是完全一致的。一般而言,算法就是求解某类问题的通用法则或方法。也就是一系列计算规则或程序,即符号串变换的规则。

正是这样一个原本只是数学中的基本概念,如今却成为各门科学研究的一种基本视角、观念和方法,上升为一种具有世界观和方法论特征的哲学范畴。

我们认为,人类最早把计算作为一种哲学性观念和方法而不仅是一种数学观念和方法,并自觉运用到有关领域的研究中,是一些人工智能的专家们做出的,尤其是在后来的认知科学研究中很明显地表现出这一倾向。由于纽威尔、西蒙、福多、明斯基等一大批学者的努力,物理符号系统假说、心灵的表达计算理论,心脑层次假说等相继提出。这些理论的一个共同主题就是:思维就是计算(认知就是计算)。他们明确主张:思维是一种信息加工过程,亦即计算过程,这种计算就是指某种符号操作或加工,指在能对其提供语义解释的符号代码的形式表达式上所进行的受规则制约的变换,如问题求解这种思维活动就是通过一定的算法对初始态空间进行操作,直达到目标态空间。有人更进一步主张:心灵有一套程序或一组规则,类似于控制计算机的程序,思维是一种包括对单词在内的符号的操作。(2)

除了思维、认知可看作是一种计算,一些研究视觉认知理论的学者把视觉也看作是一种计算。这主要是来自马尔的《视觉计算理论》。这一理论认为,在计算理论层次上,视觉信息处理过程由三种内部表象表征:描述图像光强度与局部几何结构的要素图;描述以观察者为中心的物体可见表面的朝向、轮廓线、深度及其他性质的二维半图;识别和理解物体的三维表象。这个理论把视觉过程理解为功能模块(像元空间、图像空间、景物空间)的变换。这意味着视觉计算的基本单位是符号表象。3在此基础之上,后来人们又提出了视觉拓扑计算理论等各种视觉计算理论。其共同点是均认为视觉过程就是一种计算过程,但是对它是一种什么样的计算还存有较大分歧。

在对认识、思维、视觉等内容进行计算主义研究的同时,人们确立了大脑就是一台计算机的信念:大脑的生物结构是其硬件,大脑的运作规律是其软件,大脑的(广义)思维过程就是其计算过程。20多年前的“计算机能否思维”的问题已经演化为当今的“人脑是否计算”的问题。更重要的是,“思维就是计算”这已不仅仅是一个哲学性的命题,而且已成为科学方法论意义上的一个科学假设。人们早已从科学意义上探究思维的计算本质,计算已成为当前认知科学中占主导地位的一种基础观念和研究方法,人们试图从计算的角度揭示出思维、意识以及整个大脑的全部奥秘。

把计算作为哲学性观念和方法运用到具体学科研究中的另一个范例是与生命科学相关的一些研究。这主要体现在20世纪80年代以来,人工生命科学、遗传算法理论和Dna计算机等新型学科的相继涌现。这些学科或理论的共同之处就在于都是以计算作为自己研究的观念和方法,主张生命就是一种算法,一个程序,一个能够实现自我复制、自我构造和自我进化的算法。人工生命的基本信条是:生命的特征并不存在于单个物质之中,而存在于物质的组合之中。生命的规律是一种动力形式的规律,这种规律独立于45亿年前地球上形成的任何特定的碳化物细节之外。即生物体的“生命力”存在于分子的组织(软件)之中,而不是存在于分子本身。人工生命就在于用计算或算法的观念与方法探索生物学领域中的奥秘。把生命与计算机类比,似乎是19世纪机械论在当今的延续,看起来有背于时展的潮流。但人工生命的奠基者朗顿认为,答案就在于进一步的伟大洞见之中:生命系统这台计算机具有与通常意义上的机器全然不同的组织形式,有生命的系统几乎总是自下而上的,从大量及其简单的系统群中突现出来,而不是工程师自上而下设计的那种机器。朗顿强调说:“最为惊人的认识是:复杂的行为并非出自复杂的基本结构。确实,极为有趣的复杂行为是从极为简单的元素中突现出来的”。4这就是说,生命包含着某种能够超越纯物质的能力,不是因为有生命的系统里被某种物理和化学之外的一种生命本质所驱动,而是因为一群遵循简单的互动规则的简单物体能够产生永远令人吃惊的行为效果。生命就是这样一种生化机器,只要启动这台机器,而不是把生命注入这台机器,即将这台机器的各个部分组织起来,让它们产生互动,从而便具有了“生命”。生命就是这样一种算法。算法对于生命的意义,就在于以过程或程序描述代替对生物的状态或结构描述,将生命表达为一种算法的逻辑,把对生命的研究转换成对算法的研究,特别是把对真实生命的研究转换成对人工生命的研究。1994年11月美国科学家阿德勒曼在《科学》上公布的Dna计算机理论,更是从另一个角度揭示了生命就是算法,进化就是计算的观念。5Dna是生命的基石,任何生命类型的所有特征都以严格的规则编码在其Dna序列上,不管是生命的结构,还是生命的过程,在这个意义上它是一个信息库或数据库。另外,Dna所有的行为都是以程序化、模块化的形式表现,在这个意义上它又是一个程序库。无论它是作为信息库还是程序库,Dna都具有基本的计算特征。而生物体中所有现象的基本形式都是Dna的复制、切割、粘贴,这一事实深刻表明,生命本身就是由一系列复杂的计算或算法组成的。生命系统就是一台以分子算法为组织法则的多层次生物计算机,Dna计算机就是对生命这种自然计算机的一种表征。从前,分子算法,如自复制自动机、胞格自动机、遗传算法、人工生命等全都是在电子计算机上实现的,Dna计算机概念的出现是分子算法的化学实现的开端。这种立足于可控的生物化学反应或反应系统,无疑更加有力地直接地表明了生物现象与过程的计算特征。正如有人所言:Dna计算宣称数学处于生命的核心。

运用计算、算法观念和方法研究认知问题和生命系统,有着深刻而普适的科学方法论意义,它们是人们运用算法观念和方法研究其他自然现象或自然系统的两个有益的重要范例。如今,计算或算法的观念与方法已经深入到宇宙学、物理学、化学乃至经济学、社会学等诸多领域。计算、算法已经成为人们认识事物、研究问题的一种基本的普适的观念和方法,人们的科学实践,已经使计算、算法上升到哲学性的观念和方法。在这一现实背景之下,我们以为,把计算、算法作为一种哲学范畴正式提出并引入哲学已是十分必要的。这不仅是因为已经有了一些成功的范例,而且还有着更深层的学理:生命、大脑是最复杂的自然现象之一,是自然界进化的最高代表。因此,我们完全有理由猜测:整个自然界也是按算法构成的,是按算法演化的。现实世界之万事万物只不过是算法的复杂程度的多样性。从虚无到存在、从非生命到生命、从感觉到意识、思维,或许整个世界的进化过程就是一个计算复杂性不断增长的过程。这就是说,自然界就是一台巨型计算机(硬件),任何一种自然过程都是自然规律(软件)作用于一定条件下的物理或信息过程(计算过程),其本质上都体现了一种严格的计算和算法特征。生命系统作为自然界中最复杂最有特色的系统,它也就是形形色色的自然计算机中的一种。这或许就是人工生命与Dna计算理论所蕴含的最重要的哲学道理。

把计算、算法作为一个哲学范畴,还有着哲学史上的渊源关系。也许人们还没有忘记,在2500多年前,一位名叫毕达哥拉斯的古希腊人曾向世人宣称:万物皆数。今天,我们何以不能说:万物皆算法。严格地说,当年毕达哥拉斯率先提出的“数”这个重要范畴,并不是一个纯粹哲学性范畴,而是一个从数的角度寻求世界万物之本原,考察事物生成演化过程,由自然科学思维方式与哲学思维方式相互融合的过渡性范畴。这种观念在近代和现代科学与哲学中得到了充分的继承和发扬。这说明,哲学范畴在其生成、演化和发展的过程之中,总要受到各个历史时期数学发展程度、数学思维方式的影响和规定。这或许可以称为哲学范畴的数学规定,正因为如此,当今计算机科学的发展,使得我们完全可以把毕达哥拉斯的“数”向前推一大步。毕达哥拉斯哲学在当代有了更深刻更丰富的内含。

最后我们要指出的是,已经泛化到整个科学领域中的计算、算法这个概念,完全具有哲学范畴的基本特征。众所周知,哲学范畴是反映事物本质属性和普遍联系的基本概念,人类理性思维的逻辑形式。它是人类在一定历史时论思维发展水平的标示器,是帮助人们认识和把握自然现象和社会现象之网的网上扭结;是对自然、社会和思维发展过程最本质、最普遍的联系的表征。哲学范畴对各门具体科学都具有普适的哲学方法论意义。如今,人们在各方面都开始用算法的观念来看待问题、用计算的方法来解决问题,不正表明计算与算法的一种范畴性吗?历史上每次重大的科技进步,都要改变当时的哲学范畴,有时甚至是直接把科学中的基本概念移植到哲学中。当今计算机科技对哲学的影响也不例外。这正是有人所说的哲学范畴的科技命运。因此,及时总结和概括当代科技成果,把最为精华的人类理念上升为一种哲学范畴,不仅是哲学范畴自身发展之所需,更是各门科学文化进一步发展所必须。只有渗透着时代最主要、最有效的观念和方法的科学与文化,才能真正体现时代之精神,成为时代之主流。

参考文献

(1)莫绍揆.递归论.科学出版社,1987年。

(2)邱仁宗.当代思维研究新论.中国社会科学出版社,1993年。

(3)(美)D.马尔.视觉计算理论.科学出版社,1988年。