首页范文大全科学计数法的学情分析十篇科学计数法的学情分析十篇

科学计数法的学情分析十篇

发布时间:2024-04-29 15:45:38

科学计数法的学情分析篇1

关键词图书馆学情报学研究热点信息可视化

1引言

被webofScience(下文简称“woS”)中的SSCi数据库收录的图书馆学情报学即inFoRmationSCienCe&LiBRaRYSCienCe(下文简称“LiS”)类期刊共计85种(截止2016年4月7日)。刊载在这些期刊上的研究成果,一方面反映了世界主要国家或地区LiS领域研究的热点和前沿,另一方面,也反映了际上高水平研究者的其他科研信息。以往由于载文量巨大,加之受分析技术工具的限制,研究者多是运用人工逐篇抽样阅读的方法,对国际顶级期刊的部分文献进行研究,带有较强的主观性,无法完整、客观地对某个时间段内的全部文章进行分析。专家的主观分析虽然具有一定的指导意义,但往往缺乏公允性、完整性和客观性。笔者将woS中的与北京大学图书馆编辑的《国外人文社会科学核心期刊总览》(下文简称《总览》)中重合的27种图书馆学情报学类期刊作为研究对象,并根据2014年影响因子的高低作适当增减,运用Citespace可视化软件,对woS中2014-2015年刊载的3287篇文献进行科学计量分析。本文要探讨的问题是:近2年国际高水平的LiS期刊的研究热点及其覆盖的科学领域、科研机构,论文的国家或地区合作情况、核心作者与核心被引作者群、核心被引期刊概况。希望本文具有如下特点:全样本数据的完整性、研究对象的时效性、分析工具的客观性以及知识图谱的直观性等,为我国研究者了解和掌握国际LiS领域的研究热点、前沿、对象、方法、研究者、研究机构、核心期刊等情况提供完整、及时、客观、直观的数据分析,减少研究者获取本领域科研情报的盲目性,提高研究效率。

2研究方法

2.1引文分析法

1955年,加菲尔德(e.Garfield)在《科学》上发文提出了一种科学文献书目系统,可剔除对虚假、过时或完整性较差的数据的任意引用,使学者们可了解到对早期论文存在的批评。引文分析法至此正式产生。引文分析就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,以便揭示其数据特征和内在规律的一种文献计量的分析方法。本文使用引文分析法,主要原因是该方法能回答以下三个问题:第一,某些文献为什么能持续成为研究者关注的核心?第二,这些核心文献中已经出现或即将出现哪些趋势?第三,某领域或学科的文献与其他学科的交叉呈现出何种关系或态势?引文分析有三种基本类型:①对引文数量进行研究,主要用于评价期刊和论文等。②对引文间的网状关系或链状关系进行研究。科学论文间存在着一种引用关系网,如a被B引,B被C引,C又被a引等,研究这种关系主要用于揭示学科的发展与联系,并展望未来前景等。③对引文反映出的主题相关性进行研究,主要用于揭示科学的结构和进行文献检索等。引文分析法的上述三种类型,分别回答和解释了上述三个问题。

2.2词频分析法与共现分析法

本文所指的“词”,即Citespace软件中的“term”。美国著名情报学专家萨隆(G・Salon)认为,term表示主题词、名词、标引词、情报项、文献著录项、标引与检索的信息单元等。词频分析是将文献中的多个因子联系起来的引证分析方法,它能科学地评价文献、文献作者的学术水平,揭示学科的热点、前沿以及发展趋势。共现分析法则是将文献中的各种共现信息定量化的分析方法,通过共现分析,可以发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用知识,并揭示研究对象所代表的学科或主题的结构与变化。在计算机技术的辅助下,共现分析在构建概念空间和实现语义检索、改进知识组织中文本的分类效果、分析文献中的知识内容关联、挖掘知识价值等方面彰显出独特的提炼和概括功能。通过软件进行词频分析与共现分析,能较好地抽取出所分析文献样本的热点、前沿趋势以及科学结构等关键情报。

2.3科学知识图谱与信息可视化方法

科学知识图谱(mappingKnowledgeDomains)是显示科学知识的发展进程与结构关系的一种图形,用可视化技术描述人类随时间拥有的知识及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系。在组织内创造知识共享的环境以促进科学技术研究的合作和深入。

信息可视化涉及计算机生成交互式信息图示的设计、开发和应用。首先要处理抽象的、非空间的数据。把非空间的数据转换成直观的、有意义的图像对该领域极其重要,这个转换的过程是一个创造性的过程,设计者可以赋予图像新的意义。本文运用科学图谱与信息可视化的理论,通过Citespace软件,将需分析的文献进行图像转化和处理,赋予客观、科学的意义。

2.4LLR算法与pageRank算法

本研究采用LLR算法对聚类进行命名。LLR即对数似然比算法,全称Log-LikelihoodRatio。其基本原理是:假设对于类别Ci,词wi的频度(oc),集中度(β)和分散度(丫)等指标组成向量Vji,选取聚类命名就是根据Vij来判断wi是否可以作为类别Ci的特征词。LLR算法如下:

式中,LLR为词wi对于类别Ci的对数似然比,p(Ci\Vij)和p(Cj\Vij)分别为在类别Cj和Cj中的密度函数。

pageRank网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种根据网页之间相互的超链接计算的技术,作为网页排名的要素之一,以Google公司创办人拉里・佩奇(Larrypage)之姓来命名的。该算法的发明者对网络超链接结构和文献引文机制的相似性进行了研究,把引文分析思想借鉴到网络文档重要性的计算中来,利用网络自身的超链接结构给所有的网页确定一个重要性的等级数,当从网页a链接到网页B时,就认为“网页a投了网页B一票”,增加了网页B的重要性。最后根据网页的得票数评定其重要性,以此来帮助实现排序算法的优化,而这个重要性的量化指标就是pageRank值。文章运用Citespace中的page-Rank算法,对相关数据结果进行pageRank排名,为数据分析提供另一个维度的视角。

3数据来源及分析工具

3.1数据来源

笔者通过woS中的期刊引文分析报告(JCR:JournalCitationReports社会科学版)查询2014年(2015年尚未公布)的"inFoRmationSCienCe&LiBRaRYSCienCe”类别中被收录的所有期刊,共计85种(详见表1,以影响因子的值作降序排列)。由于这85种期刊并未完全聚焦在图书馆学情报学领域,因此,本研究结合北京大学的《总览》进行聚焦。《总览》的编撰历时2年多,由北京高校图书馆期刊工作研究会成员馆、国家图书馆等相关单位的33位图书馆专业人员参加研究,163位学科专家参加了核心期刊的定性评审,具有较高的指导意义。图书馆学情报学档案学期刊共计61种。经对比,woS与《总览》重合的图书馆学情报学期刊共计29种,并根据检索结果以及影响因子适当增减。随之,以webofScience核心数据库为检索库,以“出版物来源一下表27种期刊名称”和“时间跨度一2014年-2015年”,文献类型选择“article”,语言类型选择“english”,共命中3287条文献记录,通过数据导出和处理,将文献记录以Citespace能识别的woS输出格式导入Citespace软件中。

3.2分析工具

CiteSpace是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学(Scientometric)、数据和信息可视化(DataandinformationVisualization)背景下逐渐发展起来的一款引文可视化分析软件。本文使用Citespace4.0.R4版本,对数据进行处理、分析、制图。此外,使用woS自带的统计分析功能,结合Citespace的可视化分析功能,交叉配合使用。Citespace软件有多个不同版本,开发者截至笔者投稿之日,仍然在优化该软件,故该软件对某些项目的统计结果可能出现与woS的统计有微小差异,可视为科学研究中的误差,但不影响主要数据分析。该工具已经不仅仅提供引文空间的挖掘,而且还提供知识单元之间的共现分析功能,如作者、机构、国家/地区的合作等。

4结果分析

4.1研究热点分析

研究热点可看作某研究领域中,研究者共同关注的一个或多个研究主题,笔者认为共词分析可反映目标领域的热点概况。通过Citespace对term与node的提取,可对3287篇文献的关键词进行共词(Co-words)聚类挖掘分析,运行结果如图1所示。该图反映了国际LiS领域近两年的热点问题,聚类号表示某词经LLR算法聚类后所在的主题。mo-durility(m)即网络模块化评价指标,值越大,表示网络得到聚类越好,Q的取值区间为[0,1],当Q>0.3时得到的网络社团结构是显著的。Silhouette(S)是用来衡量网络同质性的指标,当其值>0.5时表示聚类结果是合理的,越接近1,同质性越高。通过LLR算法,m=0.8835,S=0.5014,得出的图谱合理、客观,研究热点聚类名称如图1、表2所示。

图1中黑色字体表示不同文献共同的关键词,“#数字”表示运用LLR算法对共同关键词提取后命名的聚类词,每个色块表示由各类不同的文献组成的具有相近研究主题的聚类。通过对关键词的聚类,得到15个研究主题,聚类间有交叉覆盖的现象,表示这些聚类之间存在研究主题上的交叉,其关系较为紧密,与其他聚类不交叉的色块表示该类主题具备较为独立的研究性质。以“#0,#1……”等形式对聚类进行编号(ClusteriD),聚类号越小,表示该聚类的经典文献数量(Size)越多,Silhouette值表示经典文献之间的紧密程度,mean(Year)项表示平均年份,可反映聚类中文献的时效性,topterms即以LLR算法命名的聚类名称。经过自动聚类并结合图书馆学情报学专业知识,相关度较高的关键词聚类情况见表2。

基于LLR算法的聚类名称,可客观反映2014-2015年国际图书馆学情报学研究领域的热点问题,可将上述聚类归纳为四个方面。

(1)传统LiS领域。

布莱达(mas-Bleda)等基于欧洲的在线出版物,使用爬虫技术对1525名高被引科学家进行研究,这是第一个对链模式高被引研究者机构网站的研究,用以确定哪些网络资源被科学家们。斯图德(Sotudeh)等使用科学计量方法与比较的方法,就女性科学家在科学生产力、影响等方面与男性科学家进行对比研究,发现虽然女性科学家人数较少,但同样有较好的科研成果和影响。拉弗蒂(Raf-ferty)等通过对八位用户的调查访谈,对基于故事图像的索引输入法进行了探讨。戈卢布(Gol-ub)等对将杜威十进制分类法(DDC)作为建立知识组织系统(KoS)增强社会标签,提高主题索引和检索信息效率进行了研究,结果表明受控词汇表索引和检索的重要性是@而易见的。苛勒(Koler)等以发表在2007年的14个国际期刊中的文献为研究对象,对土木工程领域开放获取文献的被引次数进行研究,结果表明开放不是引用的充分条件,但增加了期刊上发表文章的引用次数。阿尔瓦雷斯(a1-varez)等使用文献计量方法对虹膜识别研究领域进行了全面概述。郭(Kuo)等使用共被引方法模型对核心文献之间的关系进行了研究,实现了运用多元统计技术来构建知识结构的表征。吴(wu)等通过对台湾大学32名被试者进行调研,研究了研究生如何看待和使用谷歌学术搜索。索步尔(a1-Shboul)等运用角色法、系统设计法等,以约旦王国的一个先进的信息通讯技术环境抽样为例,研究了集成现有的信息需求行为的模型。布龙斯坦(Bronstein)等运用分布式的信息检索自我认知量表(iRSpS)对205名学生进行匿名问卷调查,发现参与者报告了高水平的自我效能感。

(2)医学信息领域。

戈尔泰普(Gultepe)等开发了一个决策支持系统,用于患高乳酸盐血症的高危病人的生命体征的常规测量,支持实验室研究。斯塔尔茨(Stultz)等对剂量警报是否合适进行了评价,将警报与订单分类,比较了儿科医院内定制的和非客户化的恰当的剂量警告范围。贝格海莱(Baghele)等运用文献计量方法对pubmed数据库中印度牙医的文献的趋势进行了评估,发现从1960年到2012年,每位印度牙医平均贡献了0.53篇文献。

(3)心理学与计算机科学领域。

加维兰(Gavilan)等探讨了移动广告引发的心理意象的作用及其对信任和购买意愿的中介效应。特拉(tatry)对国与国之间的合作网络映射到可视化的强度关系进行了研究。谢(Xie)探讨了社会媒体在数字图书馆中的应用和识别等相关问题。

(4)管理科学领域。

齐(Chi)等研究了非源代码项目的特点,并在社会科学文献评价中对德国对政治科学出版物进行了研究,结果表明,非源代码项目显著提高了出版物的数量。萧(Hsiao)等运用基于意图的五个理论模型对大学生的行为意图进行调查。克拉托赫维尔(Kratochvil)等对使用在线学习进行信息素养教学进行了研究。雷德斯多夫(Leydesdorff)等测量了三螺旋协同在俄罗斯部级、省级区域创新系统中的水平。斯瓦尔(Swar)应用社会网络分析技术的混合方法和三重螺旋指标,以网络知识的视角对南亚的信息通信技术基础设施的重要性进行了研究。

从上述领域的研究主题来看,研究热点呈现的特点是集中在传统的LiS领域,研究主题不断深化、扩展,使用的研究方法规范、科学。近2年的国际LiS研究主题中,网络计量、索引、文献计量、信息需求、信息检索是持续的研究热点。

4.2研究前沿分析

笔者认为研究前沿分析主要以共被引(CitedReference)的文献网络关系加以体现。科学计量学的奠基人普赖斯(price)提出“研究前沿”的概念,即科学引文网络中高被引且时效性强的文献集合。他认为研究前沿能动态地反应某研究领域的本质。加尔菲尔德(Garfield)将研究的前沿定义为一组核心的高被引论文和引用论文,认为研究前沿的名称可以从论文标题中出现频率最高的词或短语中提取。陈超美认为研究前沿是一组及时、动态且有潜在研究价值的问题,研究前沿的知识基础是引证和共引痕迹。本文中,Citespace的具体操作设置是:“termSource”部分同上文,“nodetype”部分选取“CitedReference”选项。运行数据后,得到研究前沿聚类图,见图2。

从图2可见,将共被引文献聚类后得到16个研究主题。结合图书馆学情报学专业知识,排除相关度较小的聚类后,以“#0,#1……”等形式对聚类进行编号,聚类号越小,其聚类的文献数量越多。共被引文献的聚类情况如表4所示。

基于LLR算法的聚类名称可客观反映2014-2015年国际图书馆情报学研究领域的前沿问题,将上述聚类归纳为三个方面。

(1)传统LiS领域。

米克斯(meeks)等对交集电子健康记录(eHR)进行研究,检查以往开发的概念模型的适用性,以实现全面了解其对英国国民健康服务(nHS)的影响。安珂尔(ancker)等对电子健康记录的影响(eHRs)结果的个体差异性进行了研究。洛伦岑(Lorentzen)等运用网络计量学的方法,探讨了计量学和网络挖掘两个领域潜在的更紧密的联系和合作。韦加(Veiga)等通过对金融分析系统的实证研究,探讨了企业系统(eS)的成功因素。萨沃莱宁(Savolainen)等基于激励因素评价理论,研究了情绪和情感激励在信息检索过程中的五方面的影响。牛(niu)等基于有效的科学引文角度,用文献计量法分析了科学引文索引扩展数据库中1992―2011年地球科学的相关科研情报。谭(tan)等对1995年到2010年的科学引文索引扩展中的蛋白质学文献进行了计量分析,评估全球相关科学成果产出,发现研究人员集中在生化研究方法、生物化学和分子生物学。

(2)管理科w领域。

韦加(Veiga)等通过对金融分析系统的实证研究,探讨了企业系统(eS)的成功因素。常(Chang)等使用社会网络分析来确认天文研究机构具有强有力的国际合作关系,研究发现最强的关系体现在相关机构的跨洲科研合作。萧(Hsiao)等运用基于意图的五个理论模型对大学生的行为意图进行调查。

(3)计算机科学领域。

提图埃尔(turel)等对管理团队提供的集中在信息技术资源的战略管理进行了研究,综合了资源和应急管理信息系统的观点与公司治理理论,检查董事会层面的it治理的关键前因和后果(itG)。庞(pang)等基于资源观,尝试建立一种有效的测量技术,提出一种评估这些资源的协同效应对公司的能力影响的方法,并使用组织理论发现it驱动的公司的战略角色资源。陈(Chen)等研究了信息技术(it)的业务价值,该研究通过调查填补了it的业务价值的中介作用这一空白,研究了该业务流程的灵活性和环境因素的调节作用。该研究的对象属于计算机科学领域,其研究方法则属于管理科学领域。

从上述领域的研究主题来看,研究的前沿呈现的特点是运用传统LiS方法研究跨学科领域的对象(如有机发光二极管、交集电子健康记录、金融等)。LiS在计算机科学、管理科学、医学、生物学实践领域的应用将成为今后LiS领域的研究重点。

4.3科学领域结构

科学领域结构可反应LiS领域所涉及的各个学科之间的合作、交叉关系。可从合作者的聚类、文献的聚类等方面进行探索,但最直观的方式,是直接分析由woS导出的数据中的分类号(Category),运行结果如图3所示。

由图3和表6可知,从发文量来看(图中年轮的大小表示发文量的多少),LiS领域近两年覆盖的主要科学领域依次为:图书馆学情报学、计算机科学、健康护理科学与服务、医学信息、政府与法律、法律、商业与经济、管理领域。从pageRank维度来看,政府与法律的中性度最高,健康护理科学与服务、商业与经济次之,图书馆学情报学、计算机科学、法律、管理紧随其后。这表明,在图书情报领域的高水平成果中,受网络关注最高的是政府与法律领域。本研究样本文献构成的研究分布网络显示,上述研究领域互相交叉,这表明当前的学科研究趋势正朝着以图书馆学情报学为主,以其他相关领域为辅的多学科交叉研究的方向演化。

5结论

本文依据Citespace的引文分析及可视化功能,在识别和探讨LiS领域的研究热点与前沿动态问题过程中,得出以下结论:

首先,通过对2014-2015年SSCi数据库中27种核心图书馆学情报学期刊刊载的3287篇文献进行研究,通过关键词与主题的LLR聚类分析,发现传统图书馆学情报学、管理科学、计算机科学以及医疗信息等领域的图书馆传统服务和计量、信息需求与检索、索引、信息检索、组织工程、名称匹配算法、网络2.0、非源项、技术接受模型、三螺旋理论等主题是近两年国际LiS领域的持续研究热点。

科学计数法的学情分析篇2

大数据技术的快速发展促进了科研方式的变革,基于数据紧密型的科研方式已经成为自科研经验方式、理论方式、计算机模拟方式之后的新的发展模式[1]。现阶段,海量的半结构化和非结构化数据给科研带来了巨大挑战,而且数据存储和共享功能缺乏合理性和有效性,这也给高校图书馆的服务模式造成不小的影响。在大数据时代,高校图书馆应该更加重视用户数据安全和服务质量,积极利用先进的数据分析和处理技术来提升高校图书馆服务的智能化和个性化,为高校图书馆的服务创新创造出有利条件[2]。高校图书馆应该借助大数据技术,充分了解用户的服务需求,并以满足用户的服务需求为目的开展相应的服务。

1大数据时代高校图书馆开展嵌入式知识服务的内容

1.1用户需求的分析

在大数据环境下,首先,高校图书馆可以收集和存储用户的基本信息,比如:用户的学历、年龄、科研成果、学习经历以及工作单位等信息,并详细记录用户的操作信息及检索、查询、收藏以及标识等操作行为,可以与用户查询资料的内容、学科类别以及相应用户权限进行关联,还可以收集用户具体的信息咨询、科技前沿以及参考导航等服务情境[3]。其次,高校图书馆可以分析海量?稻荩?利用基于语义网的技术来规范用户信息资源,并将其转换为能够被应用程序理解和直接调用的数据,从而可以更好地感知和预测用户行为。最后,高校图书馆利用用户数据作为决策依据,为用户制订当前目标、短期目标以及长期目标,并根据需求环境的变化动态分配硬件和软件资源,从而让高校图书馆的服务融入用户的科研活动中。

1.2规律趋势的分析预测

针对某些行业或者学科进行全面收集信息资源时,在专业研究成果的基础上进行深入分析,比如对比、推理以及综合利用等科学分析手段,或参照专业学科发展规律,计量学发展规律等[4]。由于学科的知识特点和发展规律各不相同,因此需要运用多种分析和处理手段来构建不同的学科模型,从而能够准确地预测学科发展规律以及发展趋势。常见的预测方法有以下几种:①将大量文献内容进行数据统计,以归纳总结出文献的内在规律,比如齐普夫定律、洛特卡定律以及布拉德福定律等都是常见的基于文献内容的统计方式。②根据文献的发展规律和趋势来构建数学模型,可以达到预测文献发展规律的目的,比如普赖斯就专门构建了基于指数增长规律的数学模型。③将其他领域的数学规律和数学模型移植到文献发展的预测中,比如物理学中的半衰期规律、经济学中的人口增长规律以及生物学中的成长规律等。④依据模糊理论来搜集相似文献内容,存储在计算机中,并利用统计技术进行分析和对比数据,以此帮助科研人员挖掘数据关联性。

2大数据分析与情报分析的共性

2.1看重对数据的定量分析

数据作为最直观的资源,已经潜移默化地改变了分析决策的方式,如何有效地收集、筛选以及整理各种数据资源,并利用合理的方法来挖掘数据的潜在价值,已经成为评价一个组织是否具有竞争力的重要衡量方式。情报分析学科同样十分重视数据资源的应用,在情况分析研究的初期阶段,分析人员主要依靠人员的智力来分析少量数据现象,并从中归纳总结出情报分析的规律。随着科学技术的快速发展,学科之间的关联性和交叉性逐渐加强,学科知识的划分越细致,所涉及的内容也就越专业。目前,情报分析更多地依靠先进的信息处理技术,利用“机器学习”方式来挖掘数据、分析和统计相关联系,还可以利用定量化方式来关联基于关键字的词汇共现,其核心思路就是在计算能力的基础上利用人工分析判断数据联系。因此,利用数据来阐述问题已经成为情报分析的主要特点,在情报分析报告中利用数据、公式以及图表来说明理论的方式也充分体现了数据分析技术在情报分析领域的重要地位。

2.2关注多源数据融合

大数据技术可以通过各种渠道,并利用各种收集手段来获取各种数据信息,在进行集中整理后,形成一种基于不同数据格式的统一处理方式,这种处理过程被称为多源数据处理融合技术[5]。一方面,可以通过不同用户和不同网络途径来获取同一个研究方向的内容;另一方面,根据信息数据的种类和用途的不同,比如:根据视频、音频及文本等方式进行分类,也可以根据结构化和非结构化等方式进行分类,同时也要考虑数据的异构性。需要注意的是,相同类型的数据也有可能分布在不同的站点,并由各自的数据供应商提供,如论文分析研究的数据来源就包括中国知网、维普及万方数据库等[6]。一般情况下,针对前沿领域进行情报分析时,只利用一种类型的数据是不够全面的,应该从其所涉及的期刊论文、图书资源、专利以及项目等收集有效信息,进行整合处理,这样才能够体现出该研究的整体特征。

3嵌入式知识发现情报分析服务的重要环节

3.1知识发现系统的利用

将文献分析方式与数据挖掘技术进行有机结合已经成为知识发现方面的热门研究内容,并且取得了可以直接应用的研究成果,这为嵌入式知识发现情报分析服务提供了重要的研究方式。不可否认,选择和使用合理的知识发现系统会提高信息数据的分析效果,其中比较有代表性的就是充分认识到知识发现系统的优势,评估数据分析结果与用户的契合程度,从而让数据分析服务的效果得到用户的认同。比如:一些基于知识发现的软件和系统比较适合大型结构化文献数据分析,可以根据结构化数据的特点分析出信息的特定发展规律[7];还有一些基于主题和科研本身的知识发现模型,其可以利用文献资源之间的相关性挖掘有效信息,并对文献资料进行多角度分析,根据关联原则描述该学科领域的发展趋势图;另外还可以利用关联和非关联的知识发现方法,再结合相关语义分析、词汇频率统计等技术,最后通过关键词聚类方式来寻找潜在的知识发现。

3.2准确获取数据

知识发现可以分析大量数据和信息资源,并从中挖掘明显关联或者非关联的科学研究的内在规律,情报分析人员可以向科研人员提供相关情报分析,一般采用的是定量和定性相结合的分析方法。在进行定量分析之前,如果要获取较为准确的目标数据,除了要分析数据源以及检索方式之外,还要对数据进行预处理,如消除噪声数据、集成数据等。大部分的数据分析软件都具有数据筛选功能,其中常见的tDa(threatDiscoveryappliance)软件就可以通过列表功能手工筛选原始数据。需要注意的是,当自动筛选数据时,常常由于数据中检测出偶发的错误或者不同的存储格式导致筛选失败,这就无法按照要求构建知识图谱。嵌入式的知识发现服务可以将筛选后的数据与专业数据分析专家共享,由此可以进一步提高数据的准确性,从而得到与研究对象关联紧密的数据。

3.3应用综合分析方法

科技创新活动不仅包括学科和领域的创新,而且还涉及社会各个方面的创新,所以嵌入式知识发现服务需要为决策人员提供情报分析服务,帮助分析对象的社会行为,并为决策人员指明科研决策的发展方向;此外,还可以根据用户的需求,结合经济学、社会学、管理学以及情报学等学科的分析方法,多方面地展现科技创新在社会环境中的具体状况和发展趋势。如今,国外已经出现了专门提供情报分析服务的公司,比如美国的麦肯锡公司就对医药领域提供多方面的分析和研究服务。而国内关于情报分析的研究还处于起步阶段,高校图书馆可以借鉴国外成熟的研究成果,比如可以利用波士顿矩阵方法来分析文献资源之间的关联性。

4情报分析服务模型总体设计

情报分析服务的主要功能就是针对数据进行整理和分析,从而挖掘知?R的内在关联性。该研究根据内容解析方法来实施情报分析服务,并专门构建一个情报分析的服务模型。该模型采用了分层结构,自上向下共分成三个层次,即界面展示层、知识发现处理层、数据资源层等,具体结构示意图如图1所示。

首先是数据资源层,其确定研究对象包括三个步骤:确定分析目的、确定研究范围、搜集情报等内容。其次是知识发现处理层,它主要包括三个方面的内容:①制定编码标准,并借助计算机辅助工具来构建专属词典,其主要分为专业术语词典、停止词词典、同义词词典等。②编码部分,可以将文本文件转换为计算机可识别的文本向量。③数据分析部分,可以利用相似度算法和聚类算法来处理文本向量,从而实现情报自动聚类和串并功能。最后是界面展示层,主要功能为针对数据进行分析。

4.1数据资源层设计

数据资源层为情报分析提供海量的数据资源,从各个数据源中收集数据并集成在情报员数据库中。众所周知,数据库的性能会直接影响情报分析服务模式的处理效率。目前,比较成熟的数据库种类主要有两种:关系型数据库和非关系型数据库。经过几十年的发展,关系型数据库技术相对比较成熟,其中的行和列的关系非常明确,主要采用表型结构存储数据,用户比较容易接受。但是,随着数据库技术的不断发展,关系型数据库的弊端也逐渐显现出来:①针对海量数据进行查询和存储操作,海量数据信息时刻充斥在互联网上,如果关系型数据库还是采用表型存储海量数据,这时的存储是以亿为单位。当利用SQL(StructuredQueryLanguage)语言查询或者针对多张表进行关联查询时,其查询效率是非常低的。②数据库的扩展性较差。当处理海量数据时,数据的结构非常复杂,修改数据库的表结构是非常耗时的,因此复杂的数据结构的处理效率无法达到用户的要求。③数据库的读写效率。针对动态的信息,每秒的读写次数要达到上万次以上,而关系型数据库的读写速度无法达到这种要求。

4.2知识发现处理层设计

知识发现处理层的主要功能是针对数据资源层的数据进行深度的分析和挖掘,它可以利用内容分析方法进行数据分析和情报编码,具体的功能模块图如图2所示。知识发现处理层主要包括四个功能模块:情报自动聚类处理模块、情报串并处理模块、文本预处理模块、文本向量表示模块。

4.3界面展示层设计

界面展示层主要包括两个部分:知识图谱展示功能和人机交互功能。知识图谱展示功能形象展现出情报数据资源的分析结果,是针对情报数据资源分析的拓展,它可以准确表达现象层面的具体信息,并通过更进一步的分析来找出隐藏在情报中的规律,从而协助情报分析人员更好地处理情报。人机交互功能是利用操作界面来实现用户和软件之间的信息交流,更好地帮助用户控制软件。

科学计数法的学情分析篇3

[关键词]情报研究 未来技术分析 知识发现 应用环境 循证决策 集成研讨厅

[分类号]G350

随着人类信息生产能力的提高,数字化科技文献数据资源成为科学探索和科技创新的重要战略资源,也成为科研环境的基础设施。新环境下,科技情报人员需分析并产出更深入的情报研究成果,探索和开发更先进的分析方法和工具,积极构建支撑科研创造和支持决策的基础设施,实践和改进对综合集成研讨厅体系的情报支撑。通过分析国外重要科技信息机构的战略规划、前瞻项目和专题报告可知,科技情报机构可能要在自身定位、情报方法和技术、情报应用环境等方面作出调整,才能更好地抓住新环境下的发展机遇。

1 机构定位:基于数据计算的科技知识发现与仿真模拟分析中心

当前,传统科学研究方法已发展为在新时空保真度下利用数值计算、数据、信息和网络所进行的知识发现和电子仿真。仿真模拟分析已经成为大气与环境科学、医学与生物学、决策支持等领域的主要研究手段之一。任务导向研究机构设立的典型项目有:美国能源部基于高级计算的科学发现项目、美国国家卫生研究所生物医学信息学研究网络等;科学驱动的试点项目有:地震工程仿真网络、国家虚拟天文台、空间物理和大气研究协同实验室等。

发达国家的部级科技情报机构,如美国国家医学图书馆(nationalLibrary0fmedicine,nLm)和韩国科技信息研究院(Koreainstitute0fScienceandtechnologyinformation,KiSti),较早建成公共超级计算平台,为计算密集型和数据密集型的科学研究和决策提供快速、精确、海量的数据处理平台,来支撑知识发现和仿真分析等科研应用,现已经广泛应用在许多领域,如情报分析、武器系统集成模拟、空间物理等应用科学和基础科学研究领域,并用于政府决策支持。

1.1 nLm:集成多种数据进行知识发现

美国nLm支撑了大量生物医学研究的计算和生物信息学的知识发现;研制了可视化虚拟人体项目,为医学教学和科研提供模拟实验平台。其生物技术信息中心作为计算和数据库中心,负责开发和连接大型、长期研究的临床和基因型数据库,并开展跨学科数据分析和集成服务。其长期战略目标之一是“集成生物领域各种卫生信息系统,促进科学发现并加速研究向实践的转化”,并建议:开发能发现临床数据、遗传信息和环境因素间关系的关联数据库;促进先进的电子化生物医学知识及健康记录的开发和利用。

1.2 KiSti:集成多方数据进行仿真分析

KiSti是韩国科技信息界的领头羊:作为国家战略信息分析中心,提供国家战略尖端信息的生产和支撑;作为国家超级计算中心(KSC),建设及运营超级计算基地。KSC作为韩国最大的超级计算资源,为科学研究提供可视化技术并构建超级计算的研究环境;为天文物理、气象学、结构和流体力学、生物学等领域提供模拟和仿真分析,如模拟致密天体碰撞和恒星坍塌、运转高分辨率气候模型等。

通过对nLm和KiSti的分析可知,科技情报机构在生产常规性情报研究产品之余,还可向基于数据计算的科技知识发现与仿真分析中心发展,从而为科学研究提供数据增值服务和模拟分析平台。

2 研究方法:数据融合、方法集成进行发现、分析、预见和评价

2.1 利用未来技术分析进行技术预见和危机分析

情报人员的工作,需逐步地从提供有助于理解对手正在做什么的科技情报,延伸到能进行识别对手能作什么的危机分析。美国国防委员会曾报告称:国防部需要忧患者或预见者,来探索对手将会如何利用技术来获得破坏美国目标的能力;采用更一致和综合的方法来预言对手将怎样来开发和利用技术。为此,必须通过科技情报来理解对手正在做什么;利用冲突模拟来识别对手未来能做什么;并通过净评估来理解可能的后果。

2008年,欧洲未来技术研究所的Cagnin等多位专家编写了《面向未来的技术分析》(Fta:Future-often-tedtechnologyanalysis)一书,介绍了Fta研究方法及其在创新政策、决策制定等方面的应用。2004、2006和2008年分别举办了专题研讨会,重点关注Fta对政策和决策制定的影响。Fta日益倾向于综合使用多种分析方法:①国家政府层面开展的Fta活动以大规模技术预见为主;②部门和行业层面的D-ta则主要以情景规划和各类基于模型的方法;③企业则往往采取效率更高的趋势外推和一些计量方法,以便能及时应对瞬息万变的市场竞争。

情报分析类方法在充分揭示现有技术状态的基础上,如何更好地与其他方法结合(如创造性方法和模型类方法)来实现对未来技术信息的揭示与分析,将是一个重要的发展趋势。另外,随着科学与技术之间发展演变的加快,如何将基于科技论文的分析与基于专利信息的分析结合起来发掘未来可能的“突破性”技术,也将是情报学的重要研究领域。

2.2 利用综合科技信息的知识发现进行隐性知识关联分析

目前,在科技情报研究领域,基于文献的知识发现方法、跨领域的共现知识关联分析和不同类型信息融合的知识发现基本上代表了这类方法的主要发展趋势。

2.2.1基于文献的知识发现在情报研究领域里,利用文献计量方法进行的知识发现可统称为基于文献的知识发现,包括基于相关文献和基于非相关(Disjoint)文献的知识发现。前者考察文献在外部特征和内容上的关联;后者在具有内隐性关联的文献间进行知识发现。

1997年,美国芝加哥大学Swanson教授提出基于非相关文献的知识发现,所得信息具有预测意义。1995年,美国海军研究部Kostoff博士申请了数据库内容结构分析(Dt)方法专利,并以此为基础开发出了独特的知识发现方法和技术体系。该方法从间接相关的文献集中确定具有发现潜力和包含创新机遇的信息,挖掘出这些信息与核心文献集间的关联,随后在核心文献集和间接相关的文献集中都引入不同领域的知识进行发现,对实现面向需求的发现具有参考意义。

经过多年的发展,基于文献的知识发现方法具有以下发展趋势:发现对象正由文献主要特征转变为全文献信息,各种聚类和相关性算法等发现技术正不断被改进和发展并更加有效,挖掘结果已主要采用可视化方式来展示,挖掘结果的解读则更多地包括了领域专家。

2.2.2跨领域的共现知识关联分析通常所说的共

现分析方法,包括共引分析、共词分析以及其他文献特征问的共现。

共引方法自1973年Small提出理论以来,已从单纯的文献本身,延伸到词、著者、期刊等一系列共引关系。Kostoff将文献计量学、计算机辅助分析、专家决策等同共引分析有机结合,将共引分析应用于知识发现并为决策服务。目前,共引分析已成为基于文献的知识发现的主要手段之一。

共词分析已从最初纯粹基于数学指标体系的分析和基于数学模型、空间坐标、网络比较的分析,发展到了新一代综合性Dt共词分析。共词分析能更全面地体现文献内部的深层语义,而且将低频共现现象同样列为发掘目标,现主要用于揭示学科领域内部知识结构,或揭示研究主题的成熟度。

开展预见需要跨学科领域的知识,不同学科领域在同一研究主题上的知识跨度或许可用于预测未来知识发展的空白。因此,我们可设计不同学科之间的共现分析方法,实现不同领域知识的融合并建立相关知识的信息链推理,进而有可能发现潜在的或跨学科边界的科技解决方案,可作为预测的前提。

2.2.3 不同类型信息融合的知识发现科学数据是支撑科技活动的基础资源,也是支撑国家科技创新发展的重要资产和战略资源,对决策的支持作用与科技文献同等重要。美国国家科学基金会(nSF)曾报告称:美国在科学和工程领域的领先地位将越来越取决于利用数字化科学数据以及借助复杂的数据挖掘、集成、分析与可视化工具将其转换为信息和知识的能力。2008年,欧洲核物理研究组织在其未来定位中称其未来目标是要将大型强子对撞机实验数据以一种可用格式进行保存和共享。很明显,如果能将基于科学数据的数据挖掘方法和基于科技文献的文本挖掘方法进行有机融合,就能实现更有效的科技预测。

为此,有学者提出了基于形态分析和联合分析的综合分析方法用于技术预测。形态分析法将研究对象分成多个基本属性分别加以分析、提供解决方案,并最终得到问题的解决方案;而联合分析则分析组合的整体反应以评估研究对象的发展变化。由此,可结合两种过程提出基于科学数据与文献数据挖掘的科技预测方法:①从科学或文本数据中,对研究对象进行形态剥离,找出代表该问题领域的形态组合;②利用文献计量方法建立文献数据的属性之间的关联关系,或者利用前述知识发现方法实现初步的知识预见;③对关键形态属性的科学数据进行挖掘,发现单个形态或多种具有关联的形态间未被发现的潜在规则;④将上述②和③的结果融合,找出没有发现的可能的新知识,为进一步预见提供线索。

2.3 构建模型对科技政策进行模拟分析、理解、评价和预见成效

未来科技的发展方向,一方面以满足社会经济需求、解决社会问题为导向;另一方面为了占据科技优势,追求高风险、突破性研究的新进展。因此,科技预见方法既需具备由需求和问题引导的、对未来科技需求的发掘功能,又要具有突破性知识的发现功能。

美国nSF的SBe委员会曾提出科学与创新政策学项目,对科研投入的收益进行评价,并且全面考虑可能结果,在允许的误差范围内预测将来科研投入的回报。nSF“创新的高级评价指标”工作组探索了创新相关的数据及研究,希望在政策背景、资源和条件限制等方面找到与创新相关的新型数据,探索数据开发的优先领域和策略,促进跨学科的多来源数据的开发研究工作。法国国立科技与管理学院的学者介绍了欧洲科技情报指标平台中用于多学科研究评价的定位指标。该指标既可用于充分理解、洞察科学与创新系统的工作方法,也可用于科学系统的评价或者子系统分析,即瓶颈分析。分析发现,现有情报研究理论与方法的拓展,可为上述任务的完成提供支撑。

不难看出,未来情报研究方法将向着融合多种数据、集成多种方法进行发现、分析、预见和评价的方向发展。相应地,科技情报人员需调整研究思路,开展识别所跟踪对象能做什么的危机分析;将针对科学数据和科技文献的数据挖掘有机融合,开展更有效的科技预测;关注各种科技政策评价模型的发展和应用,从跨学科、多来源数据中挖掘突破性研究点来支撑创新型科研活动。

3 应用环境:集成支撑科研创造和科学化知情决策的基础设施

科技的发展越来越重视高风险、突破性研究,促使科研创新受到了管理者和研究者的空前重视;在医学领域起源并获得成功应用和发展的循证决策与实践(eBpp),逐渐在英国等国家被包括科技决策研究领域在内的其他领域所采纳;国内多个机构建设的综合集成研讨厅体系作为高级决策支持系统也得到了越来越广泛的应用,这都对科技情报研究提出了新的要求。从情报学的视角出发,如何适应这些新型应用环境,更好地发挥科技情报应有的作用,将是情报学在创新环境下面临的重要课题。

3.1 支撑科研创造过程的基础设施

创造性环境可被看作一个支撑人类创造过程的计算工具,是学术界、科学创造的重要基础设施。2008年,欧洲核物理研究组织宣言称希望建造一个超级科学情报系统,提供现有情报系统的所有功能并成为电子化研究基础设施,能评价各个国家和机构的科学产出、自动侦测文章主题、自动筛选同行评议文章等,并能获取大规模可计算数据。波兰学者将科学研究的创造性环境划分为五个功能模块,提出了创造性环境的一般模型:①个人工作区模块;②信息检索模块,能提供关键短语抽取、自适应启发式和思考等检索服务;③群组交流模块,能支持虚拟研讨会;④规划和路线图模块,能与用户的个人工作模块协同;⑤实验模块,包括完成虚拟实验和实验结果统计分析两种组件。

有效支持创造性科研环境将是情报学未来重点关注的内容之一,特别是如何为创造性研究提供预见、如何嵌入相应模块等。比如,在信息检索模块嵌入前沿分析功能,在规划和路线图模块嵌入演化分析和知识发现功能,在实验模块嵌入模拟试验环境等科学信息学分析模块。

3.2 集成支撑知情决策的基础设施

源自医学领域的eBpp已经向各个领域辐射,并引起了科技决策研究机构的极大兴趣。2008年,荷兰召开的循证决策国际会议中不乏科技决策研究机构的学者。在政策研究领域,eBpp于1999年首次出现在英国的现代管理中,英国经济和社会研究理事会已建立了社会科学循证评价网络。2000年成立的Campbell国际协作网络是eBpp的一个典型实例。该网建有社会、心理、教育与犯罪对照试验注册资料库,是该领域最集中的干预试验证据的资料库,并不断得到补充和发展。在健康和社会问题交织的领域,对证据的整体性理解对知情决策的支撑显得尤其重要。

为科技决策提供依据的科技情报研究需把握趋势,认真思索自身所应发挥的作用。但是,由于医学与社会科学的研究方法有差异,循证情报研究的理论和方法仍有待进一步研究和实践。

3.3 支撑综合集成的研讨厅体系

近些年来,国内多个科研机构建设了“综合集成研讨厅体系”(Hwme),这成为科技情报研究应用的新环境。集成研讨厅是用于复杂决策问题求解的高级决策支持系统,起源于钱学森先生提出的系统工程并首先成功用于航天领域。后来,戴汝为院士以此为基础研究了“基于信息空间的从定性到定量的综合集成研讨厅体系”(Cwme)。Cwme是一种由专家体系、机器体系、知识体系三者共同构成的支持复杂问题决策的虚拟空间,其中也包含对科研创造和知情决策的支持。汶川地震后,中国科学院遥感所龚建华研究员利用虚拟地理研讨厅,结合卫星、航空遥感、虚拟地理环境等技术,在堰塞湖问题的处理上发挥了重要作用。2009年,装备指挥技术学院李元左教授介绍了“空间军事系统研讨厅”的研究实践成果。另外,中国科学院国家科学图书馆开发了“战略情报集成研讨厅”,采用先进的情报研究工具和方法,如科学结构演化分析、科技情报共享平台等,集成多种分析工具并行操作,能实现多角度专家交互研讨、多渠道内容有机实时聚合以及多专家即时合作写作等功能。由此可见,科技情报研究如何有力地支撑综合集成的研讨厅体系这种新生决策支持系统,也应成为今后科技情报界研究的一个方向。

科学计数法的学情分析篇4

图书馆是人类社会文明进步与智慧的结晶,尽可能满足图书馆用户对文献的需求是图书馆建设始终不变的追求。随着文献资源的多样化发展和读者对文献资源多元化需求,图书馆需要更快捷、准确、有效的图书情报信息来指导其馆藏建设工作。大学图书馆中研究生是重要的读者群,他们是高级研究人员的后备军,在导师指导下,参阅了大量的中外文献资料,对本学科领域的最新研究课题进行了潜心研究,逐年积累了一批科研成果一学位论文。学位论文作为情报文献中一个重要组成部分不仅反映了研究生的理论学术水平,其后所附的引文也反映了研究生的文献需求和他们吸收文献信息的能力,从中可以了解他们利用文献的规律和对专业文献资源的需求特点目前许多大学图书馆都面临着采购经费不足与各种文献价格持续攀升之间的矛盾因此对研究生学位论文引文进行定量统计分析为图书馆提高文献采集质量,提高文献满足率提供了必要的参考资料。

引文分析法是一种应用于图书馆文献采集的有效工具,引文分析法需要建立在全面的引证数据基础上,由于对大量数据进行搜集、统计、分析,既费时又费力,所以在手工方式下使其发展在一定程度上受到了限制。当今,信息处理技术和计算机技术的发展为引文分析法提供了技术支持,本文介绍了研究生学位论文引文分析系统作为一种在计算机辅助下实现快捷、方便、准确的引文分析的方法。

2.引文分析方法

图书馆的馆藏建设是由规划、选择、收集、整理、组织、保管等环节构成的系统工程,图书馆的馆藏建设水平可通过馆藏评价来衡量。文献计量学是一种广泛应用于图书馆馆藏建设的科学、定量的评价方法,它是借助文献的各种特征的数量,采用数学与统计学方法,对各类文献的诸计量特征进行统计分析,进而揭示和研究文献情报规律、文献情报科学管理以及学科发展趋势的一门科学在文献计量学研究中,以引用数据为基础的计量技术作为重要的研究手段已被广泛接受,其中引文分析法是文献计量学方法中最为重要的技术之一。

所谓引文分析就是用数学和逻辑学方法对期刊、论文、专著等研究对象的引证和被引证现象及规律进行分析,以揭示出它们所蕴含的研究对象所具有的特征或对象之间的关系的一种研究方法。引文分析法被广泛应用于核心期刊的测定,文献规律的研究,情报检索系统,情报预测研究,对文献的评价,馆藏分析及图书采集中,其内容包括引文量、引文时间、引文类型、引文语种、引文作者等的被引规律分析,自引规律分析等。

2.1被引规律分析

被引文献具有一些基本要素,如文献类型、学科内容、语种、年代、引文出处等。依照不同要素和指标,可以将被引文献分为以下一些类型:被引文量按频数分布;被引文按年代分布;被引文按学科或主题分布;被引文按文献类型分布;被引文按语种分布;被引文按国别分布;被引文按著者分布;被引文按期刊分布。被引文量指某一主体对象(论文、期刊、学科、著者等)含有的参考文献数量。通过被引文量的频数分布分析,可以揭示作者吸收和消化情报的途径和能力及作者使用情报源的习惯和方式特点【51。被引文年代分布是从时间的角度对引证分布规律进行分析,可以反映被引文的出版、传播和利用情况,常用于文献老化和科学史的研究。通过对被引文年代分布曲线的分析可大致确定被引文献投入使用的周期,中、夕卜文被引文献从出版到被利用的平均时间差及科学文献被引用的最佳年限。被引文献类型分布即各种类型的文献(如图书期刊、特种文献)在参考文献中f例,研究被引文类型的分布可以相对显示出各类文献的情报价值。被引文按文献语种分布对图书情报部门有计划地引进外文文献、译文选择、外语教育等都颇有参考价值。

2.2自引规律分析

被引文献是自己以前所发表的文献(或者说作者引用自己以前发表的文献)的文献引用现象叫做“自引”。在全部引用文献中,自引文献大约占有1030%。自引是一种特殊的科学文献引用形式,它所包含的特殊规律性对揭示作者、机构、期刊和学科等科学主体之间的内在关系十分有用。自引统计是对科学主体的文献自引关系进行定量描述(测度),为自引分析提供定量依据。文献自引的测度指标包括自引量、被自引量、自引率和被自引率。自引量代表主体的文献自引绝对强度,自引量大,说明主体的研究方向较为稳定,其研究课题、研究方法、学术观点具有连贯性、系统性,较少受外来因素的影响。自引率代表某主体对其自身的依赖性程度(简称自依赖性)。自引率高,则自依赖性强,说明作者较强地依赖于自己的前期研究,反之则表示可能其研究课题之间关联不大,或是作者注意吸收他人的研究成果。

3.学位论文引文分析系统

研究生学位论文引文分析系统基于引文分析理论及C6模式,运用powerBuilder作为开发工具,进行系统的前台窗口对话界面设计,后台采用可靠性、安全性高的数据库管理工具Sql2000,从数据录入和信息统计两大部分出发,实现学位论文引文量统计(包括每篇论文引用的文献量、论文引用文献量最大最小值、频数分布、专业/学科平均引用文献量),按语种分布统计引用文献量及其相对数,按引用文献类型统计引用次数及其相对数,按年代统计某一年或某一时间段内引用文献数量,常用期刊文献按中外文分类统计引用量,常用图书文献按中外文分类统计引用量,计算馆藏文献收藏率,自引及引自导师文献人数及引文量统计等功能。

3.1流程设计

研究生学位论文引文分析系统为大学图书馆的馆藏建设提供了有力的工具,能有效地帮助图书管s购图书°系统流程,如图1所示:首先,用户登录,如果登录失败则结束,否则成功则转入下一步。其次,用户可以进行基本参数定义或进入引文信息管理录入或导入论文信息及论文的引文信息,引文信息输入成功后转入下一步设定引文分析的抽样参数。选择论文年代范围及论文级别等抽样参数后则可直接转入下一步,对设定范围内的论文应用引文分析方法对引文信息进行统计,对统计结果可导出报表。

3.2系统功能设计

基于科学性与使用性相结合的原则,对学位论文引文分析系统设计开发进行构思,其设计功能涵盖了基本参数设置、引文信息管理、引文统计管理和系统维护与管理四部分,基础数据管理是系统的基础,用以添加、删除或修改引文分析时所需要的基本参数,包括文献类型目录、文献语种目录、学科/专业目录以及抽样参数;引文信息管理是对研究生学位论文及引文数据的管理,主要实现对引文数据的录入、编辑、删除及导入等功能;引文统计管理是用户最为关注的功能,主要实现引文分布统计、特殊引证统计、常用文献统计、引文量统计等。系统维护与管理主要实现系统日常维护与管理,包括用户账号管理、用户权限设置、更改口令及在线帮助等,图2所示为引文分析系统软件结构。

   

系统的主要目标是将高校研究生学位论文的基本信息及论文的引文数据通过客户端准确的输入到计算机,利用本系统的功能对这些信息进行提取和加工,以产生图书馆管理人员所需的各种统计信息。引文分析系统是个典型的分析型处理系统引文信息统计是本系统的核心功能。该功能建立在引文分析法的理论上,并发展了其原有内容。在引文分布统计中,不但包括被引文量按频数分布、被引文年代分布、被引文按文献类型分布、被引文按语种分布,还包括了对引文语种、类型、年代的联合分布;在特殊引证统计中,除了自引统计,还针对研究生学位论文的特点,增加了对引自导师情况的统计功能。在常用文献统计模块中增加了对常用图书及其他文献的统计,从统计的结果不仅可以看出哪些是研究生所需要的书籍,而且还可以反映学术界的较受欢迎的书籍和网站。图3给出了常用文献统计界面。

3.3系统应用

为具体说明本引文分析系统的实施效果,现选取西北工业大学2001年共24部博士学位论文为分析对象,列举了引文分析系统在引文数量、语种、类型统计等方面的具体应用(文中的数据表均来自于系统导出的excel表格)。由论文引文数量表及被引文量的频数分布可以看出该校博士生的文献需求量较大,并具有较强的吸收和消化文献信息的能力。以篇均引文量133篇为中心,形成了中间高,两极低的正态分布,如图4所示,基本符合被引文量的规律。

4.结术语

科学计数法的学情分析篇5

关键词:大数据时代;高校图书馆;嵌入式服务;知识发现;情报分析

中图分类号:G252文献标识码:a文章编号:1003-1588(2017)02-0049-03

大数据技术的快速发展促进了科研方式的变革,基于数据紧密型的科研方式已经成为自科研经验方式、理论方式、计算机模拟方式之后的新的发展模式[1]。现阶段,海量的半结构化和非结构化数据给科研带来了巨大挑战,而且数据存储和共享功能缺乏合理性和有效性,这也给高校图书馆的服务模式造成不小的影响。在大数据时代,高校图书馆应该更加重视用户数据安全和服务质量,积极利用先进的数据分析和处理技术来提升高校图书馆服务的智能化和个性化,为高校图书馆的服务创新创造出有利条件[2]。高校图书馆应该借助大数据技术,充分了解用户的服务需求,并以满足用户的服务需求为目的开展相应的服务。

1大数据时代高校图书馆开展嵌入式知识服务的内容

1.1用户需求的分析

在大数据环境下,首先,高校图书馆可以收集和存储用户的基本信息,比如:用户的学历、年龄、科研成果、学习经历以及工作单位等信息,并详细记录用户的操作信息及检索、查询、收藏以及标识等操作行为,可以与用户查询资料的内容、学科类别以及相应用户权限进行关联,还可以收集用户具体的信息咨询、科技前沿以及参考导航等服务情境[3]。其次,高校图书馆可以分析海量稻荩利用基于语义网的技术来规范用户信息资源,并将其转换为能够被应用程序理解和直接调用的数据,从而可以更好地感知和预测用户行为。最后,高校图书馆利用用户数据作为决策依据,为用户制订当前目标、短期目标以及长期目标,并根据需求环境的变化动态分配硬件和软件资源,从而让高校图书馆的服务融入用户的科研活动中。

1.2规律趋势的分析预测

针对某些行业或者学科进行全面收集信息资源时,在专业研究成果的基础上进行深入分析,比如对比、推理以及综合利用等科学分析手段,或参照专业学科发展规律,计量学发展规律等[4]。由于学科的知识特点和发展规律各不相同,因此需要运用多种分析和处理手段来构建不同的学科模型,从而能够准确地预测学科发展规律以及发展趋势。常见的预测方法有以下几种:①将大量文献内容进行数据统计,以归纳总结出文献的内在规律,比如齐普夫定律、洛特卡定律以及布拉德福定律等都是常见的基于文献内容的统计方式。②根据文献的发展规律和趋势来构建数学模型,可以达到预测文献发展规律的目的,比如普赖斯就专门构建了基于指数增长规律的数学模型。③将其他领域的数学规律和数学模型移植到文献发展的预测中,比如物理学中的半衰期规律、经济学中的人口增长规律以及生物学中的成长规律等。④依据模糊理论来搜集相似文献内容,存储在计算机中,并利用统计技术进行分析和对比数据,以此帮助科研人员挖掘数据关联性。

2大数据分析与情报分析的共性

2.1看重对数据的定量分析

数据作为最直观的资源,已经潜移默化地改变了分析决策的方式,如何有效地收集、筛选以及整理各种数据资源,并利用合理的方法来挖掘数据的潜在价值,已经成为评价一个组织是否具有竞争力的重要衡量方式。情报分析学科同样十分重视数据资源的应用,在情况分析研究的初期阶段,分析人员主要依靠人员的智力来分析少量数据现象,并从中归纳总结出情报分析的规律。随着科学技术的快速发展,学科之间的关联性和交叉性逐渐加强,学科知识的划分越细致,所涉及的内容也就越专业。目前,情报分析更多地依靠先进的信息处理技术,利用“机器学习”方式来挖掘数据、分析和统计相关联系,还可以利用定量化方式来关联基于关键字的词汇共现,其核心思路就是在计算能力的基础上利用人工分析判断数据联系。因此,利用数据来阐述问题已经成为情报分析的主要特点,在情报分析报告中利用数据、公式以及图表来说明理论的方式也充分体现了数据分析技术在情报分析领域的重要地位。

2.2关注多源数据融合

大数据技术可以通过各种渠道,并利用各种收集手段来获取各种数据信息,在进行集中整理后,形成一种基于不同数据格式的统一处理方式,这种处理过程被称为多源数据处理融合技术[5]。一方面,可以通过不同用户和不同网络途径来获取同一个研究方向的内容;另一方面,根据信息数据的种类和用途的不同,比如:根据视频、音频及文本等方式进行分类,也可以根据结构化和非结构化等方式进行分类,同时也要考虑数据的异构性。需要注意的是,相同类型的数据也有可能分布在不同的站点,并由各自的数据供应商提供,如论文分析研究的数据来源就包括中国知网、维普及万方数据库等[6]。一般情况下,针对前沿领域进行情报分析时,只利用一种类型的数据是不够全面的,应该从其所涉及的期刊论文、图书资源、专利以及项目等收集有效信息,进行整合处理,这样才能够体现出该研究的整体特征。

3嵌入式知识发现情报分析服务的重要环节

3.1知识发现系统的利用

将文献分析方式与数据挖掘技术进行有机结合已经成为知识发现方面的热门研究内容,并且取得了可以直接应用的研究成果,这为嵌入式知识发现情报分析服务提供了重要的研究方式。不可否认,选择和使用合理的知识发现系统会提高信息数据的分析效果,其中比较有代表性的就是充分认识到知识发现系统的优势,评估数据分析结果与用户的契合程度,从而让数据分析服务的效果得到用户的认同。比如:一些基于知识发现的软件和系统比较适合大型结构化文献数据分析,可以根据结构化数据的特点分析出信息的特定发展规律[7];还有一些基于主题和科研本身的知识发现模型,其可以利用文献资源之间的相关性挖掘有效信息,并对文献资料进行多角度分析,根据关联原则描述该学科领域的发展趋势图;另外还可以利用关联和非关联的知识发现方法,再结合相关语义分析、词汇频率统计等技术,最后通过关键词聚类方式来寻找潜在的知识发现。

3.2准确获取数据

知识发现可以分析大量数据和信息资源,并从中挖掘明显关联或者非关联的科学研究的内在规律,情报分析人员可以向科研人员提供相关情报分析,一般采用的是定量和定性相结合的分析方法。在进行定量分析之前,如果要获取较为准确的目标数据,除了要分析数据源以及检索方式之外,还要对数据进行预处理,如消除噪声数据、集成数据等。大部分的数据分析软件都具有数据筛选功能,其中常见的tDa(threatDiscoveryappliance)软件就可以通过列表功能手工筛选原始数据。需要注意的是,当自动筛选数据时,常常由于数据中检测出偶发的错误或者不同的存储格式导致筛选失败,这就无法按照要求构建知识图谱。嵌入式的知识发现服务可以将筛选后的数据与专业数据分析专家共享,由此可以进一步提高数据的准确性,从而得到与研究对象关联紧密的数据。

3.3应用综合分析方法

科技创新活动不仅包括学科和领域的创新,而且还涉及社会各个方面的创新,所以嵌入式知识发现服务需要为决策人员提供情报分析服务,帮助分析对象的社会行为,并为决策人员指明科研决策的发展方向;此外,还可以根据用户的需求,结合经济学、社会学、管理学以及情报学等学科的分析方法,多方面地展现科技创新在社会环境中的具体状况和发展趋势。如今,国外已经出现了专门提供情报分析服务的公司,比如美国的麦肯锡公司就对医药领域提供多方面的分析和研究服务。而国内关于情报分析的研究还处于起步阶段,高校图书馆可以借鉴国外成熟的研究成果,比如可以利用波士顿矩阵方法来分析文献资源之间的关联性。

4情报分析服务模型总体设计

情报分析服务的主要功能就是针对数据进行整理和分析,从而挖掘知R的内在关联性。该研究根据内容解析方法来实施情报分析服务,并专门构建一个情报分析的服务模型。该模型采用了分层结构,自上向下共分成三个层次,即界面展示层、知识发现处理层、数据资源层等,具体结构示意图如图1所示。

首先是数据资源层,其确定研究对象包括三个步骤:确定分析目的、确定研究范围、搜集情报等内容。其次是知识发现处理层,它主要包括三个方面的内容:①制定编码标准,并借助计算机辅助工具来构建专属词典,其主要分为专业术语词典、停止词词典、同义词词典等。②编码部分,可以将文本文件转换为计算机可识别的文本向量。③数据分析部分,可以利用相似度算法和聚类算法来处理文本向量,从而实现情报自动聚类和串并功能。最后是界面展示层,主要功能为针对数据进行分析。

4.1数据资源层设计

数据资源层为情报分析提供海量的数据资源,从各个数据源中收集数据并集成在情报员数据库中。众所周知,数据库的性能会直接影响情报分析服务模式的处理效率。目前,比较成熟的数据库种类主要有两种:关系型数据库和非关系型数据库。经过几十年的发展,关系型数据库技术相对比较成熟,其中的行和列的关系非常明确,主要采用表型结构存储数据,用户比较容易接受。但是,随着数据库技术的不断发展,关系型数据库的弊端也逐渐显现出来:①针对海量数据进行查询和存储操作,海量数据信息时刻充斥在互联网上,如果关系型数据库还是采用表型存储海量数据,这时的存储是以亿为单位。当利用SQL(StructuredQueryLanguage)语言查询或者针对多张表进行关联查询时,其查询效率是非常低的。②数据库的扩展性较差。当处理海量数据时,数据的结构非常复杂,修改数据库的表结构是非常耗时的,因此复杂的数据结构的处理效率无法达到用户的要求。③数据库的读写效率。针对动态的信息,每秒的读写次数要达到上万次以上,而关系型数据库的读写速度无法达到这种要求。

4.2知识发现处理层设计

知识发现处理层的主要功能是针对数据资源层的数据进行深度的分析和挖掘,它可以利用内容分析方法进行数据分析和情报编码,具体的功能模块图如图2所示。知识发现处理层主要包括四个功能模块:情报自动聚类处理模块、情报串并处理模块、文本预处理模块、文本向量表示模块。

4.3界面展示层设计

界面展示层主要包括两个部分:知识图谱展示功能和人机交互功能。知识图谱展示功能形象展现出情报数据资源的分析结果,是针对情报数据资源分析的拓展,它可以准确表达现象层面的具体信息,并通过更进一步的分析来找出隐藏在情报中的规律,从而协助情报分析人员更好地处理情报。人机交互功能是利用操作界面来实现用户和软件之间的信息交流,更好地帮助用户控制软件。

5结语

嵌入式知识发现情报分析服务模式是建立在先进的信息处理技术的基础上,为了更好地满足科研人员对于知识服务的需求,同时也是情报服务可持续发展的重要保证。科学技术的快速发展、大数据技术的研究以及数据分析方法的改进,都为嵌入式知识发现情报分析服务的个性化、智能化及多元化发展创造了有利条件,提供了良好的研究前景。

参考文献:

[1]顾涛.基于大数据的竞争情报协作分析研究[J].情报科学,2013(12):114-118,135.

[2]邓仲华,李立睿,陆颖隽.基于科研用户情景感知的嵌入式知识服务研究(上)[J].情报理论与实践,2014(9):16-19.

[3]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.

[4]田瑞强,姚长青,潘云涛.关联文献的知识发现与创新研究进展[J].情报理论与实践,2013(8):117-123.

[5]周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.

[6]化柏林.多源信息融合方法研究[J].情报理论与实践,2013(11):16-19.

科学计数法的学情分析篇6

关键词试验设计;数据处理;农林业生产

试验设计是统计学的重要分支,它属于一般研究方法中的科学试验方法的范畴,是由试验方法与数学方法,特别是统计方法相互交叉而形成的一门科学,是与样本理论、估计理论和检验理论同时发展起来的。试验设计是为了得到试验目的和搜集到可靠的资料,制定出试验次数少、误差小、实行科学控制的试验方案。解决问题的方式方法(即策略),直接影响对问题的解决过程。其现已广泛应用于各行各业,如化工、医药、微生物、军事工程、食品等诸多领域。

1试验设计的发展

试验设计最早来源于农业试验,可追溯到20世纪20年代。试验设计学科的奠基人Fisher在《研究工作者的统计方法》一书中最早提出了“试验设计”术语。《试验设计》(1935)一书标志着试验设计学科的诞生。他在书中首次系统地介绍了试验设计的原理和方法,如试验设计的3条基本原理:随机、重复、区域控制。在试验设计发展的道路上,Fisher创立的传统试验设计是第1个里程碑[1]。正交表的构造和开发是第2个里程碑,日本田口式正交表设计法是突出的代表,而我国研创的正交试验设计法与田口式正交表设计法相比,程序更简单,指导理论正确合理,优化效率更高[2]。与欧美式艰深的多因素优化方法相比,更简洁易行。日本学者田口玄一开发的稳健试验设计是第3个里程碑。

在试验设计方法发展上,国内外不断提出新的试验设计方法的理论[3-6]。Yates(1933)提出重复试验中的混杂原理,提倡用不完全区组的排列方式,又提出复因子试验的混杂方案(1935),进一步提出多品种试验的格子设计和分析方法(1936—1937)。Cochran(1937—1939)提出田间长期试验设计。Bose和nair(1939)提出部分平衡不完全区组设计。Finney(1945)提出复因子试验设计的分式方法以及裂区混杂设计等。Yates(1949)提出农业轮作试验设计。Kemthorne(1952)及Cochran和Cox(1957,1992)的2本经典著作较系统全面地介绍了试验设计的原理和方法。Federer(1956)提出了增广设计。taguchi(1957)提出稳健参数设计。Scheffe(1958)提出配方设计。Box(1958)提出反应面设计。方开泰(1980)提出均匀设计。Lin等(1983,1985)提出修饰增广设计。patterson(1983)等提出α格子设计。

2试验设计的概况

2.1试验设计的方法分类与原则

试验设计的基本工具是正交表,正交表是根据均匀分布的思想,运用组合数学理论构造的一种数学表格。试验设计的方法很多,不同的方法用于解决在实际工作中所遇到的不同的问题,应用最广泛和最具典型性的方法有区组设计、正交设计、参数设计、回归设计、均匀设计、混料设计、饱和设计与超饱和设计[7]。我们也可以根据不同的目的把试验设计中的问题大致分为五大类:处理比较,变量筛选,响应面探查,系统优化,系统稳健性。试验设计的主要作用是降低试验次数,提高试验精度,使研究人员从试验结果中获得无偏的处理效应及试验误差的估计,进行正确而有效的比较。为了控制干扰因子引起的差异,降低试验误差,在试验设计中要遵循3条基本原则:重复、随机化、区域控制。

2.2试验设计的系统方法

科学试验设计可分为3个阶段:试验设计阶段、试验实施阶段、试验分析阶段。通常可以遵循以下7个步骤进行:目标阐述、选择响应、选择因子与水平、制定试验计划、实施试验、分析数据、作出结论。

2.3试验设计数据处理方法

在试验设计分析方法中,极差分析、方差分析、回归分析是3种最主要的分析方法。极差定义为最大值与最小值的差,极差分析法以极差来判断一组数的离散程度。极差分析法直观形象,通过非常简单的计算和判断就能求得试验的结果:主次因素、优水平、优搭配及最优组合。它在试验误差不大、精度要求不高的场合、在筛选因素的初步试验中,在寻求最优生产条件、最佳工艺的科研生产实际中得到广泛地应用。方差分析又称变异数分析或检验,其目的是推断2组或多组资料的总体均数是否相同,检验2个或多个样本均数的差异是否有统计学意义。回归分析是研究变量之间相关关系的一种统计推断法,在试验设计回归分析中,通常研究的是因子与响应之间的相互关系。

2.4试验设计、数据处理与计算机技术

试验设计的目的之一就是提高采集数据的准确性,其数据处理能力和准确性也是我们十分关注的。而计算机技术的突破也增强了试验设计的能力和准确性。特别是传统的商业软件在版本的升级中增加或强化了试验设计的分析能力,为我们创造了有利条件[2]。此外,在计算机辅助设计上,曾庆莹等[3]开发了计算机辅助试验设计研究简称(CaR系统),由试验设计、建模分析、试验优化三大模块组成,具有功能比较完善、数据处理灵活和使用方便等特点。

3试验设计与数据处理在农林业中的应用

3.1农林业试验设计

农林业试验设计的主要作用是减少试验误差,提高试验的精确度,使研究人员能从试验结果中获得无偏的处理平均值及试验误差的估计量,从而能进行正确有效的比较。农业试验根据不同目的、不同规模、不同条件来选择最佳的农业试验设计方案和相应的统计方法。迄今为止,数理统计学家已为农业科学工作者提供了许多试验设计方法。如完全随机区组设计、拉丁方设计、裂区设计、条区设计、不完全随机区组设计、格子方设计、正交设计、回归设计等,农业科学工作者广泛应用这些试验设计方法来估计影响农艺(养殖)过程的内外因素中因素主效和交互作用的大小,作出有一定概率保证的统计推断。可以说,任何重要的农业科学试验,如品种比较试验、肥料(饲料、农药)比较试验、栽培(饲养)条件试验及各种农艺措施综合配套试验都是采用一定的试验设计方法进行的。动植物的许多生理生化因子的生物学效应也必须采用合适的试验设计方法加以研究。植物组织培养培养基选择以及培养条件的选择[8-9],分子生物学反应条件筛选体系建立均在一定的试验设计下展开[10-11]。可见正确的试验设计方法保证了农业科学试验结果的可靠性和其实际应用价值。

3.2农业抽样估计

农业研究的对象往往是数量巨大且分布特性各异的群体,故研究农业科学试验、生产管理和农村调查工作中合适的抽样理论和技术,也是农业试验统计学的重要任务。农业生物群体中除服从正态分布外,还有不少群体服从泊松分布、负二项分布及其他类型的偏态分布。现在已研究出对这些不同分布的合适抽样理论与技术,并成功应用于苗情、虫情、疫情调查。在农村调查和生产管理中也应用了简单随机抽样、类型抽样、系统抽样、整群抽样、各阶段抽样、序贯抽样等方法和技术,从而保证农业问题统计分析的顺利有效进行。

3.3农业预测预报

正确预测预报作物(动物)的生长发育进度(苗情)、产量和病虫害的发生时期与数量,对于确保农业生物的稳产和高产极为重要。早在20世纪50年代,回归预报技术就普遍用于病虫害预测预报,20世纪70—80年代,这一技术又在作物苗情测报上得到应用。20世纪80年代,由于卫星遥感测量技术的发展,大面积预测预报作物产量提到了议事日程,以回归分析方法为主的预报又应用于作物产量的测报。这就要求研究农艺(养殖)过程中各因素之间的相互关系,建立自变量因素与因变量指标之间的数学函数,包括一元线性回归式、多元线性或非线性的回归函数,从中获得优化的回归预测式用于农业预报与控制。另外,气象预报和其他灾害预报也由于统计方法的改进和计算机的应用日益提高了精度和效率。从而使得农业预报技术成为人们了解农业生物生长发育动态、预测天灾虫病、指挥和调整农业生产必不可少的工具[12]。

3.4农业多元分析

影响农业生物产品产量与质量的性状很多,这些性状在生物的生长发育与产品形成过程中相互联系或制约,因此研究多个农业生物性状的综合生物学效应及多元相关分析十分重要。由于计算机技术的迅猛发展,目前已利用主成分分析、典范相关分析、因子分析、聚类分析和判别分析等方法研究和分析农业科学试验中的多变量数据,得出一些有意义的结果,从而指导生产实践[13-15]。

3.5农艺措施优化

综合农艺措施组合的优化技术是通过控制农艺措施实现农业高产、优质、低耗的新途径。20世纪70年代,我国推广优选法、正交设计和其他优选方法应用于农业科学试验。80年代,我国农业科学工作者运用回归设计(如回归正交设计、回归旋转设计、回归正交组合设计等)方法建立模式化的施肥和作物栽培程序。从庄郁华等运用回归设计方法建立杂交早稻、威优青的综合农艺措施数学模型和高产施肥模式开始[16],我国已对水稻、油菜、玉米、棉花、小麦、柑橘等10多种农作物建立了优良品种模式化栽培程序[17-20],并对不同作物在不同类型土壤上的施肥建立了一些优化方案。由于推广优化栽培技术,有的良种增产效果十分显著。农业优化技术的另一个重要方面是农业运筹学。目前,线性规划在农作物合理布局,农业产、供、销、运网络优化、庭院经济多目标优化决策等方面得到应用。动态规划、线性规划和系统理论应用于农业区域规划,如河南、湖南等省份成功做出了若干个县(市)的区域规划,对农业宏观决策和宏观指挥起到重要作用。

4参考文献

[1]FaSoULaSaC.principlesofcropbreeding[m].赵锁劳,译.1993:41-48.

[2]徐仲安,暴丽艳,马青梅,等.计算机技术在正交试验设计数据分析中的应用[J].科技情报开发与经济,2004,14(5):135-136.

[3]曾庆莹,王阿.计算机辅助试验设计[J].信息技术,2008:146-148.

[4]SCHeFFeH.experimentalwithmixture[J].JournaloftheRoyalStatisticalsociety,1958(B20):344-360.

[5]BoXGep,HUnteRJS.multifactoeexperimentaldesignsforexploringresponsesurfaces[J].annaalsofmathematicalStatistics,1957(28):195-224.

[6]ta-GUCHiG,wUYU-Lin.introductiontooff-linequalitycontrol[m].Japan:CentralJapanQualityassociation,1979.

[7]陆漩.超饱和试验设计的参数估计问题[J].数理统计与管理,1998(17):6.

[8]李杰,黄敏仁,王明庥,等.植物外源激素对大花蕙兰体胚发生影响的研究[J].北京林业大学学报,2005,27(4):65-68.

[9]赵贤慧,刘庆华,王奎玲,等.诱导红金银花愈伤组织的影响因素研究[J].山东林业科技,2007(1):9-11.

[10]高燕会,朱玉球,黄华宏,等.杨梅RapD-pCR体系的正交优化研究[J].生物技术,2006,16(3):55-58.

[11]黄子锋,周厚高,王凤兰.优化麝香百合RapD反应体系的研究[J].安徽农业科学,2008,36(18):7579-7580,7594.

[12]白厚义,肖俊璋.试验研究及统计分析[m].西安:世界图书出版公司,1998.

[13]关颖男.混料回归设计[J].数学的实践与认识,1980(1):52-64.

[14]DUDaGG.Useofsimplex2latticedesigntechniquestodetermineoptimumdistributionoffertilizersbetweentimesoftheirapplication[J].FertilizerResearch,1992(31):193-207.

[15]SCHReVenSe,CoRneLLJ.Designandanalysisofmixturesystems:applicationsinhydroponic,plantnutritionreasearch[J].plantandSoil,1993(154):45-52.

[16]庄郁华,黄克辉,袁裕文.杂交水稻规范化栽培技术的探讨[J].湖南农业科学,1982(2):6.

[17]李隆.肥料试验中应用的单形格子设计及其统计分析[J].土壤通报,1992,23(6):275-276.

[18]刘春光,周建斌,陈竹君.混料试验设计在肥料配比研究中的应用[J].西北农林科技大学学报:自然科学版,2001,29(1):5963.

科学计数法的学情分析篇7

案例背景

在年级管理工作中,以班级为最小组织单位,以班主任和学科教学为最小实施单元,在承认并贯彻“教学质量是德育管理质量的副产品”的前提下进行年级的德育与教学的统一管理,是我们的基本认识和总体原则。从教学看德育,从教学看管理,如同“执果索因”,探求的目的绝不会偏离事物的本质。

但是,在当今以数据引领管理和管理决策的时代,由于种种原因,一些原有的年级管理模式和运行方式,仍然没有达到数据时代应有的分析质量和分析层次。

1.借鉴大数据时代的数据手段和数据分析,形成管理的数据思维,实现从“经验型”到“数据型”的转变

(1)数据思维要求年级管理从对学生成绩、班级成绩的粗糙了解,转变到精细的数据分析和对数据特征及规律的把握。

(2)数据思维要求年级管理从对考试中某一群体成绩的粗糙了解,转变到精细的分类和对每一个体特征的把握。

2.借鉴大数据时代的管理理念和组织原则,明确与挖掘管理对象的本质,实现从“分数型”到“知能型”的转变

(1)重新审视传统的“一分三率”(平均分、优秀率、及格率和低分率)关注的是什么,从学校及教学管理层关注“一分三率”,转变到学生和教师共同关注数据分析反映出来的知能问题。

(2)“知能型”分析不仅仅把进行教学分析的主体放在年级管理人员、班级管理人员一方,更注重把成绩分析的主体放在学生和家长一方,从而引导“教”的一方改进“教”的方法,促进“学”的一方改进“学”的策略。成绩分析更应注重使学生和家长参与到分析和质量评估的过程中来。

3.借鉴数据挖掘的思想,从“横断型”转变到“追踪型”数据分析,并确切地表现为决策、管理与实践(1)从对一次考试的深入分析,转化到深入进行历次考试的纵向分析,并进行数据的比对。

(2)通过追踪分析多次考试成绩的变化规律,转变到思考教与学和管理细节,不仅仅是阶段性的决策与措施,更重视反思若干个连续的时期的措施与管理的系统工程的实施。

4.管理的精细化必然要求评价指标化、数据化,教学与德育管理中的数据存储与数理统计,需借鉴大数据的“数据存储仓库”和“网络数据分布”手段

(1)借助于计算技术和计算机技术,以往不能或难于进行的分析将被解决,但这需要评价人员革新观念和管理方式。例如,在传统的模式下,数据以“一周”或“一月”为周期的阶段性汇总和分析,以体现被观察对象的阶段表现。而在分布式数据存储模式下,数据可随时以任何时间间隔汇总与分析,并以方便的图表化方式呈现规律与状态。

(2)以往的成绩分析,因其技术性及专业性,只能由专业技术人员操作,而借助现有的计算技术和统计模型,成绩分析已经成为学生、家长和普通教师提取信息的操作。

(3)数据及分析结果的可靠存储和检索、便捷的提取和访问、即时的分析与使用,使得“用数据表述事实”、“用数据权衡资源调配”、“用数据判断决策”和“用数据改进管理”成为现实。

(4)以数据技术、计算技术和计算机技术为背景的数据分析、结果描述的数据思维成果,是教学资源的组成部分。同样,教学与德育的管理层、年级组长、班主任和任课教师,需要进行教育评价、数理统计和组织管理知识的自我“充电”,毕竟统计与评价是一门综合的科学。

案例问题

在实践工作中,我们发现在学校及教学管理层中所强调的“一分三率”标准,严重影响教师的教学策略,并成为教师教学与管理的事实标准。这种依据“一分三率”的管理目标,在指导教师教学时,使教师在教学中不能较好地针对每一个人,同时,各学科之间也将失去联系与沟通,从而优势力量与优势资源不能集中,学生得不到应有的提高,学生“偏科”和教师“拼抢”时间现象成为普遍。正因为过度关注“一分三率”,学生的层次差距、班级的针对性管理就成为笼统的分析,而不能建立在数据基础上清晰地描述年级和班级之中出现的层次分化,也不能建立在如何调整后续工作的思考上。

我们在多次以数据进行思考的成绩分析的尝试后,逐步认识到要尽可能引导教师以数据来分析和反思成绩分析所反映的知能问题。这种引导,不是仅限于“一分三率”,更注重直观化、图表化和数据化问题,体现成绩分析中表现出来的学生整体结构问题、阶段性问题、时序性问题和层次问题,从而追踪和返回到教学问题、班级管理问题以及家校互动问题。这样的分析,就把年级管理的上层与下层,学校、教师、学生和家长作为一个系统有机的整体,完全纳入到问题的分析之中,形成教育与思考的合力。

问题解决

1.在年级教学管理中,关注班级整体和学科整体的分析与比对

(1)关注各个班级的学科成绩是否均衡,从差异上观察班级与任课教师特征。通过统计的方法,得到某次考试的班级“学科成绩均衡图”,直观反映单次某一班级各学科的优势。这样,结合“各科成绩对班级贡献度比较”,年级组长、班主任可详细掌握班级各学科学习情况和动向。

(2)关注各个班级的历次总分的追踪性对比。基于网络存储的数据,可方便地得到“历次考试成绩总分对比”图表,由此可追踪班级整体发展和规律,借以研究一个时期的班级发展情况;若参考“总分”、“名次”和“标准分”的追踪性对比,则可反映不同侧面,如学生是否出现了层次的分化等。

(3)年级组长与班主任可通过数据存储仓库,提取到其他数据,如通过“考试总体情况”数据、班级历次或单次的成绩册来细致研究每一位学生,或者某一特异性群体的学生;查看备课组长、班主任和任课教师的数据报告,则可反映教学与管理中出现的问题。我们再次强调,德育管理与教学管理是密不可分的,教学中出现的问题,本质上有些就是德育管理中的问题;而班级管理中出现的问题,有些就是教学问题。

2.关注备课组,研究纯粹教学上的细节问题

(1)关注备课组,从统计学角度细致研究整体与个体、全局与部分。可以用统计的方法研究单学科或总体成绩的单次考试成绩“箱线图”。“箱线图”可以最直观地反映五数总括(最高值、最低分、中间分数、上下四分位数)和数据散布规律、异常值。当然,若对统计图表较为熟悉,也可以分析和使用“茎叶图”,则可更为细腻地刻画班级学生成绩分布情况。结合“班级平均成绩—班级标准差对比表”,则可反映学生成绩的集中或离散与总体平均分情况。

(2)关注备课组的单一学科历次考试班级对比,以追踪教学与管理的变化。使用“标准分追踪对比图”来反映班级成绩的变化,则使对比不再依赖具体试卷难易等情况,可以真实地反映整体与个体到底是进步了,还是后退了。同样,在标准分计算时所反映的差异数值,则可反映班级学科成绩的变化,这从另一个侧面反映了教学与管理的协同性。

若备课组长参考“卷面质量分析”、“命题分析和能力分析”等数据,则从知能基础及学生个性特点上把握管理中的问题。当然,我们也可以参考班主任数据、任课教师数据,进一步去研究和反思问题。

3.关注学科教师的统计数据,以探求教学、管理和学生群体的知能问题

(1)学科教师分析成绩,应关注发展性和“人”的因素。只依赖一种或几种统计方法来表现和反映学生成绩、教学成绩不完善,也不客观。但它是必然的导向。同样的,没有建立数据模型,不从数据出发,不用数据说话,这种分析的科学性与可靠性,就更为荒唐了。在当前已经进入“细节管理”、“数据管理”的时代,学校与学校之间的竞争与发展,本质上是某一方在管理中极为微小的进步超越了对方,那种一方大幅度超前于另一方而获得发展的时代,几乎一去不复返了。

(2)统计的学生数较少时,对数据更有意义的处理,不仅仅是统计,而是分类、追踪和挖掘。从学科教师角度看,较少学生的分数是否趋中或正态,现实意义不大,此时针对个体进行深入分析的意义更大。

(3)学生成绩相对于知识、习惯、能力、态度等,在成绩数据上是如何表现的,需要对现实与发展同时关注,而不是只关注现实或发展的一种情况。必须承认,学科教师的数据统计知识的素养和能力,技术与数据的支撑,也会影响到成绩分析的效率和质量。

(4)学科教师“追踪性”地关注班级整体情况。借助当前计算技术和计算机技术的强大优势,可从各个角度研究班级总分、对比历次考试成绩的变化、研究各分数段人数分布。关注进步与退步的具体学生,落实、定位到个人,以解决管理的各个细节问题。

(5)反思个体作答与试题情况。学生在考试中的反映,本质上是操行的意识与习惯问题。例如,以网络技术采集数据,可从学生作答的“小分统计”,研究每个题目的得失分;“知识点统计”对应到知能问题;“错题名单”对应到个人。基于数据采集技术和分析技术的作答分析,实现了人、题、答的一一对应,从而为“定位”和“盯人”做出了技术和实现的准备。三个要素的对应,本质上指出了教学与管理中要寻找的问题——个体与知识、能力的情况与后续管理。

利用数据分析,在实际工作中,我们经常会发现“经验性”的容易知识点,数据却显示出现实与经验的大相径庭。数据会揭示教师、学生和教与学双方作用的变化,时代背景,社会背景等情况的不同,以往的经验和固有的做法,需要进行调整和改变,而数据则将显示这种改变与方向。

(6)从数据指导管理,让数据说话,以指引学生进行自我反馈、自我监控和内省性的学习与自我管理行为。数据的这种指导作用,不仅仅表现在学生身上,也将指引教学的管理。例如,提取数据仓库中的数据,二次利用作答分析数据,做出知识与能力的考点“灰度矩阵图”,用灰度表示通过程度,迅速掌握个体的知识(或能力)的薄弱点,迅速对学生进行辅导层面的分类。这是一个富有启发的实务性的工作,它可以被利用到管理的很多方面。

案例反思

学校的年级管理是一个承上启下的系统管理工程,涉及教学、德育和组织管理的资源调配等方面,其最终目的是实现年级教师教学、学生学习成绩及操行表现的整体提高,达到上级管理部门和社会的需求。

管理必然要涉及评价。以“教学管理”带动“班级管理”,为教学管理在年级层面上形成一种数据所表现出来的有积极意义的客观性描述,这种客观性描述,描述教与学的事实本身,促进教师思考与改进,促进学生思考与改进,同时也促进年级管理人员和家长、社会在服务层面上改进服务质量。借鉴数据时代的数据分析、数据挖掘的技术与方法,实现成绩统计与分析从“经验型”提高到“数据型”,以实现管理与评价的科学性;从“分数型”深入到“知能型”,以实现管理与评价的积极性;从“横断型”转化到“追踪型”,以实现管理与评价的发展性。在这三个方面力量综合起来的状态下形成师生自我反省并积极改进的价值管理理念,从而能够调动全员管理的积极性,尽可能规避只有年级管理人员才去管理年级的局面。

科学计数法的学情分析篇8

关键词:数值分析课程设计;实践教学;教学改革;教学方法

中图分类号:G420文献标志码:a文章编号:1002-2589(2013)24-0291-02

《数值分析》是一门研究数值求解各类数学问题的课程,是综合性大学数学专业与某些理工科专业的必修课程,也是面向全校学生开设的通识选修课。在《数值分析》课程设计的实践教学中,学生经常抱怨时间短,内容多且复杂,难学且不会应用。事实上,《数值分析》既有数学课程在理论上的抽象性和严谨性,又有解决实际问题的实用性和实践性,它作为科学计算的基础理论与基本方法,已经广泛地应用于物理学、力学、计算机应用、航空航天、土木工程、机械工程、风险投资和经济管理领域。如何改变学生的观点、提高学生的兴趣、提高《数值分析》课程设计的教学质量,已成为数学专业课程教育教学改革的焦点之一。笔者经过几年的《数值分析》课程的教学,分析了《数值分析》课程设计实践教学中存在的一些问题,并根据学生专业的特点提出几点教学改革建议。

一、实践课程中存在的问题

《数值分析》课程设计实践教学,课程难学与本课程教学过程中的一些特点有关。具体说有如下几点。

(一)任课教师的专业限制

《数值分析》课程是信息与计算科学专业的专业必修课,它的任课教师是数学专业教师。而《数值分析》课程设计培养的是厚基础、宽口径、应用型本科人才,属于应用教育。在教学过程中,任课教师常常强调专业和基础,忽视实践与应用,这使得学生要花许多时间学习,才能学会该课程,如果不这样做,很难达到老师的要求。这样学生的实践练习时间就很少,更难达到用所学知识来解决实际问题,造成教与学脱节、学与应用脱节。另外由于数学专业教师缺乏工科背景,教学中多是只给出概念、公式、定理,罗列出方法和计算,很难做到时时处处与实际应用需要结合,这样会让学生感觉该课程就是一门枯燥的数学课,很难做到学以致用,逐渐地丧失学习兴趣。

(二)学生的专业特点限制

《数值分析》课程是面向数学系信息与计算科学专业开设的专业必修课,而信息与计算科学专业的学生数学基础好,计算机基础薄弱,程序操作能力差,课程设计实践教学的目的是各种数值算法的计算机实现,学生本就觉得这门课程理论枯燥难学,由于不熟练编程序,很难有兴趣自己操作实现各种算法,违背了课程设计的目的,使得这部分内容多是老师讲解演练各种算法,学生很少动手操作,教学效果较差。

(三)数值分析课程设计实践教学时间短,内容多

《数值分析》是一门与计算机密切结合的课程,该课程的任务是要根据计算机的特点给实际问题提供切实可行的算法,因而,课程设计是该课程教学中一个不可缺少的环节。然而,由于学时较少,在保证理论的限制下,课程设计实践教学只有一周时间。而且《数值分析》课程设计多安排在教学的最后一周,学生在学期最后几天往往会因很多事情影响学习,实际授课和实践的时间就更少了,在这样短的时间内完成许多算法的实践是很难做到的,只能选择几个重点的算法由老师讲解学生练习,学生只掌握了几种算法的原理,掌握效果也并不好,很难用所学知识去解决实际问题,这与《数值分析》课程设计解决实际问题的实用性和实践性相违背。

(四)数值分析课程设计教学模式单一

数值分析课程设计教学目标是教学生将所学的理论知识转化为实践能力,采用的教学模式就是上机讲解和练习。连续五天的这种教学模式会让学生觉得形式单调、内容枯燥、难学,在没有老师在身边监督下,有的学生干脆不听不练习,玩起了游戏,老师过来检查时关掉游戏,老师离开又继续玩,反反复复地看着老师,几天的实践课程就这样荒废,很难达到预期的教学效果。

二、教学改革的几点建议

针对上述的几点问题,笔者在《数值分析》的教学中提出以下几点改革建议。

(一)明确教学目的

必须明确我校人才培养的目标不是专业人才,而是应用型本科人才,培养操作能力强、宽口径、复合型的人才。针对这种人才培养模式的特点,我们确立《数值分析》的教学目的是:通过这门课程的学习,使学生了解数值计算的基本原理,掌握一般的数值计算技能,增强学生实践能力,使学生能够在实际需要涉及无法求解的数学问题时,会使用数值计算的思想和方法,为以后的实际操作和研究工作打下良好的基础。

(二)充实和精炼教学内容

《数值分析》是一门严谨、完整的学科体系,内容丰富。连同课程设计部分它的学时是64学时,笔者在近几年的授课过程中感觉到,在少学时的情况下,如果所有内容都讲到,往往会顾此失彼,不能突出重点,学生学下来后并没有在脑海里对所学知识留下深刻印象。如果将实际应用较多的内容重点强调,相关的方法应用详细讲解,并在上机实验上重点练习,其他知识点弱化讲解,应用较少却很繁琐的内容精简掉,这会使得与实际应用相关的重点内容有充足的时间讲解,实用性很强的方法有动手操作的机会,不仅减轻了学生的学习负担,还激发了学生思考用这些方法解决相关问题的兴趣,增强了学生解决实际问题的能力。

(三)不断改善实践课教学模式和教学方法

《数值分析》研究的是各类数学问题的数值算法,对于实用性较强的算法一定要多给学生动手操作的机会,加深学生对这些算法的理解,熟练它们的应用。数值试验的题目选择一些与实际应用相关或生活相关的案例,让学生将分析问题、建立模型、选择合适的算法、编写程序、分析结果这一计算主线完整地进行下来,以缩小学会该课程与解决实际问题的距离,增强学生的能力和信心。数学软件可以指导学生使用简单且方便调试的软件,如matlab等,这可以兼顾到学生计算机语言基础薄弱,避免调试程序时语法错误频出而丧失信心。在教学方法上,做以下改革:

1.采用在解决问题中引出理论内容的教学法

每节课前都提出一些与学生专业和生活联系紧密的问题,和学生一起探讨这些问题的解决方法,越简单越好,从实际问题的解决方法入手,运用归纳、分析的手段引出相应的数值计算理论,之后从理论上研究解决问题的思想和方法,分析方法的优点、缺点以及所能解决问题的类型,进而给出解决实际问题的程序。例如在介绍数值积分时,课前不妨假设要购买一块不规则形状的养鱼池,按面积付费,判断所付价格是否合理。以其中两点确定的方向为横坐标轴,选择坐标轴上的点后,用船行驶的时间乘以船速,得到不同点的纵坐标,每小块面积用矩形面积近似,这些近似值加起来得到养鱼池面积的近似,将这种思想和方法提炼出来就是数值积分的思想和方法。结合生活中的实例,学生既能掌握《数值分析》中各部分内容,又能了解其在生活中的应用,进而将遇到的问题分类,学会用不同的数值方法解决相应的问题。

2.采用优劣分析式教学方法

这里所涉及的优劣分析包含数值解法与解析解法优劣分析、同一问题不同解法优劣分析等。

如讲到数值积分时,选几个实际生活中遇到的问题为例,如购买性状不规则的养鱼池,需要估计面积,而在边界曲线函数无法知道的情况下,不能直接应用计算定积分的牛顿-莱布尼兹公式来计算面积,而若被积函数是一张数据表、用牛顿-莱布尼兹公式积分后的原函数过于复杂等,都无法直接应用牛顿-莱布尼兹公式计算,而数值积分公式则可以克服这些弊端,强调了数值积分的实际应用价值,给出具体的数值算法,比较数值算法的计算量。又如,在介绍线性方程组的数值解法时,指出线性代数中的线性方程组的求解方法只对阶数较低的方程组适用,阶数稍高就会导致计算量很大,列举一个五阶线性方程组和一个十阶线性方程组,观察它们的计算量,而源自工程实践中的线性方程组多是高阶线性方程组,如土木工程中的有限元方法,最后都会归结为解高阶线性方程组,如果用传统的解法会导致计算量相当大,而给出数值算法,比较数值算法与传统算法的计算量,这样,数值解法的优点可以吸引学生的学习兴趣。

启发学生思考身边问题,发现问题、解决问题。课上,老师讲授之外,师生共同围绕学生提出的那些与生活相关的问题进行讨论,提出解决问题的方法并在程序上实现问题的解决,对大家提出的算法进行点评,这种授课方式能够激发学生学习的热情。

(四)改革考核方法

以往的实践课考核方式是给出几道题目,给学生一定的时间,由他们自己设计算法,给出问题的解决方案,提交课程设计报告,根据这些报告给定成绩。有的同学平时不练习,在最后抄袭别人的实践报告。为了杜绝这类现象,在平时上课时,将学生分组,每次课给每组指定任务,大家分组讨论,每组都给出问题的解决思路,每个组员都要给出补充,根据这些课上表现综合给出考核成绩,这既可以监督学生浪费课上时间玩游戏,又可以保证所给成绩的公平性,调动学生积极性。

三、结束语

教学内容和教学方法的改革,是提高教学质量的关键,是高校提高自身的竞争力适应社会发展需求的必然趋势。讲授《数值分析》课程设计,必须做到与实际问题相结合,根据实际应用取舍教学内容,安排试验学时,培养学生应用所学知识解决实际问题的能力,拓展学生思维,为培养基础全面、操作能力强、综合素质好的应用型本科人才奠定基础。

参考文献:

[1]李庆扬,王能超,易大义.数值分析:第5版[m].北京:清华大学出版社,2008.

[2]周生田,李维国.工科硕士研究生数值分析课程建设与教学改革[J].石油教育,2009,(1):57-59.

科学计数法的学情分析篇9

abstract:theinformationandcomputingsciencespecialtyandmathematicshavesignificantlydifferentfocusanddirection.So,limitteachingforthisspecialtymustbedifferentfromtheformaldefinitionofmathematics,shouldnotonlyfullypayattentiontotheformaldefinition,butalsohighlightstheessentialfeaturesinherenttosolvepracticalproblems.Fromthemethodstosolvepracticalproblems,thispaperrevealsthemathematicalessenceoflimitsteaching,whichmeetstheteachingcharacteristicsofthisspecialtytoimprovethequalityofprofessionalteaching.

关键词:信息与计算科学;专业特色;极限教学;教学质量

Keywords:informationandcomputingscience;professionalcharacteristics;limitteaching;teachingquality

中图分类号:G424.21文献标识码:a文章编号:1006-4311(2012)30-0229-03

0引言

随着科学的发展、知识的爆炸与人的精力的有限性;每个人的精力只能局限于自身的专业领域,正因此如此,大学开设了不同的专业以适应社会的发展与需求。各专业都有自身的特色与优势。信息与计算科学专业是教育部1998年进行专业调整后,新开设的专业;是将原来的计算数学及其应用软件、运筹学与控制论等专业合并改称为信息与计算科学专业。该专业是培养将数学的方法应用于工程领域,解决实际问题的人才。它是数学学科与其他工程类学科的联系的纽带;对该专业学生的要求不仅要有良好的数学基础,也必须具备基本工科素质;也只有这样的人才能利用数学的知识解决工程问题,发挥数学在工程上的应用;这已要求也是该专业最突出的特色。自1999年来,全国已有400多所高等院校注册开办了信息与计算科学专业,是全国高校理科专业中最大的专业之一[1]。从而,对该专业的建设研究一直得到各高校与社会的广泛关注。

《数学分析》是该专业打下坚实数学理论基础的课程,而极限是《数学分析》的核心;贯穿着整个课程,也将影响学生的一生。因此,对极限定义的教学尤显重要,不同的教学方法将培养出学生不同的分析与解决能力。研究如何就该专业的特色,给出该定义合理的教学方式与手段是有意义的事情。虽然就极限的定义教学研究已有不少的成果,但这些成果都是针对所有专业学生的教学模式,没有结合某一专业的特色,给出极限的定义教学。本文从解决实际问题的方法出发,揭示极限的数学本质,结合信息与计算科学特色,对极限定义教学进行了探讨。同时已将提出的教学方法在本校进行了实施,效果明显。

1信息与计算科学专业的特色

信息与计算科学专业是由计算科学、计算机科学、信息科学以及控制科学等多学科交叉渗透而诞生的一门新的理科专业,其主要特点是重数学基础、强计算机应用能力、解决实际问题。新世纪是信息时代,社会需要大量能进行信息处理与研究、应用软件开发与设计的创新人才,信息与计算科学专业正好符合这一社会需求、符合时代特征;主要特色体现在:数学基础扎实,理工融合,即以信息科学和计算数学为基础,以计算机为工具,重视实践能力、创新精神和创新能力的培养[2]。该专业与数学专业的不同是:数学专业更注重形式定义、抽象定义、与抽象推导能力的教学,提高学生抽象逻辑思维能力;从而数学专业有出现游离于实际背景,完全是为抽象的研究而研究的倾向。该专业与其他工科的区别在于:工科在实际中不太注重算法、公式等的严密数学前提条件,而是得到公式就应用,从而在很多情况下出现结果不理想的情形。信息与计算科学专业正是以为解决以上两点为特色而培养学生,要求学生不仅能进行数学理论研究,同时会运用计算机工具,更主要的是将强的数学基础,与熟悉的计算机工具应用有机地结合起来,确确实实解决实际问题。将理论与实际紧密结合,进行软件开发、信息管理与处理等。这就是信息与计算科学专业既有别于数学专业又有别其他工科的特色[3-4]。

正因为以上的特色,《数学分析》是该专业一门举足轻重的专业基础课,也是保证该专业强的数学基础的关键所在。

2数学分析对信息与计算科学专业的作用

数学分析是信息与计算科学专业最重要的一门基础课程,在学生知识结构中占有很大的成分。它是初高中数学的总结、提炼、升华,同时又是信息与计算科学专业后继课程的基础。很多后继课程在本质上都可以看作是它的延伸、深化或应用,至于它的基本概念、思想和方法,更可以说是无处不在[5]。它成为现代科学研究的基本工具,也是信息与计算科学专业强数学基础的最重要的一门课,是该专业区别于其他工科专业最本质的一门课程。它不仅能教予学生一些数学知识,其实更重要的还是教给学生数学思想。数学思想方法的学习比数学知识本身的学习更有价值。对于学生来说,一些数学知识在他今后的工作中可能用不上,但数学思想及由数学思想培养起来的思维能力、素养,将会使他们受益终身。一些重要的数学思想现在是将来也必然是人们进行数学研究和发现的重要思想武器。数学思想生动而富于创造性。每一点数学思想,都是“撼人心灵的智力奋斗的结晶”[5]。

3极限在数学分析中的地位

数学分析是信息与计算科学专业最重要的一门基础课,而极限又是数学分析的基本工具。它贯穿数学分析的整个课程,其实整个分析课程就是讨论各种极限的引入与计算。

函数的连续性:函数y=f(x)在点x=x0处连续,是指■f(x)=f(x■)。

函数的可导性:函数y=f(x)在点x=x0处可导,是指■■存在。

函数的可积性:函数y=f(x)在区间[a,b]上可积,是指■■f(ξ■)Δx■存在。

广义积分:函数y=f(x)在区间[a,+∞]上可积,是指■■f(x)dx存在。

级数u1+u2+…+un+…收敛,是指■■ui存在。

以上的内容就是数学分析讨论的主要内容,从这里可以看出,整个数学就是以极限为工具,对函数的性质进行分析。因此,对极限定义的掌握与理解将关系重大,而极限定义的教学确实不易,多年来对极限定义的教学研究一直广受关注。每年关于该定义的教学研究都有不少的成果出现。但针对信息与计算科学专业特色的极限教学法,至今没见报道。

4凸显信息与计算科学专业特色的极限定义教学

信息与计算科学专业是强调是在坚实的数学知识基础上,以计算机为工具解决工程上的实际问题;因此强的数学是它存在的基石。而上面的分析说明,数学分析是最重要的一门基础课,而极限是数学分析处理问题的工具。因此,探索具有该专业特色的极限教学尤为重要。

4.1分析提出极限的数学基础根据认知理论知道,要使一个人完全掌握某一观点、方法,必须从最基本的开始。极限提出的最基本的数学基础是:

假如一个大于等于零的数比任意给的正数都小,则这个数一定是0。

一个未知数x,现知道该数与一个已知的数a之间的差的绝对值│x-a│比任意的整数都小,则这个未知数x一定等于a。

4.2分析提出极限实质是解决问题的一种方法(图1)

问题1圆的面积的计算:

由于之前我们只知道正多边形的面积的计算,而对于圆,无法求出。但是我们必须明确的是,圆的面积是一个确定的值a,这一点一定要明确。只是我们现在不知这个a的值的大小而已。下面就是a的求法。

分析:由于无法一步准确计算出圆的面积,先计算近似值:第一步:计算圆的内接正四边形的面积S4,以这个结果作为圆的面积有误差;第二步:计算圆的内接正五边形的面积S5,以这个结果作为圆的面积产生的误差变小;第三步:计算圆的内接正六边形的面积S6,以这个结果作为圆的面积产生的误差变得更小。

只要计算的内接正多边形的边数越多,则以此多边形的面积作为圆的面积,产生的误差越小。对于任意正数,总会到某一个正多边形,以其计算出的面积作为圆的面积产生的误差S■-a小于任意正数。因此,根据上面4.1,按这样的方式计算下去,最终就得到圆的面积。

问题2曲线切线的斜率的计算。也可以和上面的分析一样进行说明。

问题3计算1+■+■+…+■+…,分析无限个数相加,显然无法一一相加,怎么办?和问题1一样,通过分步来求。

经过这些例子,跟学生说明极限是解决问题的一种迫不得已而为之的方法。因为有些问题,无法通过初等数学四则运算而得到。它只能通过构造某一个过程,这一过程的每一步所得到的结果都越来越靠近我们所需要确定的那个值,而以这一过程所得到的结果作为我们问题的答案,产生的误差的绝对值小于任意的正数,则按这个过程下去,我们就可以求出我们所要确定的值。这就是极限提出的本质。

按这样的方式教学,使学生完全明白了极限的数学本质,也完全理解了极限是一种解决问题的方法,而且通过构造极限可以解决初等数学无法解决的问题。这样对学生今后分析问题、构造新的计算式子解决问题、提高学生的创新能力等都起到促进作用。教学方法符合了信息与计算科学利用数学知识,以计算机为工具解决实际问题的特色。它完全遵循了人的认知过程,由浅如深,步步引入。

5具体案例分析

在近年的信息与计算科学的数学分析教学中,本人一直按照以上进行极限教学;课堂气氛很和谐、活跃,学生上课积极性高,期末学生对教师的课堂质量评价也都是优秀;学生每个学期最终的期末考试成绩也都很理想。学生参加广西赛区的专业组数学竞赛取得好成绩。

6结语

本文在分析信息与计算科学专业的特色以及《数学分析》课程对该专业作用后,给出了凸显信息与计算科学专业特色的极限教学方法;以提高该专业的教学水平。通过实际应用表明此教学方法对信息与计算科学专业教学的有效性,得到了学生的认可,同时也提高了教学质量。

参考文献:

[1]李家雄.信息与计算科学专业《数学分析》教学探索与实践[J].长江大学学报(自然科学版),2011,2,8(2):129-131.

[2]杨韧,谢海英.发展特色鲜明的一般本科院校信息与计算科学专业.教育与教学研究,2001,2,25(2):90-92.

[3]龚日朝.“以特色取胜”建设信息与计算科学专业的新型思路与实践.大学数学,2004,6,20(3):12-15.

科学计数法的学情分析篇10

关键词:大数据;数据分析;数理统计

基金项目:华北理工大学研究生教育教学改革项目资助(项目编号:K1503)

基金项目:华北理工大学教育教学改革研究与实践重点项目资助(项目编号:Z1514-05;J1509-09)

G643;o21-4

谷歌公司的经济学家兼加州大学的教授哈尔・范里安先生过去说过统计学家将会成为像电脑工程师一样受欢迎的工作。在未来10年里,人们获得数据、处理数据、分析数据、判断数据、提取信息的能力将变得非常重要,不仅仅在教育领域,各行各业都需要数据专家,“大数据”时代的到来使得数据处理与分析技术日新月异,深刻的影响着各个行业、领域及学科的发展,尤其是与数据关系密切的行业及学科,而作为工科各专业硕士研究生重要的公共基础课数理统计学是天生与数据打交道的学科。

怎样在“大数据”时代背景下培养出适应面向企业自主创新需求的数据分析人员或掌握现代数据处理技术的工程师,如何把当下流行的“大数据”处理技术与相关数理统计学课程教学有机的结合,以激发学生对数据处理与分析技术发展的兴趣,这些都是我们在与数理统计学相关的课程教学中不得不思考的问题。然而,当前高校工科各专业硕士研究生数理统计教学的现状却与其重要程度相去甚远,整个教学过程的诸多环节都存在较大的不足,主要表现为:1.教学内容偏重理论,学生学习兴趣不高;2.轻统计实验;忽略对统计相关软件的教学;3.没有注重数理统计的学习与研究生专业相结合,实用性强调不够。4.轻能力培养;轻案例分析等。

这些现象导致的直接后果就是学生动手能力上的缺陷和创新能力的缺乏,不能够自觉利用数理统计知识解决实际问题,尤其缺乏对统计数据的分析能力。因此,需要数理统计学随着环境的变化不断创新新的数理统计思维和教学内容。避免教学内容与大数据时代脱节。为此笔者在该课程的教学过程中,有意识地进行了一些教学改革尝试。提出了几点工科研究生数理统计教学的改革措施。

(1)调整教学内容,将与数理统计相关的大数据处理案例引进课堂。有很多有普遍性的应用统计实际案例,可以在本课程的教学过程中有选择的引入介绍给学生,让学生们了解利用所学统计方法进行实际数据分析的操作过程和得出结论的思维方法。以期解决工科研究生对确定性思维到随机性思维方式的转变的不适应性。

(2)适应大数据时代数理统计学课程的教学环境。实现教学方式的多样性。大数据时代背景下,互联网十分发达,学生根据自己的兴趣去收集、整理和分析数据,既可以改变他们对统计方法的进一步认识,也可以增加他们的学习兴趣。甚至可以以专业QQ群,邮件的方式和同学、老师之间相互交流,交流者处于相互平等的地位,可以畅所欲言,随时随地都可以交流,起到事半功倍的效果。这种交流使得教师不再是知识的权威,而是把教师上课作为一种更好自主学习的引导,这种交流使得他们的思想变得更加成熟。同时参与各种网络论坛,贴吧回答问题等使得他们更能体现自己的价值,这种交流也使得学生的学习热情和学习精神得到更好的激发。

(3)引导工科研究生开展与本专业相结合的课题研究,强调实用性,注重统计思维能力培养。适应大数据时代数理统计学课程教学环境,实现教学方式的多样性。以期弥补学生缺少数据分析实例的训练,解决学以致用的不足。在目前的数理统计教学安排下,受学时所限,如果相当一部分时间用来学习公式、定理的推导及证明,势必没有时间进行实际的数据分析练习。在大数据时代背景下,随着海量数据、复杂形式数据的出现,使得统计方法的发展和以前有了很大的不同,没有实际的数据分析训练,学生们就无法对统计的广泛应用性及重要性有深刻的体会,也不利于保持和提高他们的学习兴趣。这要求具体工作者提出新的统计思想和方法,加深对已有统计思想的理解,以解决实际问题。

(4)改革成绩评定方式。现有的考试模式为通过有限的一到两个小时的期末考试,进行概念的辨析和理论及方法的推导计算,由此来判断研究生关于数理统计课程的学习情况有很大的不足,特别是对可以利用软件进行的某些实际数据分析的考察没有办法实现。因此,有必要通过日常课堂“论文选题―提交―讨论”与期末理论考试相结合的形式对学生数理统计学习进行考核。加大对学生平时考察的力度,相应地减少期末考试成绩的比重。让学生选择一些与自己专业有关的数据进行尝试性的数据分析、一些统计科普著作的读书报告等并写成论文的形式提交,做为对学生成绩的评定方式,更能综合、客观地评价学生的学习情况。

数据分析在现代生活中发挥的作用越来越大,而道硗臣品椒可以与数据分析有机的结合,从而在提高数据分析效率的同时,保持分析结果的有效性,为生产和实践活动提供准确的参考。以上的思考和建议仅是我们在教学研究和教学过程中的一点体会,还有许多工作亟待深入,比如适合工科研究生数理统计课程的大数据案例选取,与课程内容的有效衔接;案例教学法如何实施;教学方式多样化问题;课堂教学与网络交流结合;理论介绍与软件应用训练结合问题等。教学改革与实践是一项艰巨的任务,以培养学生的实际运用能力和正确解释数据分析结果的能力为目的,强调统计思想和方法应用的培养,让学生们了解利用所学统计方法进行实际数据分析的操作过程和得出结论的思维方法将是一项长期的工作。

参考文献

[1].游士兵,张佩,姚雪梅.大数据对统计学的挑战和机遇[J].珞珈管理评论,2013,(02):165-171.