管理学决策树法十篇

发布时间:2024-04-29 22:55:49

管理学决策树法篇1

关键词:中小企业;决策树;风险管理

前言

中小企业的问题是全世界都避不开的一个长久问题。自从19878年改革开放以前,中小企业犹如一颗耀眼的明珠在各个行业全面绽放光彩,取得了巨大的进步与成就,已经成为我国经济发展过程中的中坚力量。然而,市场瞬息万变,行i竞争激烈是各个企业无法回避的事实,这也是风险管理的来源。经济形势的下滑、世界形势的严峻、人口红利的消失使中小企业风险管理遇到了前所未有的挑战。如何有效识别风险来源、管理和规避风险是中小企业实现持续盈利、长久发展、赢得广阔市场立于不败之地的关键要素。我国的中小以乡镇企业、个体、私营企业为主体,普遍存在着数量多、经济实力弱小、企业寿命短、管理活动简单且效率低下、经营规模小、抗风险能力等等特点。所以如何加强中小企业风险管理能力具有十分重要的现实意义,这不仅关系到企业能否持久发展,更关系到经济发展社会稳定。

一、中小企业风险管理现状

企业风险管理是企业在追求企业未来发展战略目标的过程中,努力将各类不确定因素产生的结果控制在预期可按受的范围内的方法和过程,以确保实现组织整体利益的实现。中小企业风险管理现状存在以下几个特点:

1.企业管理者缺乏风险管理意识

目前我国中小企业大多是单一的产权结构,基本上实行家族所有、家族决策的经营管理模式,所有权与经营权高度统一,这导致很多高层管理者是家族企业的继承人,他们因具备血缘、亲缘关系的先天优势往往容易忽视自身能力的提高,容易导致处理、收集市场信息的意识不够,再加上我国中小企业先天不足、底蕴浅薄,使得很多中高层管理者缺乏市场判断、风险管理的意识。可以说,中小企业管理者的风险意识淡薄是造成面对风险时手足无措的原因之一。

2.风险管理机制尚不完善

最高管理者与中层管理者之间可能由于存在一定的血缘、亲缘、地缘等关系使得他们碍于情面,不建立企业风险管理机制,即便建立了企业风险管理机制也只是一纸空文,不付诸实践。这样的风险管理机制只是暂时的、被动的、阶段性的,对企业提高抗风险能力的作用是微乎其微的。

3.各项风险管理技术方法运用能力差

中小企业风险管理能力的提高除了树立风险意识、建立相应的风险管理机制以外,掌握相关的技术方法也是极为关键的。中小企业受到自身经济实力、管理理念的限制,往往不能通过购买风险管理的软件、咨询相关的风险管理专家来提高自身的风险管理水平。此外中小企业由于缺乏高端的管理人才也无法建立相关的风险管理模型来有效识别、管理、控制风险。

二、决策树法

决策树法是企业常用的定量风险分析决策方法,其结构简单、学习成本低、可解释性强,能够为中小企业进行风险决策提供有效的技术支持。

1.决策树法的概念

决策树是在已知各种情况发生概率的基础上,通过构成决策树来计算损益值,评价项目风险、判断项目可行、获得满意方案的风险决策方法。

在企业管理中,企业内、外部大部分条件是知道的、但还存在无法预知无法控制的一些不确定因素,所以管理者的方案会出现好几种不同的结果,并且可以根据以往的资料来推算各种结果出现的概率。决策树法就是利用了概率论的原理,借助树状图,按照客观规律的大小,计算出各个方案的期望值,进行比较选择一个满意的方案。

2.目前国内外关于决策树的研究现状

目前,决策树作为最广泛的归纳推理算法之一,在国内外众多领域得到广泛的关注与应用,主要包括企业风险决策与数据挖掘系统。决策树成熟算法目前有有iD3、C4.5、CHaiD、CaRt等。为了解决采用后剪枝技术容易出现的过拟合现象,一种全新的组合方法被提了出来――随机森林,其极大地提高了算法的泛化能力。

3.决策树法的应用条件

使用决策树法进行风险决策时应具备以下条件:企业管理者的目标明确且清晰;有多个可能出现的情况;每种情况都有企业管理者无法预测无法控制无法避免的不确定因素;决策者能够估计每种情况出现的概率;每种情况的期望值能够计算。

4.决策树的组成

一颗完整的决策树是由以下四个要素构成的:决策结点、方案枝、状态结果、概率枝。

5.决策树建立的步骤

一是决策树的绘制:绘制决策树图形,按照训练样本数据集从左到右依次递归展开。

二是决策树的修剪:对生成的决策树进行检验、校正和修正的过程。主要是用测试数据集中的数据校验决策树生成过程中产生的初步规则,将那些影响预测准确性的分枝剪除。

三、决策树法在目前企业风险管理中的应用

目前,中小企业自身基础薄弱、生命周期普遍较短,那么如何才能实现中小企业持续不断地发展呢?管理学者认为,中小企业作为抗风险能力较差的群体,在市场瞬息万变的今天,只有持续提高其风险管理能力、提高对外部环境变化的反映能力、促进管理效率的提高才能在市场上站稳脚跟,扩大市场前景,实现源源不断得盈利目标。而决策树法作为科学的风险型决策分析方法,具有学习成本低、可解释性强、科学性高等特点,可为广大中小进行企业风险管理提供技术支持。

1.企业运用决策树法的优点

决策树法能够为中小企业的管理人员和决策分析人员提供科学的决策支持,提高风险管理能力,实施风险控制。它具有下列优点:①它是一个简单清晰、容易理解的决策过程,能直观的显示整个决策问题在时间和决策顺序上不同阶段的决策过程。②决策树法用树形结构图的形式展现决策树,往往向人们展示的是各因素的交互作用,有利于中小企业周密全面的思考。③计算量相对较小,便于操作,学习成本低,中小企业企业管理人员容易掌握。④面对比较复杂的问题,决策树能够方便地表达各阶段决策与整体决策的前后关联与相互影响,利于管理者逐级思考。

2.决策树在企业风险管理的具体应用

一是决策树法在企业投标中的应用。

决策树法作为成熟的定量分析方法,简单可行,易于操作,增加了招投标决策工作的科学性。目前常见于建筑市场的铁路施工项目、工程投标报价项目等投标项目决策过程。常见的投标决策目标有两个,一个为谋求最大的经济效益,一个是谋求最低的费用、支出、或损失。若投标决策目标为最大值,则选择最大期望值的方案,若投标决策目标为最小费用、支出、损失时,应选择期望最小值对应的方案。中小企业通过将竞争对手在内的外部环境、本身的经营管理情况、施工过程中各种风险因素的估计、实现预期利润的可能性等因素建立到决策树中,使投标决策有理有据,增加决策的科学性以此控制可能的风险。

二是决策树法在中小企业信用风险控制中的应用。

对于小型商业银行、小型金融机构而言,如何辨别所面临的信用风险成为做出理想决策的关键因素。传统的信用风险管理方法主要包括引进专家系统、保险转移风险、客户对象多样化、信用评分方法来分散和降低风险、出售信用风险资产。目前除了这些传统方法,最常用的是现代风险度量模型。决策树作为常用数据分类方法之一,已经广泛被用于现代信用模型。通过对决策树的数据挖掘技术的应用,能够较为科学的评估客户的信用等级做出科学的借款决策,减少借款人发生违约的可能性,避免承担财务上的损失。

三是决策树在企业营销中的应用。

决策树已经被深入发展为数据挖掘技术,现已被广泛用到营销销售领域,多用于对企业客户的细分、新客户类型的预测、挖掘企业潜在客户、数据库营销等等领域。目前汽车行业、快消品行业、通讯行业等已经广泛应用决策树的数据挖掘技术。数据挖掘技术中决策树算法能够较为准确的分析客户需求、提高用户满意度、制定有效的营销策略以此较少企业营销决策的失误,避免人力、物力、财力的浪费,减少财务损失的风险。

四是决策树在企业投资决策中的应用。

中小企业的投资决策无法避免市场层出不穷的风险,而一旦决策失误则会给企业带来巨大的失误,后果是无法估量的。因此投资决策的方案选择、风险管理与规避直接决定企业投资的成败进而决定企业战略的成败。决策树分析是目前企业决策分析中经常采用的一种方法,根据一批已知的训练数据建立一颗决策树,对数据进行预测,通过判断各种投资方案出现的概率及最终期望值确定投资问题的决策方案,这将帮助企业在投资中减少风险避免损失,争取获得最大的经济效果。

四、中小企业运用决策树法实施风险管理的对策分析

中小企业在管理能力、经营规模、经济实力、等方面略显不足,都处于明显的劣势,这也使得中小企业抵抗市场风险的能力较弱,一旦面临大的风险,容易陷入经营困境,甚至会导致资不抵债、库存严重积压、破产倒闭等后果。因此中小企业的风险后果相当严重。为了保证企业中小经济活动的连续性、稳定性、高效性和安全性,企业必须正确选择管理决策方法,尽量规避风险,建立起完善、有效的企业风险管理机制。

1.要树立风险意识

风险是无处不在的,既包括自然风险、市场风险、社会风险等外部风险,也包括市财务风险、经营风险等内部风险。中小企业由于其自身弱小性,因此要将风险管理提升到战略管理的高度,树立较强的风险意识,并将风险意识贯穿企业生产经营的始终,提高对风险的预测、分析能力把握机会,规避风险,切不可风险来临之际才意识到风险管理的重要性。

2.提高管理层的科学决策能力

能否成功得实施企业风险管理,与企业本身管理层的管理决策能力密切相关。因此提高管理层的科学决策能力显得尤为重要,这就要求管理层掌握与运用一些基本的科学决策的方法,包括决策树等定量分析方法,管理层也应掌握一些基本的数据分析工具,比如matlab,Spss等。这就要求企业对管理层加强培训、提高其科学决策的能力。

3.要注重市场调查,降低决策风险

运用决策树法等科学决策方法计算概率、期望值时,数据是必不可少的。企业在面对风险决策时,要开展科学的市场调查,运用多种渠道来源获取市场信息、消费者信息、竞争对手信息等外部信息。在平时的生产经营过程中,注意内部数据资料的积累,建立本企业专有的数据资料,为以后的科w决策做好准备。

4.定性分析与定量分析方法相结合

各种各样的风险时常出现在中小企业经营管理的过程中,其带来的后果与损失也是中小企业难以承担的,而我国中小企业抗风险能力有限,这就要求中小企业管理者在做好组织结构建设、加强内部控制等定性决策方法来规避风险的同时,应充分运用定量科学决策技术的手段,如决策树法等定量风险分析方法。充分利用决策树在决策时具有层次清晰、简单明了、生动形象的特点,为管理者在进行风险决策时提供一种简便、快捷、有效的决策方法。

管理学决策树法篇2

【关键词】数据挖掘 ;决策树算法 ;员工离职

一、数据挖掘理论及其常用技术

数据挖掘是一种有效地利用信息的工具,它主要是基于数据库理论、机器学习、统计学、人工智能、可视化和并行计算等技术的理论基础,对各种原有数据进行组织、分析、归纳、整理,从中挖掘潜在的规则、模式,预测客户的行为,帮助组织者和决策者正确判断即将出现的机会,抓住机遇,调整策略,减少风险,进行正确的决策。

数据挖掘最常用的技术手段是决策树,决策树是对数据进行分类,以此达到预测的目的,该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决策结点代表一个问题或决策,通常对应于待分类对象的属性。每一个叶子结点代表一种可能的分类结果。沿决策树从上到下遍历的过程中,在每个结点都会遇到一个测试,对每个结点上问题的不同的测试输出导致不同的分支,最后会到达一个叶子结点,这个过程就是利用决策树进行分类的过程,利用若干个变量来判断所属的类别。

决策树算法主要是用来学习以离散型变量作为属性类型的学习方法,连续型变量必须被离散化才能被学习。

iD3算法决策树中最常见的分类算法,该算法是以信息论为基础,iD3算法中最主要的部分就是信息熵和信息增益的计算,以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类。

信息熵的计算公式为:,,其中p(ui)为ui在样本S中出现的概率。

信息增益的计算公式为: ; ; ; ; ; ; ; ; ; ;,其中a是样本的属性,Value(a)是属性a所有取值的集合,v是a得其中一个属性值。Sv是S中a的值为v的样例集合,|Sv|为Sv中所含样例数。

iD3算法大概的流程就是在属性集a中寻找信息增益值最大的属性,作为根节点,按照根节点属性的取值将样本集合分成几个子集,将此属性从属性集中去掉,在每个子集中选择信息增益值最大的属性,作为当前子集的根节点,上层集合的根节点的子节点,如此循环递归,如果得到的子集中所有的样本属于一个类别,则递归停止。

二、决策树算法在员工离职中的应用

(一)数据获取与归纳

从数据源中得到的历史数据存在着量大、属性繁多、定义复杂、不完整等特性。通过采用面向属性的归纳法进行数据归纳,对基础数据表中数据的各属性进行分析和泛化,找出与决策规则由关联的属性,构造出分类样本模型。该模型是一个有效的、通过压缩或泛化了的数据集合,此数据集合只与属性值有关系,而与原始的数据量无关,为更有效的产生决策树提供了极大的方便。

决策树算法不能处理连续型属性,必须将其进行离散化处理,如属性年龄,按照以往区分年龄的方法,将连续性数据划分为三个区间,即35岁以下、36至45岁、45岁以上。

归纳后的数据表

(二)构建分类模型

根据归纳后的数据表作为模型创建输入训练集,该训练集描述员工的属性有四个:职称、性别、学历、年龄。员工分类分为正例和反例两类:离职员工(p)和非离职员工(n)。

具体计算过程如下:

1.计算给定样本的信息熵

初始时刻属于p类和n类的实例个数都为122个,根据决策树中计算信息熵公式,得到给定样本的信息熵是:

2.计算每个属性的信息增益

在这个例子中,第一次分裂存在四种可能,分别计算每个属性的熵值,与给定的样本信息熵做比较,确定根节点。

四种属性的名称、类型以及正反例

照同样算法分别计算选取职称、性别、学历和年龄作为分类属性,计算信息熵,得出:e(职称)=0.92884;e(性别)=0.98369;e(学历)=0.90961;e(年龄)=0.99606。

3.计算信息增益

Gain(职称)=1-0.92884=0.07116

Gain(性别)=1-0.98369=0.01631

Gain(学历)=1-0.90961=0.09039(最大)

Gain(年龄)=1-0.99606=0.00394

从中可以看出属性学历的信息增益最大,也就是说属性学历提供的信息量最大,对于分类帮助最大,故选其作为根节点。

4.建立决策树的根枝和分支

选择属性学历作为根节点,并引出三个分枝,此时,将训练实例集分为三个子集,生成包含三个叶结点的决策树。

继续将叶结点的数据按照学历分别分类,选取职称、性别、年龄作为分裂属性,计算信息熵和信息增益,确定结点1、2、3的属性。

以此类推,继续对所产生的所有结点进行分类,直到产生整棵决策树。

三、研究分析结论

从构建的局部决策树能够分析出:(1)数据挖掘技术能够从系统的数据中提取员工的特征信息,并发现其中的联系和模式,从而客观的反映员工离职的因素,对于此案例研究过程中笔者发现员工离职分析的四个关键因素中学历是最为关键的影响因素,其次是职称和年龄,性别因素与分类目标的关联性比较弱,影响度最小,这与该单位属科研性质有关,专业技术职务通道为主要职业发展通道,近年招聘的毕业生又多为高学历,而且与拥有学位授予权有关;(2)数据挖掘技术能够比较客观的对员工离职进行评估,并根据特征分类,找到了一条最具代表性的数据路径,也最能体现出目前员工流失的分类倾向,具备本科学历、高级职称、介于35到45岁之间的员工离职的风险较大,原因是此类员工个人事业发展已到一定高度,未来前景不明朗,外界的工作环境和物质条件又相对较高,此类员工波动性较大;(3)数据挖掘技术能够弥补以往定性分析不足的特性,将定性和定量相结合,以往对离职的原因都是通过离职员工定性的分析得出结论,而通过建立的员工离职模型,可以通过数据真实的定量反映离职趋势,而不去了解真实的原因,为今后政策的制订提供定量数据依据;(4)数据挖掘技术能够帮助人力资源管理者改进工作目标和方式,通过调查和座谈方式,了解离职风险大的员工的真实思想和客观因素,通过制定政策、采取激励机制留住人才,建立合理的薪酬结构,提供有竞争力的薪酬水平,重视人本管理,给员工的发展提供更多的机会。

至此,运用决策树对员工离职这一管理问题所进行的挖掘工作已基本完成,利用数据库中的数据,通过对员工职称、性别、学历、年龄等因素的分析,经过数据选取、数据归纳、数据转化等过程,运用决策树中的iD3算法建立员工分类模型,提出分类规则,发现离职员工的主要特性,为今后利用现有模型对在职员工数据进行分析预测,挖掘出其中潜在的离职员工,也为今后对此类人员在政策的制订上提供参考。从以上分析来看,决策树的结果客观的反映了实际情况,这也说明数据挖掘技术是一个强有力的辅助决策工具。

参考文献:

[1]中国就业培训技术指导中心.企业高级人力资源管理师.中国劳动社会保障出版社,2009.

管理学决策树法篇3

关键词:数据挖掘技术,iD3决策树算法,学生成绩

 

1.引言

当前,职业技术教育随着社会发展和科技进步,其办学软硬件层次正逐步“升级”,办学规模和社会影响力也成倍增长。在学校管理工作中,特别是对学生的成绩管理工作中,普遍存在的问题是学生成绩数据量过于庞大,但对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段,并没有对大量的成绩数据进行深入地分析,加以捕捉有利于教学管理工作的信息,这是对教学信息资源极大的浪费。数据挖掘技术正是解决这个问题的可行而有效的方法。本文使用iD3决策树算法生成决策树分析学生成绩优良与哪些因素有关,并利用事后修剪法对决策树进行修剪,最后由决策树产生分类规则。

2.数据挖掘的方法和技术

数据挖掘方法是由人工智能、机器学习的方法发展而来,结合传统的统计分析方法、模糊数学方法及科学计算可视化技术,以数据库为研究对象,形成了数据挖掘的方法和技术。可分为以下六大类:归纳学习法、仿生物技术、公式发现、统计分析方法、模糊数学方法、可视化技术。

信息论方法(决策树方法)是归纳学习法中的一类。信息论方法是利用信息论的原理建立决策树。在知识工程领域,决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。由于分类规则是比较直观,易于理解,该类方法的实用效果好,影响较大。由于该方法最后获得知识表示形式是决策树,故一般称它为决策树方法。这种方法一般用于分类任务中。

决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树是以实例为基础的归纳学习算法。从一组无次序、无规则的元组中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较,并根据不同的属性值从该节点向下分支,叶节点是要学习划分的类。从根节点到叶节点的一条路径就对应着一条分类规则,整个决策树就对应着一组析取表达式规则。

信息论方法中较有特色的方法有:iD3,iBLe方法。目前己形成了多种决策树算法,如CLS、iD3、CHaiD、CaRt、FaCt、C4.5、Gini,See5、SLiQ、SpRint等。其中最著名的算法是Quinlan提出的iD3算法。

2.决策树的生成

决策树的生成分为学习及测试两个阶段。决策树学习阶段采用自顶向下的递归方式。决策树算法分成两个步骤:一是树的生成,开始时所有数据都在根节点,然后递归地进行数据划分,直至生成叶节点。二是树的修剪,就是去掉一些可能是噪音或者异常的数据。决策树停止分割的条件有:一个节点上的数据都是属于同一个类别;没有属性可以再用于对数据进行分割。

建立一颗决策树可能只要对数据库进行几遍扫描之后就能完成,这也意味着需要的计算资源较少,而且可以很容易的处理包含很多预测变量的情况,因此决策树模型可以建立得很快,并适合应用到大量的数据上。

3.iD3算法

决策树归纳的基本算法是贪心算法,它以自顶向下递归的方法构造决策树。著名的决策树归纳算法iD3算法的基本策略如下:

树以代表训练样本的单个节点开始。

如果样本都在同一个类中,则这个节点成为树叶节点,并用该类标记。

否则,算法使用称为信息增益的基于熵的度量作为启发信息,选择能够最好的将样本分类的属性,该属性成为该节点的“测试”或“判定”属性。在这里,我们假设所有的属性都是分类的,即取离散值。连续值的属性必须离散化。

对测试属性的每个已知的值创建一个分支,并据此划分样本。

算法使用类似的方法,递归地形成每个划分上的样本决策树。一旦一个属性出现在一个节点上,就不必在该节点的后代上考虑这个属性。

整个递归过程在下列条件之一成立时停止:

(1)给定节点的所有样本属于同一类。

(2)没有剩余属性可以用来进一步划分样本,这时候将该节点作为树叶,并用剩余样本中所出现最多的类型作为叶子节点的类型。

(3)某一分枝没有样本,在这种情况下,以训练样本集中占多数的类创建一个树叶。

但是,iD3算法也存在着如下不足:

(1)不能够处理连续值属性,iD3算法最初定义时是假设所有属性值是离散的,但在现实环境中,很多属性值是连续的。

(2)计算信息增益时偏向于选择取值较多的属性,这样不太合理。

(3)对噪声较为敏感,所谓噪声是指训练集中属性值或类别给错的数据。

(4)在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。

(5)只适合于能够驻留于内存的数据集使用,当训练集大得无法在内存容纳时程序无法运行。

4.树的剪枝

当决策树创建时,由于数据中的噪声和孤立点,许多分枝反映的是训练中的异常。剪枝方法处理这种过分适应数据问题。通常,这种方法使用统计度量,剪去最不可靠分枝,这可带来较快的分类,提高决策树独立于测试数据正确分类的能力。有两种常用的剪枝方法:

先剪枝方法(prepruning),通过提前停止树的构造而对树剪枝。一旦停止,节点成为树叶。该树叶持有子集样本中出现最频繁的类。在构造树时,如统计意义下的χ2、信息增益等度量,可以用于评估分裂的优良性。如果在一个节点划分样本将导致低于预定义阈值的分裂,则给定子集的进一步划分将停止。然而,选择一个适当的阈值是困难的。较高的阈值可能导致过分简化的树,而较低的阈值可能使得树的简化太少。

后剪枝方法(postpruning),它由完全生长的树剪去分枝。通过删除节点的分枝,剪掉树节点,代价复杂性剪枝算法是后剪枝算法的一个实例。在该算法中,最下面的未被剪枝的节点成为树叶,并用它先前的分枝中最频繁的类进行标记。对于树中每一个非树叶节点,算法计算该节点上的子树被剪枝后可能出现的期望错误率。然后,使用每个分枝的错误率,结合沿每个分枝观察的权重评估,计算不对该节点剪枝的期望错误率。如果剪去该节点,导致较高的期望错误率,则保留该子树;否则剪去该子树。产生一组逐渐被剪枝的树之后,使用一个独立的测试集评估每棵树的准确率,就能得到具有最小期望错误率的决策树。

也可以交叉使用先剪枝和后剪枝,形成组合式方法。后剪枝所需的计算比先剪枝多,但通常产生更可靠的树。

5.从决策树提取分类规则

从决策树提取分类规则时,规则使用if…then的形式表示出来,对从根到树叶的每一条路径创建一条规则,沿着路径上的每一个属性-值对,形成规则前件(“iF”部分)的一个合取项。叶节点包含类预测,形成规则后件(“tHen”部分)。if…then规则易于理解,特别是当给定的树很大时。而且便于规则匹配等操作。

6.结论

数据挖掘虽然还是一门新兴的数据分析技术,但已经具有了强大的生命力,其研究取得了令人瞩目的成就,己经成功地应用到了许多领域。可以说,有数据积累的地方,就有数据挖掘技术的用武之地,这是因为它直接与经济和决策紧密相连。

管理学决策树法篇4

ス丶词:机载多传感器;模糊决策树;目标类型;智能管理;动态决策

ブ型挤掷嗪:tp18文献标志码:a

abstract:inviewofthedifficultyinthemanagementofairbornemultisensor,afuzzydecisiontreealgorithmwasappliedtomultisensorintelligentmanagement.operationalphaseofthemethodwascombinedwiththetargettypetobuilddifferenttargetpropertiesandestablishfuzzydecisiontreemodelbasedontargettype.thus,amultisensorairbornedynamicmodelofintelligentmanagementwassetup,andaircombatsimulationwascarriedout.thesimulationresultsshowthatthemethodcancomposebattlefieldobjectivesandtacticseffectively,andcompleteairbornemultisensormanagementrapidly.andthemethodisreasonableandeffective.

Keywords:avionicssensorsystem;fuzzydecisiontree;targettype;intelligentmanagement;dynamicdecision

0引言

随着科技的进步,无人机在现代战争中执行的任务越来越复杂,发挥的作用越来越重要。不论执行的是侦察、打击或其他任务,无人机均需机载传感器设备,如雷达、光电等。任务执行过程中,不同机载传感器常需多次开启、关闭;不同任务执行阶段,传感器类型、工作用途的不同导致外界环境探测参数种类、精度等有较大区别,仅依靠地面控制人员对机载多传感器调度管理很难适应复杂突变的战场态势要求。针对具体作战任务,结合作战阶段,辅助地面控制人员实时应变,降低人为误操作概率,合理充分利用传感器资源,提高数据融合精度,建立一套智能化机载多传感器管理系统成为目前无人机航电系统亟待解决的关键问题。目前传感器管理是国内外研究的热点[1],主要方法有线性规划[2]、动态规划[3-4]、神经网络、信息论[5-6]、智能推理[7]等,多集中在传感器信息融合、资源分配上面[8-11],而机载多传感器动态类型管理方面的研究并不多,本文采用模糊决策树的方法对此展开研究。

1基于模糊决策树的多传感器管理方法

1.1模糊决策树的学习

模糊iD3算法[12-13]将模糊理论引入iD3算法中,以提高决策树处理数值属性和不确定性问题的能力。设数据集D={e1,e2,…,en}是离散值论域X上的实例集合,模糊属性集为{a1,a2,…,am},属性ai的术语为t(ai)={Fi1,Fi2,…,Fiki},1≤i≤m,划分类为C={C1,C2,…,CK}。第i个实例ei对于第j个属性的隶属度为μij,表示定义在t(ai)上的模糊子集。设DCK为类CK的数据子集,|D|为D中所有隶属度总和。オ

1.1.1影响机载多传感器管理的属性

面对不同执行任务、不同作战阶段,无人机所针对的打击目标类型不尽相同,П疚慕目标类型划分为导弹m、空中目标p和地面目标t三种类型,分别建立模糊决策树。对于空中及地面目标,选取模糊属性集为a={a1,a2,a3,a4,a5,a6},具体见表1。オ

Ф杂诘嫉,选取模糊属性集为a={a1,a2},具体见表2。オ

Ы机载传感器划分为C={C1,C2,C3,C4}={激光,紫外,红外,雷达}四类。オ

1.1.2属性数据模糊化

Р捎檬(1)~(3)处理属性数据,每个属性值x(ai)属于第j(0

ti1=

1,x≥a1

x-a2a1-a2,a2

0,x≤a2(1)

tij=

0,x≥aj+1

aj+1-xaj+1-aj,aj≤x

x-aj-1aj-aj-1,aj-1≤x

0,x≤aj-1(2)

tiki=

1,x≤aki

x-aki-1aki-aki-1,aki-1

0,x≥aki-1(3)

式中ai1,ai2,…,aiki表示三角模糊数中心。オ

1.1.3建树过程

步骤1建立根节点。е檬据集D={e1,e2,…,en}为根节点。オ

步骤2生成叶节点。若pk>θ,或D

步骤3扩展属性选择。若当前节点不满足叶节点生成条件,则为非终端节点,扩展属性选择过程如下:

1)Ъ扑愀魇粜孕畔⒃鲆G(ai,D),选择信息增益最大属性a┆max作为当前节点测试属性;オ

G(ai,D)=i(D)-e(ai,D)(4)

式中,

i(D)=-∑nk=1pk•lbpk(5)

e(ai,D)=∑kij=1(pij•i(DFij))(6)

pij=DFij∑mj=1DFij(7)

2)ЫD按a┆max的模糊属性值分割,得到新模糊子集D1,D2,…,Dm,产生新节点t1,t2,…,tm;オ

3)б来斡D1,D2,…,Dm代替D,跳到步骤2;オ

4)选择信息增益最大的属性作为测试属性,划分数据集,生成模糊决策树。

1.2模糊决策树推理

设生成机载多传感器管理模糊决策树如图1所示,将其作为推理规则。

目标数据以相应测试属性的各分支信任度沿着多个分支向下进行搜索,最终到达多个叶节点,从而可计算各个类型传感器的信任度。具体计算步骤如下。

步骤1计算路径信任度。

以最小值算子计算路径信任度。如图1最左边路径,вa1a11(μa11),a2a21(μa21),a4a41(μa41),则a1a2a4D路径信任度为:min(μa11,μa21,μa41)。オ

步骤2计算各传感器类型信任度。

以乘积算子计算所有叶节点上各传感器类型信任度,如图1最左侧叶节点,D=c1的信任度为:min(μa11,μa21,│酞a41)×μc1a41;合并所有叶节点上相同模式的信任度,以最大值算子计算,如各叶节点D=c1的信任度为オ

B={μc1a41,μc1a42,μc1a22,μc1a12,μc1a31,μc1a32}オ

Ш喜⒑D=c1的信任度为オ

Е酞D=c1=max(B)(8)

归一化后的传感器类型信任度为

ИD=mi=μD=ci∑4j=1μD=cj(9)

式(9)中,cj代表第j种传感器类型。将各传感器类型信任度作为推理结果,选取信任度最大的传感器类型作为机载多传感器智能管理的结果。オ

2仿真结果及分析

调研领域专家知识,整合出30组典型数据样本。采用式(1)~(3)对数据样本模糊化,应用模糊iD3算法进行决策树学习,构造基于不同目标类型的模糊决策树如图2所示。

为了检验模型的有效性,需对其进行检验。采用人为操控的战例,即对比人为操控作战下的传感器管理与采用模糊决策树生成传感器管理状态,提取11组传感器变化选择时刻,可以看到验证结果如表3所示。

П3中,Ss表示原始样本中传感器开关次数,ns表示模糊决策树判定传感器开关次数,表示平均正确决策间隔时间,t=|模糊决策树正确决策时刻-原始样本传感器开关时刻|,pr表示准确率。由表中结果看到,平均正确决策间隔时间最大为0.698B1s,平均正确率为90.9%,吻合程度较高,采用该模糊决策树进行空战想定研究。オ

假设我方无人机空速150@m/s,航向正北,打击敌地面目标。初始敌我距离200@km,飞行攻击过程如下:起飞敌方探测敌方拦截敌我空战对地投弹返航。根据图2的模糊决策树作为推理规则,计算各传感器类型信任度,采用信任度最大的传感器类型作为主通道传感器,仿真结果如图3所示。

图3中“*”表示传感器智能管理决策后的变化拐点。从图3(a)可看到,随着敌我距离的接近,首先采用红外传感器作为主通道传感器,无源探测目标,随着双方距离接近,由于火控攻击解算需求,开启机载雷达,发射导弹完成攻击后,关闭雷达,主通道选择恢复为红外传感器,随着敌机的接近,再次开启雷达进行攻击。由图3(b)可以看到,采用红外传感器无源探测目标,在接近地面目标后,通过开启激光测距仪精确测量敌我距离,完成地面打击。由图3(c)可以看到,随着导弹与载机相对距离的接近,采用红外对导弹告警,侦察导弹动向,随着弹目距离缩小,紫外告警设备随后作为主通道传感器,对导弹进一步告警。这与本文作战任务想定吻合。由此可见,整个仿真过程中,多传感器决策结果与作战过程实时相关,动态选择合理传感器,符合空战机载多传感器智能管理要求。

3结语

为了辅助地面控制人员面对复杂战场态势对机载多传感器有效管理,选择合理传感器,降低人为误操作概率,本文提出了一种基于模糊决策树的机载多传感器智能管理方法,该方法针对空中目标、地面目标及导弹等不同目标类型,建立了三种基于目标类型的模糊决策树模型,计算类型信任度,产生推理结果。建立了基于模糊决策树的多传感器智能管理模型,进行了空战想定下的仿真研究。仿真结果表明,机载传感器类型信任度的取值变化与仿真初始作战任务想定相吻合,针对任务执行的不同阶段,不同作战目标,动态自主地选择合理机载传感器,有效实现了多传感器统一调度管理。

げ慰嘉南:

[1]王谦,周德云,杜昌平.机载传感器智能管理方法的研究[J].火力与指挥控制,2009,34(10):117-120.

[2]郝永飞,林都,曾建平.结合浪费函数的多传感器管理算法[J].中北大学学报,2005,26(5):345-347.

[3]anDeRSonJ,HonGL.Sensorresourcemanagementdrivenbythreatprojectionandpriorities[J].informationSciences,2008,178(8):2007-2021.

[4]SUHintHanm,SamanK,maLinp.Sensorschedulingfortargettrackingbysuboptimalalgorithms[J].ieeetransactionsonVehiculartechnology,2009,58(3):1467-1479.

[5]XionGn,SVenSSonp.multisensormanagementforinformationfusion:issuesandapproaches[J].informationFusion,2002,3(2):163-186.

[6]胡仁伟,廖东平,魏玺章.基于分辨力的融合目标识别系统中的传感器管理方法研究[J].电光与控制,2007,14(3):1-4.

[7]路志伟,李明,季晓光.机载多传感器管理专家系统设计方法探索[J].电光与控制,2007,14(5):9-13.

[8]赵福昌,王睿,张纳温,等.基于粗糙熵和目标威胁等级的多传感器管理方法[J].空军工程大学学报,2009,10(6):28-31.

[9]段汝娇,黄鹏,秦宁宁,等.基于改进pSo算法的多传感器管理方法[J].计算机仿真,2009,26(4):237-239.

[10]刘先省,周林,杜晓玉.基于目标权重和信息增量的传感器管理方法[J].电子学报,2005,33(9):1683-1687.

[11]wanGGUoHonG,HeYoU,YanGZHi,etal.adaptivesensormanagementinmultisensordatafusionsystem[J].ChineseJournalofelectronics,1999,8(2):136-139.

[12]YUanYUFei,SHawmJ.inductionoffuzzydecisiontrees[J].FuzzySetsandSystems,1995,69(2):125-139.

[13]JaniKowCZ.Fuzzydecisiontrees:issuesandmethods[J].ieeetransactionsonSystems,manandCybernetics,1998,28(1):1-13.

管理学决策树法篇5

[关键词]决策树;投诉;流失度;移动通信;客户

doi:10.3969/j.issn.1673-0194.2016.22.044

[中图分类号]F224[文献标识码]a[文章编号]1673-0194(2016)22-00-02

0引言

移动通信客户的流失分析一直是企业关注的热点问题,如何做到提升客户满意度,防止客户流失,加强客户分类管理,吸引潜在客户群体,提高运营商服务质量,是提升企业核心竞争力的关键所在。本文使用决策树算法,对某企业投诉数据进行分析,目的是发现流失客户的共同属性,做好客户关系管理工作。

1决策树算法

决策树算法最早是由J.R.Quinlan提出的iD3方法,其建树算法具有思想简单、识别样本属性效率高的优点,iD3方法成为20世纪80年代末机器学习领域当中最有影响力的算法之一。在20世纪90年代的时候,J.R.Quinlan提出iD3改进版,即C4.5方法。C4.5方法是用信息论中互信息率来选择属性作为决策树的结点,使决策树识别样本的效率得到了不小的提升。C5.0算法是C4.5的升级版,多数用在商业领域数据挖掘技术当中。主要针对大数据的分类,它的决策树归纳与C4.5很相近。

iD3算法的流程是对训练集样本的数据进行预处理,计算出训练集样本属性划分前的熵;然后计算出训练集样本属性划分后的熵,通过比较样本属性划分前后的熵,计算出前后熵的差值;取最大差值的行列进行合理划分,划分出来后数据集所有元素标签确立唯一性,有且只有一个属性;若无法确定唯一属性,则回到第一步,重新比较分析,直到建树成功,整个建树过程结束。

2决策树算法在移动通信客户流失分析中的应用

2.1实验数据集

本次实验过程使用的数据集有2711个样本,有投诉内容、故障行政区、使用网络类型、责任原因、终端描述、客户品牌和客户流失度7个属性,见表1。

2.2实验过程

选取某移动通信公司的客户投诉数据,将excel表格导入SppS-Clementine软件当中,首先选择“源”下方“excel”确保数据导入软件当中;选择“字段选项”下方“类型”确定模型的类型,最后选择“建模”下方的“C5.0”算法。数据流如图1所示。

模型对训练集选取样本50%、75%、100%的数据,对客户流失分析的准确度分别为97.88%、98.12%、98.01%,如图2所示。

2.3结果分析与讨论

利用SppS-Clementine软件中的C5.0算法,对移动通信客户的流失行为进行分析,分别选取样本的50%、75%、100%数据集进行分析,准确度依次为97.88%、98.12%、98.01%。从实验结果可以看出,选取75%样本的准确度较精确,但是所有的取样精确度之间数据相差不大。从图2可以看出,决策树算法在移动通信客户流失分析中的应用是可行的和有效的,为移动通信公司进行客户流失分析提供了一种分析的思路和解决方法。

3结语

本文通过对某通信公司投诉数据流失度分析表明,C5.0算法表现出更良好的适应性,对用户流失度分析更精确、更高效、更方便。

主要参考文献

[1]刘尧坤.顾客投诉管理与处置技巧[m].广州:广东经济出版社,2005.

[2]徐远纯,盛昭瀚,柳炳祥.一种基于决策树算法的客户流失危机分析方法[J].计算机与现代化,2004(8).

[3]赵小宁,李凤霞.因子分析法和聚类分析法在网上银行客户满意度研究中的应用[J].时代金融,2015(3).

管理学决策树法篇6

关键词:物流投标风险分析决策树分析法加权平均法

中图分类号:F272.5文献标识码:a

文章编号:1004-4914(2016)08-042-03

前言

当前,我国关于物流投标决策风险管理理论方面的研究还比较滞后,很多企业存在着缺乏物流管理人才、物流决策风险管理意识不强、物流投标决策往往处于被动的局面,以及缺少资金、风险管理技术等问题。同时,一些企业还存在着缺乏物流投标决策风险策略,没有积极的投标风险管理机制等问题,导致无法有效地防范重大物流项目投标风险。因而难以控制风险和把握事后的转危为机的最佳时机。基于上述问题,笔者研究了物流项目投标风险的相关内容,对物流投标风险的相关基本理论进行阐述,并依据风险及风险管理的理论,对物流投标中可能发生的风险做了分析,以期为相关企业有效地防范风险起到一定的作用。这是本文之所以研究物流信用风险管理的原因。

一、本文的相关理论概述

(一)物流投标决策的理论概述

1.物流项目运作的模式(见图1)。物流项目运作的模式有中介咨询公司发起、客户发起、物流供应商发这三种。

2.图2是公开招标下的物流项目投标工作的一般程序与内容。

(二)风险三要素

风险是风险因素、风险事故和损失三要素的结合体,三者之间的关系如图3。

(三)风险的分类

风险的分类方法比较多,可以根据不同的领域和范畴采取不同的划分标准,进行区分。主要有以下几种(见图4)。

二、物流项目投标决策风险分析

(一)物流项目投标决策风险的阶段划分

1.投标决策的前期阶段。前期阶段必须对是否投标做出论证,并且需要在购买投标人资格相关资料之前完成。进行投标决策的依据主要是招标公告抑或是对招标单位的具体信息掌握的程度以及所开展的调研情况。

2.投标决策的后期阶段,一但决定参加投标,就要“箭在弦上”,全力以赴进入投标决策的后期阶段,从申请资格预审――投标报价等各个环节,都要举一反三,进行细化,研究各种相关问题,特别是对所要采取的策略、方案、技巧等问题,要做到胸有成竹,“知己知彼”方能“百战百胜”。

(二)物流项目决策的主客观影响因素

主观因素主要指技术方面的实力及企业经济方面的实力和物流企业信誉和管理方面的实力。客观因素主要是指物流项目的风险分析和物流供应商要和项目纲领一致以及对供应商的绩效考核。

(三)物流项目投标决策的分析方法

投标决策方法很多限于篇幅本论文仅对加权评分法和决策树法予以简要介绍。

1.加权评分法。案例分析:某物流招标项目评价因素、加权数、专家打分等如表所示,假设物流供应商根据经验统计确定可投标的最低总分为650分,由于各项因素加权总分为745分超过可投标的最低分,故物流供应商可以参加该物流项目的投标。

分析步骤如下:(1)选择出评价因素、加权数和可以投标的最低总分;(2)根据具体物流项目评定各项因素的得分;(3)将各项因素加权总分与可投标的最低总分比较,据以作为投标决策的依据。

2.决策树法。本文通过案例来展示该方法的应用价值。案例分析:某物流公司,由于公司的各方面原因,只能在某甲抑或是某乙中进行二选一。根据以往的经验,选择高标的中标率为0.3,而选择低标率的中标率为0.5。采取如表2所示的方案,如果不能中标将会损失5万元。因此,采取决策树的方法进行选择投标对象与最好的投标方案,见图5。

决策树法的基本步骤如下:

(1)制决策树。本例两个物流项目选择都存在投高标和投低标,加上不参加投标共有五个方案可供选择,故决策树如图5。

(2)计算期望利润值。

设a=估计成本,B=报价,p=中标概率,i=即期利润,e(i)=预期贡献,则它们之间的关系如下:i=B-a;e(i)=p×i=p×(B-a)

根据上述公式计算期望利润值。决策树计算时应由后向前推进,先计算节点(9)~(12)的期望利润值,然后再计算节点(5)~(8),具体见表3。

(3)分析比较各决策者的预期贡献,选择最优秀的方案。参加投标竞争的目的,就是要用最好的报价保证投标在竞争激烈的角逐中脱颖而出,一举夺标,同时还要能使自己企业的利润最大化。因此,选择投标项目的条件就是保证最大的预期贡献。

分析比较时应由后向前推,依次保留预期贡献最大的方案。此例中,决策点2比较高标和低标两种情况的预期贡献,可知高标情况下利润较高,故留此分支,舍弃低标分支,即,决策点2的预期贡献为50.4万元。同理决策点4的预期贡献为112.5万元。最后决策点1比较三个方案的预期贡献,可以确定投B项目的低标。因此,在a、B两个物流项目中,应选择B作为投标对象,其最佳报价方案应是投低标,可获得最大预期贡献为112.5万元。

通过以上案例的分析本论文认为决策树法进行物流项目的投标分析具有一定的积极意义。

三、物流项目投标报价风险分析

(一)物流项目投标报价应考虑的因素

当投标人在准备投标书时一定要谨慎定价,不能高估了申请项目的价格,否则客户将会选择其他定价低的投标人。因此,应考虑以下因素:一是招标人因素,了解招标人的预算和查明招标人确定的评标方法。二是竞争对手因素,和投标人因素主要包括投标人的目的和策略投标人的优势和劣势成本估算的可信度。

(二)物流项目投标报价的流程

报价是投标环节的重要工作,根据自身条件、招标者的要求、竞争对手以及市场的条件,确定最终的报价。报价的基本程序如图6。

(三)物流项目投标报价的战略规划

1.报价策略采用了不同报价法和不平衡报价法、区别报价法以及多方案报价法、增加建议方案报价法、突然降价、法低价投标夺标法、优惠取胜法、以人为本法、扩联合保标法。

2.投标技巧法:主要是指多方案报价与增加备选方案报价技巧法和用构成与盈利水平调整技巧,以及信誉制胜与优势制胜技巧法等。

四、物流项目投标过程风险分析

(一)风险概述

导致物流项目投标过程发生风险很多,笔者由于篇幅有限只是从类别来说明具体如下:

(1)公共关系风险;(2)工程量风险;(3)投标报价风险;(4)投标费用风险;(5)废标风险;(6)违规风险。

(二)物流项目投标过程风险决策分析

一是通过对招标形式的区分避免企业的经营风险;二是建立良好的合作关系;三是评估招标人的信誉;四是付款办法;五是加强合同管理;六是预留必要的风险费。

此外,还应重视以下几类条款:(1)程序性条款;(2)有关工程计量条款;(3)有关价款的条款;(4)双方职责条款;(5)索赔条款:(6)有关通用条款与专用条款。

结束语

本文通过物流项目投标风险基本理论进行阐述,阐明了物流项目投标的相关问题,同时建立了物流项目投标风险决策的分析方法,主要运用加权平均法和决策树法对物流项目决策过程中的风险进行具体分析,给物流项目的投标以科学的理论作保障。这样有利于决策者对评价结论的有效把握,对物流行业对项目进行投标分析具有一定的指导意义。

物流项目投标风险分析是物流行业运作中的重要环节,所以对物流项目投标风险研究具有一定的积极意义,对物流行业的发展的科学性将起到重要作用。

本文虽然对物流项目投标风险进行了论述,但在研究过程中还存在许多不足,需要在今后的研究中进一步学习、补充。同时,笔者殷切期望业内人士共同开展深入、细致的研究,为推动我国物流投标决策风险管理理论的发展以及广大物流企业规避经营风险做出自己的贡献。

参考文献:

[1]刘瀛寰(导师:孙家庆).内陆港选址风险评价模型研究.大连海事大学硕士论文,2010.6

[2]王永(导师:刘源张).中国航空运输企业战略风险识别与评价研究.上海大学博士论文,2011.6

[3]刘文清(导师:陈超).企业全面风险管理研究及在Z公司的实践.复旦大学硕士论文,2010.10

[4]李开宜,廖树中,罗林,覃家是.创新监督机制为企业持续健康快速发展保驾护航――广西鱼峰集团有限公司监督管理机制的探索与实践.大众科技,2010(8)

[5]孙家庆等.航运与物流市场营销.大连,大连海事大学出版社,2006

[6]孙家庆等.国际物流运作流程与单证实务.大连.大连海事大学出版社,2007

[7]孙家庆.国际物流操作风险防范――技巧・案例分析.北京.中国海关出版社,2009

[8]孙家庆.国际货运风险规避与案例分析.北京.中国科学出版社,2009

[9]靳涛.安全、健康和环境――基于风险的嵌入式HSe.管理系统探讨,2010(12)

[10]谢旭.客户管理与账款回收.北京,企业管理出版社,2001

[11]王伟,王铁铮.企业全面风险管理的研究.价值工程,2013(8)

管理学决策树法篇7

关键词:G4.5算法;Java;高等职业院校;学生成绩分析系统

中图分类号:tp311文献标识码:a文章编号:1009-3044(2011)14-3405-05

ResearchandanalysisonStudents'ScoresBasedonC4.5algorithm

HUanGHai-xia1,XUXiang-lin2

(1.academyofadulteducation,Guangzhouinstituteoftechnology,Guangzhou510075,China;2.informationCenter,Guangzhouinstituteoftechnology,Guangzhou510075,China)

abstract:thearticlemainlystudiesanewmethodtoanalyzestudents'scoresinHigherVocationalinstitute,withthehelpofC4.5decisiontreealgorithm.Servingasanillustration,adecisiontreemodelisbuiltuptoshowtheprocessoftheanalysis.anditisaC4.5analysissystemdevelopedbyJava,basedonthedatainstudentgradesystemofGuangzhouinstituteoftechnology,whichsuccessfullyhelpstosolveproblemsintheteachingprocess,toimprovetheteachingqualityandmanagerialeffectiveness,toboosttheall-arounddevelopmentofstudents,andtoenhanceHigherVocationalinstitute’sintegrativeeducationcapabilityandtheircorecompetitiveness.

Keywords:G4.5algorithm;Java;highervocationalinstitute;studentgradesystem

1高等职业院校学生成绩的研究现状

目前,高等职业院校在纷纷加大力度开展校园信息化建设过程中,其数字化管理系统中日益膨胀的信息资源为他们积累了非常宝贵的教学财富。广州工程技术职业学院与大多数高等职业院校一样,学生人数大幅度增长和教学管理模式的变化(如学分制的实行)等为学校的信息化管理系统积累了大量的信息资源,但是,如果管理者仅仅简单地查询与统计这些数据,而不充分地挖掘数据里面潜在的高价值数据,难以对学校教育做出更大的参考价值与应用价值。现在,数据仓库和数据挖掘作为新型的数据库管理技术,已经成功地应用于许多企业中,为提高企业管理效率和经济效益等方面取得了明显效果,将它们引入学生成绩管理系统的研究分析工作中,能够为师生们提供优质的教学服务,为各层级管理者提供科学的决策依据,才能为学校在激烈的竞争中赢得主动权。

2C4.5算法简介

数据挖掘是一个从大规模数据库的数据中抽取有效的、隐含的、未知的、有潜在使用价值的知识的过程,简单来说,数据挖掘就是从大量数据中提取或“挖掘"出知识。分类作为数据挖掘的方法之一,它根据带类标号的历史数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。最知名的分类算法是决策树方法,决策树是用于分类的一种树结构。决策树方法的起源是概念学习系统,发展到iD3方法为高潮,最后又演化为能处理连续属性的C4.5。本文设计并实现用C4.5分类算法来挖掘学生成绩,通过分类方法较全面地分析学生成绩与各种因素之间隐藏的内在联系,从大量数据中发现潜在规律,找出隐含的模式,准确掌握学生的学习动态,为教学工作提供更多有价值的信息。

J.RQuinlan在1993年提出了C4.5算法,他针对基于iD3算法利用信息增益作为分类评价函数来选取最优属性而导致容易倾向于选择取值较多的属性的缺陷,适当地修改了分类评价函数,用信息增益率(informationGainRatio)取代信息增益作为分类评价函数。其中,信息增益率定义为:

Gainratio(x)=(定义1)

其中,Splitinfo(x)=,它表示把t分成n部分而生成的潜在信息。

C4.5算法的主要思想为:假设t为训练集,为t构造决策树时,根据选择Gainratio(x)值最大的属性作为分裂节点,按照此标准将t分成n个子集。若第i个子集ti含有的元组的类别一致,该节点就成为决策树的叶子结点并停止分裂。而对于不满足此条件的t的其它子集,按照上述方法递归的生成树,直至所有子集所含元组都属于一个类别为止。算法描述为:

1)输入:R:候选属性的集合(可以是连续值的);C:分类属性;S:训练集。

2)输出:一棵决策树。

具体实现方法的流程图如图1所示。

3数据库挖掘的方法

数据挖掘可以通过令人感兴趣的模式来发现可以帮助人们的大量原始数据。模式定义如下:给定一个事实(数据)集F,一个语言L,以及一些可信度C的量度,一个模式S就是L中的一个陈述,S以可信度C来描述F的一个子集Fs中的关系,并使得S要易于对Fs中所有事实的简单枚举。对于应用来说,事实(数据)集F通常都是特别巨大的,而发现的结果只有在统计学的意义上是有效的,用户主要寻找有意义的相对数据部分成立的知识,而非一定要考虑所有的数据。由于令人感兴趣的模式因人而异,各取所需;在挖掘海量的数据量中,为了避免“人工智能”中的组合爆炸问题,大多数系统开发都有某种程度的用户参与,所以信息分析员也成为数据挖掘系统的重要组成部分。

管理学决策树法篇8

【关键词】企业客户关系管理;数据仓库;数据挖掘

随着数据库技术、网络技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大。然而,如何有效地使用这些数据却成为一个问题,因为往往是数据丰富而知识缺乏,人们目前所使用的数据库技术无法将隐藏在数据背后的重要信息挖掘出来利用,所以如何迅速、准确、有效且适量地提供用户所需的信息,发现信息之间潜在的联系,支持管理决策就是数据挖掘和数据仓库要解决的课题,同时也是客户关系管理系统产生的必要条件和最终目的。

一、数据仓库与数据挖掘技术分析

1.1数据仓库

数据仓库是一个在企业管理和决策中面向主题的(Subject- oriented)、集成的(integrated)、反映历史变化的(timeVariant)、相对稳定(non-Volatile)的数据集合。我们可以从两个层次加以理解:首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。

整个数据仓库系统是一个包含4个层次的体系结构,具体如下:

1、数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBmS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等。

2、数据的存储与管理:是整个数据仓库系统的核心,数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析,针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。

3、oLap服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:RoLap、moLap和HoLap。RoLap基本数据和聚合数据均存放在RDBmS之中;moLap基本数据和聚合数据均存放于多维数据库中;HoLap基本数据存放于RDBmS之中,聚合数据存放于多维数据库中。

4、前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对oLap服务器,报表工具、数据挖掘工具主要针对数据仓库。

数据仓库要求数据量大,数据正确全面,所以数据在进入数据仓库前必须经过提取、转换与集成,把数据按主题分类,形成多维数据模型。它以多维数据模型为基础,实现数据的分析处理,主要用于支持管理决策。数据进入数据仓库后,一般会被长期保存,基本不会进行修改和删除操作,主要实现数据的查询。

数据仓库与传统关系型数据库不同,主要区别在于数据仓库打破了关系数据库中数据的规范性,实现了数据的重组,增加了数据冗余度;其次传统关系型数据库为了实现数据处理的及时性,要求数据尽量少,而数据仓库为了更有效的实现数据查询,要求存储的数据尽量多,实现海量存储。

1.2数据挖掘技术

数据挖掘技术,是近几年国内外迅速发展起来的一门交叉学科,涉及到数据库、统计学、人工智能与机器学习等多个领域,并在金融、商业零售、电信以及生物医学和基因分析等领域得到广泛应用。

1.2.1数据挖掘的概念

数据挖掘(Data ming),是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(patterns)等形式[3]。

数据挖掘是知识发现的过程,是将未加工的数据转换为有用信息的整个过程。该过程包含一系列的步骤:确定业务对象、数据准备、数据挖掘、模式评估和知识表示[4]。

1.2.2数据挖掘的技术与方法

数据挖掘方法是以数据库为对象,基于机器学习、科学计算、统计分析等技术,形成了数据挖掘方法和技术。一般,数据挖掘常用的技术与方法可以分为以下几个方面:

1)决策树方法

决策树方法是利用信息论的原理建立决策树,主要用于分类和预测。决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。由于分类规则比较直观,易于理解,实用效果好,影响较大,因而得到广泛应用。决策树最早的算法是Quinlan提出的iD3算法,最流行的是其改进版的C4.5算法。

2)聚类方法

聚类分析是直接分析样本,按照各样本数据间的距离远近将样本数据分成若干个不同的类。一般,同一类中的对象相似度很高,不同类中的对象相似度很差。聚类分析属于无监督的分类方法。

3)统计分析方法

统计分析方法是通过统计学中的技术方法实现数据库的数据分析,发现数据间的关系和规律。常用的方法有:回归分析、相关分析、主成分分析等。

4)关联规则

关联规则通过对给定数据集中的数据进行关联分析,描述一个事物中某些属性频繁同时出现的条件,发现隐藏在其中的有趣的联系或规律。一旦建立起数据项间的关联规则,则其中某一项的属性值就可以依据其他属性值进行预测。

5)可视化技术

可视化数据分析技术在传统图表功能基础上进行了拓展,为用户提供交互式的数据浏览,帮助用户更清楚地剖析数据。当所要识别的不规则事物是一系列图形而不是数字表格时,人的识别速度是最快的。

二、数据仓库与数据挖掘技术在客户关系管理中的应用

2.1客户关系管理

客户关系管理(CRm)关注的是企业与客户之间实时、方便的信息交互,通过与客户多渠道的接触、交流和沟通,实现从“接触管理”到“客户关怀”的角色转变,企业的经营中心也从产品或市场转变为客户。客户关系管理最核心的任务是对企业运营过程中所得到的各种数据进行分析,进而为企业经营决策提供支持和依据。

从功能上来看,CRm系统可分为三种类型:

1)操作型CRm

操作型CRm也称为流程型CRm,主要用于客户信息的自动集成过程,实现企业各部门对客户信息的协同合作。

2)分析型CRm

分析型CRm用于分析操作型CRm中产生的各种数据,使用数据仓库和数据挖掘技术产生商务智能,为企业决策提供支持。

3)合作型CRm

合作型CRm用于企业与客户的合作服务系统,包括电话、呼叫系统、电子邮件等,它能实现客户信息的全面收集。

2.2数据仓库的形成

数据仓库是CRm的中央存储系统。在这个信息爆炸的时代,各个企业经过长期经营,收集了大量的客户数据。而这些海量、异构的数据被分散在不同部门,没有得到充分合理的利用。因此,首先要做的是对这些海量分散的数据进行清洗、集成和转换,建立一个整合的、标准化、结构化的数据模型,形成全面、一致和面向决策的数据,即数据仓库。对已形成的数据仓库,按照不同的主题,产生多个对应的数据处理模块,如普通客户数据模块,Vip客户数据模块,团体客户数据模块等,这种多数据模块的建设有利于分析不同客户的行为特点。

2.3数据挖掘技术的应用

使用数据挖掘技术对企业客户信息进行分析,从而挖掘出对企业发展有价值的信息,如:新客户开发、交叉销售及预测、客户信用分析、客户细分、客户类别分析等客户关系管理功能,为企业决策者提供更有效的的决策支持,最大程度地发挥企业CRm的作用。

近年来,随着市场竞争的加剧,企业要想获得一个新客户,所花费的开销往往是争取留住老客户的几倍。有统计数据表明:

1)公司一般每年平均流失10%的老客户;

2)企业留住5%的老客户,利润提升100%;

3)开发新客户的成本是留住老客户成本的5-8倍;

4)一个公司如果将其客户流失率降低5%,其利润就可能增加25-85%。

因此保持老客户就显得更有价值。那么,如何才能预防、减少客户的流失呢?一个非常重要的工作就是要找出顾客流失的原因。我们可以通过数据挖掘技术实现这一目标。

现以电信公司判断用户离网的可能性来做分析,首先进行数据准备,抽取一定量的用户信息,提取的信息主要包括:用户号码、用户类型、用户状态、话费性质(长话/市话)、欠费情况、投诉次数等,利用这些数据,我们来建立判断用户离网可能性的模型。

在数据准备和适当的预处理之后,我们采用决策树中的C4.5算法建立决策树模型。这里,我们引入了信息论中的信息增益率的概念并以此作为属性选择的标准,其核心是在决策树的各级节点上选择属性时用信息增益率作为属性选择标准。通过计算这些属性的信息增益率,找出“投诉次数”属性作为决策树的根节点。扩展决策树节点,进行分枝,其他中间节点也是选择各节点检测属性增益最大的属性,同级的预选属性的增益相同时,规定选择属性值个数较少的属性作为当前节点的分枝,最后,我们可以生成一棵决策树。生成的决策树还需要进行进一步验证,才能最终得到可用的分类模型。选择一些具有共同特征的已离网用户作为测试数据,输入属性值进行离网判断,检验模型的正确性,生成最终的决策树模型。使用生成的决策树模型,对比用户的信息是否贴近离网用户的特征属性值,能大致预测出该用户的离网可能性,对离网可能性高的用户,根据其特征属性进行挽留工作,从而预防、减少客户的流失。

三、结束语

在企业客户关系管理系统中有效利用数据仓库和数据挖掘技术,可以为企业高层决策者提供准确的客户分类、忠诚度、赢利能力及潜在用户等有用信息,指导他们制订最优的企业营销策略、降低银行运营成本、增加利润,加速企业的发展。相信未来会有更多的行业加入使用客户关系管理的行列中,通过数据仓库和数据挖掘技术挖掘出对自身发展有用的信息,也必使客户关系管理的目标得到更好的实现。

参考文献

[1]余英泽,廖里,吴渝. 一种新型的数据分析技术——数据挖掘[J]. 计算机与现代化,2000(1).

[2]王实,高文. 数据挖掘中的聚类方法[J].计算机科学,2000(4).

[3]白雪.数据挖掘技术在客户关系管理中的应用研究[J] .大众科技,2012 (2).

[4]Han Jianwei,micheline Kamber.Data mining Concepts and techniques[m].morgan Kanfmann publishing,2000.

管理学决策树法篇9

关键词院校训练成绩分析决策树模型

中图分类号:G642tp391文献标识码:a

0引言

军事训练是军事院校的中心工作,更是一项主抓经常性的工作。学员在训练教学过程中积累了大量的数据,但军事训练主管部门对训练成绩的分析有限。导致只能从表面得出训练效果,难以找到影响训练成绩的隐藏因素。如何利用训练成绩科学有效分析教学的成效得失,找到问题根结是亟待解决的问题。为真正挖掘到数据间潜在的相关性,文章拟通过决策树建模方法对数据进行分析,找到影响训练成绩的真实原因,从而为后续采取相应措施,提高训练质量奠定基础。

1训练成绩数据分析基本流程

利用决策树技术可有效对军事训练成绩进行科学且全面地分析,找出影响军事训练成绩深层次的潜在因素。所得到的结果和信息能对以后的军事教学工作提供很大的帮助。

2分析对象以及数据准备

确定分析对象,明确目标,能避免数据挖掘盲目性。本文以军事院校学员的军事训练成绩为对象,目标挖掘分析学员的军事训练成绩与影响因素的相关性。

(1)数据收集。根据业务对象和目标收集包含以下属性信息:姓名、标准体重、生源、年级、周训练频度、科目训练成绩。标准体重以国际Bmi(Bodymassindex)指数作为衡量标准。生源分为高考青年学员和部队士兵学员。周训练频度(1次、2次、3次等),周训练频度是指一周内学员连对体能科目的训练次数。

(2)数据预处理。删除缺项、填补空缺。如伤病号未参加考核,忽略删除;对个别的空缺,则采用在该属性上出现的多数属性值人工填补。

(3)数据转换与归约。由于决策树技术需要离散值属性,而学生成绩属于连续值属性,需将连值属性离散化处理。使用概念分层技术,可以将连续值属性D换为离散值属(即离散化)。

3决策树建模与分析

(1)根据转换获取的数据选择决策树算法。建立决策树模型的工作流程如图2所示:

具体实现步骤介绍如下:

①计算数据的分类信息熵,再计算各属性的信息增益率;

②按属性划分子集,计算信息熵;

③各属性分别计算期望信息、信息增益、信息增益率、分裂信息;

④建立决策树的根节点,信息增益率最大的作为决策树的根节点,并根据它的属性值引出分支;

⑤分支子集同理循环划分,直至子集为空或没有属性划分为止。

(2)成绩分析。利用建立的决策树模型,分别输入不同科目成绩以及上述对象的基本属性,从而分析各项科目之间以及与对象属性之间的内在联系。例如输入体重、生源、年级、周训练频度、科目a成绩、科目B成绩作为六个属性去预测科目C的成绩。

4结语

决策树算法是使用广泛且非常实用的归纳推理方法之一,文中给出了针对军事训练成绩分析的决策树建模方法,讨论了具体的实现步骤。利用该模型对军事训练成绩进行分析能有效提高院校军事训练的科学性与客观性,为训练计划、管理提供可靠依据。

参考文献

[1]李海峰.数据挖掘技术在学生成绩分析中的应用研究[D].河北大学,2012.

管理学决策树法篇10

关键词:高校信息化数据挖掘应用研究

中图分类号:tp311.131文献标识码:a文章编号:1007-9416(2016)04-0000-00

高校信息化建设高速发展,使得在高校教育信息中产生大量的数据。如何使这些数据为教育教学所用,对于这些问题急需解决,数据挖掘技术是目前对数据处理比较完善的技术,它可以将隐藏在数据背后的有用信息提取出来供人们使用,以此提高质量和效果。

1数据挖掘的定义及挖掘步骤

1.1数据挖掘的定义

数据挖掘(Datamining),又称为信息勘探、数据采掘。其实质就是从大量的数据中通过多种算法搜索隐藏于其中有用信息的过程。数据挖掘也有学者将其称之为知识发现(KnowledgeDiscoveryinDatabase,以下简写为“KDD”)。而在学术领域,学者们对“数据挖掘”和“知识发现”这两个概念的内涵和外延一直缺乏比较明晰的界定,直到1996年,数据挖掘研究专家UsamaFayyad等在KDD国际会议上对上述两个术语进行了定义及区分:所谓知识发现(KDD)是指数据库中知识发现的全过程,而数据挖掘仅仅是知识发现(KDD)过程中的一个特定步骤,即数据挖掘包含于知识发现过程中,属于从属关系。

1.2数据挖掘步骤

(1)确定挖掘对象、目标。确定挖掘对象便于后面数据采集,明确目标便于分析。建立分析的先决条件是对问题和目标的清晰描述。本文中的挖掘对象是信息技术系2013级计算机应用技术专业学生《网页设计》课程成绩,挖掘目标是影响《网页设计》课程成绩的因素有哪些,为作者及带同一门课的教师提供参考依据。(2)数据的收集。根据数据分析对象,从数据分析中提取特征信息,选择适合的方法采集数据并将采集的数据输入到数据库。这个阶段是一个量大的工作,并占用了大量的时间。本文中的成绩数据通过学院“学生成绩管理系统”获得,其他数据通过调查表获得。(3)数据预处理。接下来清理收集数据。由于数据库中的数据一般是不完整的、噪声的和不一致的,为了确保数据的完整性需要将这些数据清理出去。(4)数据转换。为了更好的建立适合挖掘算法的分析模型需要对数据进行转换。(5)分类挖掘知识和信息、选择合适的技术和算法在处理和转换后的数据集中进行数据挖掘,通过合适的编程语言实现算法,其目的是确定分类模型。(6)知识的表示――生成分类规则。知识的表示最终的目的是生成分类规则,通过获取的信息进行解释和评价。(7)知识的应用。将生成的分类规则应用到实际工作中以促进和提高工作质量。

2数据挖掘常用的方法

2.1统计分析法

数据挖掘涉及到多个科学领域,统计领域就是其中一个。统计分析法(statisticalanalysismethod)是数据挖掘中的基本技术,其方法是从总体当中选取样本,通过对样本的分析获取样本数据的内在特征,并由其推断总体特征的一种方法。统计分析方法的思想是在数据集中假设一个概率模型然后根据模型采用相应的方法进行挖掘。此方法的特点是结果精准且易于理解。

2.2关联规则法

数据挖掘中的一个重要内容是关联规则法(associationRules),关联规则对数据挖掘的主要思想是:在数据库中发现n(n>=2)个变量之间的规律。关联可以分为简单关联(Simplecorrelation)、因果关联(Causalassociation)、时序关联(temporalassociation)。关联规则法在现实中比较实用。

2.3决策树法

决策树(Decisiontree)法是数据挖掘中常用的方法之一,决策树使用概率论原理,它用树形图来描述挖掘结果。决策树由树根、树枝、树叶、概率值、损益值。决策树的构建方法是通过样本数据集进行计算后构建决策树模型,通过决策树模型提取分类规则,最终形成人们易于理解的规则结果。本论文研究过程使用的就是决策树法,在后面着重介绍决策树法及它的常用算法。

2.4神经网络法

神经网络(neuralnetwork)体现了数据挖掘多学科交叉的特点。它是非线性动力学系统,特色是信息的分布式存储和并行协同处理。神经网络法主要研究方面是人工神经网络、网络模型和理论模型的建立。神经网络法的特点是高度并行性、泛化能力等,常用于医学、生物学等领域。

3数据挖掘在高校信息化建设中的应用

3.1数据挖掘在学生成绩中的应用

高校的连年扩招和高校信息化建设的迅速发展,各个学校都应用校园信息化平台,获取并收集了大量的学生基本信息数据和学业水平数据信息。目前对于学生成绩的处理还是处于简单的统计、排序、查询等阶段,对于学生如何取得这样的成绩,教师针对学生如何调整教学方法等问题无法通过简单阶段获得,通过数据挖掘技术的应用,帮助教师获取更多能有助于教学有价值的信息,为老师的教学工作提供一定的决策依据,进而提高教学质量。

3.2数据挖掘在教学管理中的应用

教学管理工作涉及教师和学生两个方面如:人才培养计划、课程建设、成绩分析和教学评价等,它们之间存在联系,通过数据挖掘将这些数据中的规律挖掘出来,提供教学管理者参考,以提高教学质量。

3.3数据挖掘在招生就业中的应用

高校招生工作一直影响着高校的建设和发展,高校招生数据中反映出生源质量、分布、报到率等信息,对于专业建设提供参考依据,从而决定人才培养方案、课程建设、专业定位等方面,专业建设影响着高校的人才培养质量及就业质量。

3.4数据挖掘在课堂教学质量评价体系中的应用

高校教学发展的重要因素为教学质量,教学质量提高的有效机制是教学质量评价体系,通过对课堂教学质量评价体系中数据进行挖掘,证明了评价体系对教学管理者的可用性并提供了重要决策依据。