首页范文大全神经网络隐含层数的确定十篇神经网络隐含层数的确定十篇

神经网络隐含层数的确定十篇

发布时间:2024-04-26 11:16:26

神经网络隐含层数的确定篇1

关键词:企业财务困境预警;人工神经网络

中图分类号:F23

文献标识码:a

doi:10.19311/ki.16723198.2016.21.066

1人工神经网络

人工神经网络是基于理论化的人脑神经网络,是通过模仿大脑神经网络结构和功能模拟建立起来的一种信息处理系统,此类人工神经网络由大量较简单的人工神经元根据一定的规律连接起来形成复杂网络,具有高度的非线性,在系统功能上能够满足复杂的逻辑操作和非线性关系实现。在网络中信息的转播、存储方式以及信息存储在各个神经元的连接权上都与生物神经网络进行信息传播存储相似。两者都是运用并行式的“集体”工作方式。这种信息处理系统是通过人工模仿人脑神经网络而建立的,因此被人称为人工神经网络。

设输入模式向量为Xk=(xk1,xk2,…,xkn)t(k=1,2,…,m),对应输入模式的期望输出向量为Yk=(yk1,yk2,…,ykq)t;中间隐含层净输入向量Sk=(sk1,sk2,…,skp)t,输出向量Bk=(bk1,bk2,…,bkp)t;输出层净输入向量Lk=(lk1,lk2,…,lkq)t,实际输出向量为Ck=(ck1,ck2,…,ckq)t。

2财务预警指标体系的构建与模型设计

(1)财务数据的确定。

财务数据选取为2015会计年度报表中的财务数据,数据来源于东方财富网和巨潮资讯网。其中沪市a股上市公司代码60XXXX。

(2)基于Bp神经网络的财务预警模型的构建从常规来看,Bp网络的结构设计主要包括隐含层、确定输入层、输出层及各层之间的传递函数。事实上,网络的应用往往转化为如何确定网络的结构参数和网络模型的最终连接权值。在实验过程中,模型的具体设置如下。

①网络层数的设计。神经网络主要由出入层、隐含层和可以加强网络映度的隐含层组成。在模型设置中对于多层神经网络而言最重要的是要确定隐含层的具体数目。在模型设置中,通过采用单隐含层Bp神经网络,即仅利用一个输入层、一个输出层和一个隐含层就能够实现将财务危机良好分类。

②输入层的设计。在模型设计过程中通过输入相关变量决定输入层的神经元个数,使输入节点与网络的逼近效果呈正相关。但是在模型设计过程中,一味盲目的扩大节点数也会加大网络的负担,从而对网络的训练时间和训练效果进而影响网络的训练时间和训练效果,此次研究的输入层节点数为财务预警指标的个数,即9个。

③输出层的设计。输出值代表模型要实现的目标功能,这种网络结构同一般指标预警有着共同点,输入层和隐含层分别为预警指标和警情指标。

④隐含层的设计。在模型系统中,对网络的性能产生重要影响的因素是算法的神经网络中各层节点数。实验要达到预定的映射关系必须克服单隐含层网络的非线性映射能力较弱这一缺点。实验中在设计隐含层节点时,进行反复测算,当隐含层神经元个数为18个时选择预测结果最为理想。

⑤传递函数。传递函数又称为激活函数,对输入层到隐含层的传递函数为tanSigmoid函数。隐含层到输出层之间的传递函数确定为purelin型线性传递函数。

⑥网络参数。此论文在研究过程中设置如下网络参数:目标误差0.0000001,学习速率为0.1,训练循环次数200次。通过测试,得出最优学习速率为0.03。

(3)预警模型的检验与测试。

利用Bp神经网络的财务预警模型设计,将实验所需的样本集分为训练样本和测试样本2组。从样本集中随机抽取10家企业作为测试样本,剩下的St企业和非St企业作为训练样本。将上述对应样本输入程序,通过计算机程序运算就得到了测试样本模型演算的输出值。程序运行情况表明该Bp网络模型的误差曲线是收敛的,通过24步训练,该程序的网络性能达标,符合初始化均方差的要求。此程序模型对训练样本和测试样本的判定结果如表1所示。

将财务困境公司判定为财务健康公司和将财务健康公司判定为财务困境公司是Bp神经网络模型样本误判的两种类别。实验结果表明,从训练样本的角度来看,误判的样本个数为0个,也就意味着其判定准确率达到100%。从测试样本的角度来看,被误判的样本个数为2,两种误判类型的样本个数各占一个,以上实验结果表明误判率为20%,判定准确率为80%,总的判定准确率为96%。

3研究结果

每个企业可能会有不同的财务状况短板,但是利用以上系统进行直观的数据分析,能够从宏观方面看出存在财务危机可能性的企业的整体财务状况要比非St企业差很多。也进一步说明了在该模型的测试下,随机抽样的方式选择样本数据,依然具有较高的准确率。

参考文献

[1]杨淑娥,黄礼.基于Bp神经网络的上市公司财务预警模型[J].系统工程理论与实践,2005,(01):1218,26.

神经网络隐含层数的确定篇2

【关键词】Bp神经网络;隐层节点自动筛选;温度预测

【abstract】thereisadifficultproblemthatthetemperatureofmediumismeasuredinthemicrowaveheatingcavity.Firstofall,theBpneuralnetworkalgorithmisusedtopredictthereal-timetemperatureofheatingmedium.inthisthesis,thedesignofthreelayerBpnetworkforthepredictionofmedium’stemperatureiscompleted.aboutthenodenumberproblemofhiddenlayer,firstlytheempiricalformulaisusedtoestimatetherangeofthenodenumberofhiddenlayer,thenthenodenumberofhiddenlayerisscreenedautomaticallybysettingthecirculation.Finally,thesimulationisdoneonmatLaBplatform.thenetworkperformanceandthetemperaturepredictionresultsofthemanualscreeningortheautomaticscreeningarecomparedandanalyzed.

【Keywords】Bpneuralnetwork;Screenedhiddenlayernodesautomatically;temperatureprediction

0引言

微波加热过程中温度的预测,一般采用数值模拟的方法,其中刘长军等采用时域有限差分求解方程组的方法来模拟媒质温度随时间变化的规律[1]。赵翔等采用矩量法、半解析法分别求解电磁场方程和热传导方程的方法来模拟温度空间随时间的变化规律[2]。此类数值模拟的方法,存在数值计算复杂,考虑因素不齐全等问题。而直接用温度传感器测量所导致的问题有:需对腔体开孔易造成微波泄漏;微波对传感器辐射,易造成测量不准确和损坏;传感器测量存在时延,不利于实时控制。而用微波功率计对反射功率的测量比温度测量容易,且精度较高。因此本论文用反射功率、时间、初始温度等对温升产生影响的因素,结合Bp算法对加热的温度进行预测。

1Bp神经网络算法的数学模型

2隐含层节点数的研究

隐含层节点数量对网络性能有很大影响,节点数越多,网络性能越好,但可能导致训练时间较长,且网络学习后的网络泛化能力会降低,节点数目太少,则不能产生供样本数据学习的连接权值组合,导致学习不收敛,最终训练网络不能达到预期的预测效果。

2.1隐含层节点数范围的确定

对于神经网络中隐含层节点数目的确定,目前仍没找到确定表达式,以往一直采用经验和不断试验来确定一个近似的隐含层节点数,而这类方法工作量比较大,预测的精度以及网络模型的质量都不能保证。

其中,m是输入层节点数,n是输出层节点数,ξ是整数,取值范围为1~10。估算出i的取值范围3~12。

2.2隐含层节点数自动筛选的设计

本文通过设置For循环,对隐含层取值范围内的数进行一一对比测试数据样本对应的输出数据的累计误差和,选取累计误差和最小的隐含层数作为最优隐含层节点数。在筛选中,选用2层For循环,外层For循环用于设置隐含层节点数范围,即3~12,内层For循环用于计算误差和,其实现步骤为:(1)选取隐含层节点数为nodenum=L(i),创建网络。(2)对样本数据进行网络训练。(3)用测试样本数据对训练好的网络进行测试,计算测试样本数据与目标输出间的误差矩阵。(4)对误差矩阵进行求和,求出当前隐含层节点下的误差和sumerror。(5)比较误差和,筛选出误差和最小的隐层节点数目。

3Bp算法的matLaB仿真实现

本文仿真在matLaB平台上完成,采用自动筛选隐含层节点数的Bp算法对微波腔体中媒质的温度进行预测[6]。

3.1预处理

实验将100ml的水在室温20.9℃下采用不同恒定功率下加热,记录时间、温度和反射功率,温度到达50摄氏度,停止加热。

4Bp模型温度预测结果分析

采用手动和自动筛选隐含层节点数目的网络结构如图3所示:

5结论

本文利用在实验中收集的相关数据,采用可自动筛选节点的Bp神经网络算法对媒质水的温度进行预测。在微波加热温度可控的工程应用中,本论文具有重要的应用价值。

【参考文献】

[1]刘长军,闫丽萍,黄卡玛.微波加热中“热失控”的一维数值模拟[C]//2005年全国毫米波会议论文集,2005:1040-1043.

[2]赵翔,黄卡玛,闫丽萍,姚远.数值模拟微波加热化学反应过程的初步研究及热点和热失控现象讨论[J].中国科学Q辑:物理学力学天文学,2009,39(4):501-511.

[3]陈明,等,编.matLaB神经网络原理与实例精解[m].清华大学出版社,2013.

[4]傅荟璇,等.matlab神经网络应用设计[m].北京:机械工业出版社,2010.

神经网络隐含层数的确定篇3

【关键字】灰色理论Bp神经网络预测模型

一、引言

随着大数据时代的到来,Bp神经网络预测模型已成为学术界研究的热点,并应用到多领域中。Bp神经网络具有很好的非线性逼近以及自学习的能力,可高精度拟合预测值,但是,由于很多系统存在不确定性,传统的Bp神经网络将原始时间序列直接作为输入值,而原始时间序列中具有很大的随机性和不确定性,使得神经网络在预测结果中,存在较大偏差。解决此问题的有效方法是将原始时间序列经过灰色理论进行白化处理,过滤掉数列中的不确定性和随机性等灰色特性,再将白化处理后的结果作为Bp神经网络的输入。

二、灰色预测理论研究

根据研究对象的特性可将其分为白、灰、黑三类,该分类取决于研究者对系统信息的掌握程度,是基于认识程度而言,具有相对性。其中白色系统信息完全明确,黑色系统信息完全缺乏,而灰色系统是介于白色系统和黑色系统之间,其信息具有不充分、不完全的特性。灰色预测为灰色系统最典型的应用,在样本数据量较少、预测结果具有一定的随机性时,灰色理论是应用最为广泛的,克服了系统周期短和数据不足的矛盾。对于样本少、贫信息的不确定性系统[1]而言,由于原始数据毫无规律可循,因此灰色理论首先将原始时间序列进行累加,使其具有递增规律,然后对其进行拟合,最终将累加数据进行还原。其具体原理如下所示:设原始时间序列为累加为时间序列为,累加后是单调不减时间序列,可见,一般累加可将非负的任意无规律数列转换为单调不减数列。根据该时间序列,建立白化方程并得到方程的解。所得即为的估计值,但是由原始数列累加变换所得,因此,还需对估计值进行累减处理,最终即为所求预测值。

三、Bp神经网络理论研究

Bp神经网络是一种具有连续传递函数的前馈神经网络,其训练方法是误差反向传播算法,常用的为梯度下降法[2]。以均方误差最小化为目标不断修改网络权值和阈值,最终能高精度地拟合数据。Bp神经网络模型结构分为三层,第一层为输入层,输入值为预测系统的主要影响因素的定量值;第二层为隐含层,每个神经网络模型至少包含一个隐含层,为了计算方便,本论文中采用一个隐含层进行预测;第三层为输出层,输出即为系统的预测结果,输出可为一个或多个,本文采用一个输出模式。设输入层的输入值为,隐含层的神经元值为,输出层的神经元值为。输入层神经元与隐含层神经元的权值为,隐含层神经元与输出层神经元的权值为。隐含层神经元的阈值为,激发函数为,输出层神经元的阈值为,激发函数为。在神经网络进行训练时,分为两个方向:信息正向传递和误差反向传播。在信息正向传递的过程中,隐含层每个神经元通过该神经元的阈值、其与输入层各神经元的权值及输入层各神经元本身的值的结合,在本层激励函数的作用下取得。神经网络经过以上的正向信息传递,将m维向量的n个样本数据作为输入,计算出隐含层神经元的值,最后计算出实际输出值。利用其与期望输出值t可计算出均方误差。将所得mSe沿原来正向信息传递的路径逐层反向传递,依据输出的mSe计算出各层的,并将作为依据,更新各连接的阈值和权值,此时误差反向传递完毕。网络模型反复进行信息正向传递和误差反向传递着两个过程,直到mSe达到标准或小于标准ε。

四、灰色神经网络预测模型的建立

由于灰色系统具有明显的不确定性,因此用灰色模型先将原始输入数据进行累加,使其具有明显的指数特性,并对其进行白化即用微分方程对其进行拟合预测。对于有n个参数的灰色神经网络的微分方程为:

其中,xi(1)(i=2,3,...,n)为系统输入值,xi(1)为系统输出值。记微分方程系数为

将Gm(1,n)的输出值作为神经网络的输入值,即可得到灰色神经网络模型。

总结和展望:由于现实世界中的系统很多属于灰色系统,在对未来数据的预测过程中,仅凭传统的Bp神经网络预测存在很大的偏差。而本文提出的灰色神经网络预测模型可以有效地过滤系统中的灰色特性,并充分发挥灰色理论和Bp神经网络各自的优势,二者取长补短,使得最终对灰色系统的预测更加准确。但值得注意的是在神经网络预测的过程中,采用的梯度下降法只能找到局部最有值[3],无法准确获取全局最优。可在以后的预测模型研究中考虑加入遗传算法等对此模型进行优化。

参考文献

[1]刘金英.灰色预测理论与评价方法在水环境中的应用研究[D].吉林大学,2004.

神经网络隐含层数的确定篇4

关键词:RBF神经网络;模型建立;遗传算法

中图分类号:tp311文献标识码:a文章编号:1009-3044(2008)12-20000-00

applicationofGeneticalgorithminCombustionprocessoftheBoilerinpowerplants

wanGLi-rong

(Schoolofelectronicsandinformationengineering,anhuiinstituteofarchitectureandindustry,Hefei230022,China)

abstract:anewdesignofRBFneuralnetworkisproposed.adynamicK-meansmethodbasedonGeneticalgorithmisusedtooptimizethecentersofthehiddenunitsofRBFnetwork.GeneticalgorithmisusedtotraintheweightsofRBFnetwork.takingboilercombustionprocessasanexample,aRBFneuralnetworkisbuiltupandtheoptimizationinputisfound.thecombustionprocessoftheboilerisoptimizationofsystemdesign.

Keywords:RBFneuralnetwork;modeling;Geneticalgorithm

1引言

径向基函数(RBF)神经网络是一种多层前向网络,它具有学习收敛速度快、非线性逼近能力强等优点。遗传算法是模拟自然遗传学机理和生物近乎理论而形成的一种全局并行、随机搜索的方法,它具有强鲁棒性,并具有收敛到全局最优的能力。用遗传算法优化RBF神经网络的参数、结构及学习规则,为训练神经网络提供了一种新的途径。

本文通过RBF神经网络建立了一个燃烧优化指导系统的模型,该模型能够直观的反映控制量和燃烧优化目标的关系,而忽略了中间繁复的过程,同时利用遗传算法对建立的模型寻优,得到锅炉燃烧过程的最优运行指标。实验表明可以取得比较满意的结果。

2RBF网络算法

2.1RBF神经网络结构

RBF神经网络是一种三层前向网络,如图1。第一层为输入层,由信号源节点组成;第二层为隐含层,单元数视所描述问题的需要而定;第三层为输出层,它对输入模式的作用做出响应。从输入层空间到隐含层空间的变换是非线性的,而从隐含层空间到输出层空间的变换是线性的[1]。隐含层单元的传递函数是RBF,如图2,它是一种局部分布的、对中心点径向对称衰减的非负非线性函数即高斯函数:

其中:c为函数的对称中心,σ高斯函数的宽度。

RBF神经网络的隐含层输出为:

其中hj为隐含层单元的输出,x为网络输入向量,cj为隐层中第j个单元的中心矢量,δj为高斯函数的形状参数,L为隐含层节点数。

网络的输出为:

yj为网络的输出,wij为隐层第i个单元与第j个输出之间的权值。

2.2网络隐含层中心点的确定

用RBF网络进行非线性系统建模,首先要选定隐含层节点数和中心值。节点数决定了网络的复杂程度。网络过于简单,将不能准确地描述系统的复杂程度;网络过于复杂,增加了学习时间,会使网络中含有过多无用的信息。所以选择适合数量的隐含层节点数是一个很重要的问题。本文利用遗传算法基本思想和K均值聚类相结合的方法来确定隐含层的中心[2]。

首先将第一组样本数据作为一个聚类中心,每输入一组新的样本数据,计算它与任何一个聚类中心之间的欧式距离,如果指定第p组输入样

本为X(p)以及第j聚内中心矢量为Cj,则欧式距离

n是聚内中心的维数。然后判断该样本数据是否属于与其欧式空间距离最短的模式。判断标准如下:

当X(p)-Ck

内,则不能分配到该类别,该组输入样本就作为一个新的聚内中心。

一旦一组输入数据属于某一个类别,该类别的聚内中心就必须重新调整,调整的过程为:

Ck=(1/m)ΣX,k表示该输入样本所属的聚内中心,m表示该聚内类别中数据的组数。

2.3遗传算法寻优RBF神经网络的权值

2.3.1遗传算法简述

遗传算法是模仿自然界中生物群体的选择、杂交、变异等行为而发展起来的一种优化算法,它是建立在自然选择和自然遗传学机理基础上的迭代自适应概率性搜索算法。利用遗传算法可以在解空间内对解进行多点随机搜索,并找出最优解,由于遗传算法的随机特性,所有解都有被搜索的可能,因而可以找到全局最优解。遗传算法的一般过程可以分为初始化、选择、交叉和变异四个组成部分。

2.3.2遗传算法寻优RBF神经网络的权值

①初始化神经网络权值

用随机方法产生一列初始值wij(i=1,2,…,n;j=1,2,…,m),设含有n组神经网络权值组成的种群,隐层神经元个数为m,则生成的初始权值为:

{(w11,w12,…w1s),(w21,w22,…w2s),…,(wm1,wm2,…wms)}权值采用实数编码方式,实数编码对于任何输入,可直接取染色体。

②适应值计算

一组训练集数据经过网络计算之后,计算输出节点的误差:

其中p为输出节点数,yi为网络计算结果,ti为实际值。网络权值的适应值为:f=1/(1+e),0

③选择

计算对应种群的适应值fi和种群的总适应值F=????fi和平均适应值。计算每一种群的选择概率pi=fi/F及累计概率qi=???pj,旋转n次可以选出n个种群来,实现步骤为:产生[0,1]间随机数r,若r

④交叉

对每种群产生[0,1]间随机数r,若r

⑤变异

对每一种群的每一位产生[0,1]间随机数r,若r

⑥算法的终止

经过选择、交叉和变异操作,得到一个新的种群准备进行下一代进化,对上述步骤经过给定的循环次数后,遗传算法终止。本文给出的判断迭代终止的条件为判断最佳优化值是否连续若干步没有明显的变化。

2.4RBF神经网络的具体算法

建模算法:

(1)先确定算法的输入、输出参数。设有q组训练样本,输入X=[x1,x2,…,xn],共n维向量,输出为Y=[y1,y2,…,ym],共m维向量,则网络定为n维输入m维输出。

(2)对输入样本数据进行去噪和归一化处理,得到m组数据,将处理后数据作为网络的输入数据。

(3)取第一组样本作为隐含层的第一个节点中心。

(4)取第p(2≤p≤m)组样本,用遗传-K均值聚内算法来确定新的隐含层中心点Ci,得到s个聚类中心。

(5)由公式(1)求出网络隐含层的输出。

(6)通过遗传算法寻优,得到RBF神经网络的权值为:{(w11,w12,…w1s),(w21,w22,…w2s),…,(wm1,wm2,…wms)}

(7)若所有的样本都以训练完,结束。否则取下一组样本,转第(4)步。

3遗传算法求最值

通过RBF神经网络建立起来了输入与输出之间的函数关系后,用遗传算法对锅炉燃烧系统进行优化。

现使用实数编码遗传算法对电站锅炉燃烧过程进行优化设计,设计步骤[5],如下:

(1)随机的选取50组变量构成初始种群。

(2)设计模拟锅炉燃烧系统的模型,建立起输入输出变量的函数关系。

(3)设定适应度函数,计算每个个体的适应值。

(4)用赌方法,按每个染色体的适应度来选择染色体。

(5)进行交叉运算。若交叉发生,则处理编码赋值,否则不做任何处理。

(6)然后进行变异运算,按变异概率确定个体是否发生操作,若发生,则产生介于变量上下限之间的随机数。

(7)检验是否满足迭代终止,是则退出,否则转(4)。

取种群规模popsize=50,交叉概率pc=0.8,变异概率pm=0.05,最佳优化值连续100步没有变化。

4建模实例

电站锅炉燃烧过程是一种复杂的热工系统,它的建模与控制一直是人们关注的热点。由于锅炉燃烧过程本身具有非线性且影响因素众多,其中包括许多难以原理方法建立定量关系的参量。本文采集了电厂燃烧过程的数据,使用RBF神经网络对其建模。

网络模型为9个输入,两个输出,三层RBF神经网络。图3为锅炉燃烧系统模型的框图。网络的输入选定为:氧量偏置(o2_Bias)、磨煤机容量风挡板开度(pulv_D_Bias、pulv_e_Bias)、磨煤机出口温度(pulv_D_t、pulv_e_t)、一次风母管压力(prim_air_Set)、空气温度(air_t1、air_t2)和负荷(Load)。网络的输出选定为锅炉的热效率(Boilereff)和飞灰含炭量(Loi)。

经过317步训练,网络训练完成,网络训练程序自动调整后的最终隐含层节点数为56个。

为了检验网络的性能,将55组检测数据输入到已训练完成的网络,所得网络的输出与实际数据进行比较,比较结果如图4、图5。图中实线表示的是实际样本,虚线表示的是网络的输出。通过比较图形可以得出结论:此次训练得到的神经网络模型基本上反映了模型的输入输出对应关系,并且具有较好的泛化能力。

对已建立完成的锅炉燃烧过程的神经网络模型,选取优化目标进行优化。

以锅炉燃烧热效率(Boiler_eff)为例,求热效率的最大值。寻优的过程如图6,锅炉热效率的最优值为95.608。

以飞灰含炭量(Loi)为例,求飞灰含炭量的最小值。寻优过程如图7,飞灰含炭量的最小值为0.641。

wlr11.tif

5结论

使用RBF神经网络进行建模,不需要事先确定神经网络的结构,增强了需要建模系统的适应性,而且具有学习速度快、进度高的优点。用遗传-K均值聚类算法来确定RBF神经网络的隐层中心向量,保证了网络具有最小的结构;用遗传算法训练网络权值,保证了较快的收敛速度;用遗传算法对建立的模型寻优,确定用一组理想指导值,使燃烧过程在此种工况下运行性能最优。经过试验检测,遗传算法可以用于电站锅炉燃烧过程的优化。

参考文献:

[1]梅鲲鹏,黄仙.动态RBF神经网络在非线性系统中的应用[m].现代电力,2004,4,21(4).

[2]景志远.遗传K_均值算法在软件测试算例自动生成中的应用研究[m].油气田地面工程,2003.4,22(4).

[3]李红利,张晓彤,兰立柱,孙兆林.基于遗传算法的RBF神经网络的优化设计方法[m].计算机仿真,2003,11,20(11).

[4]王永骥,涂键.神经元网络控制[m].北京:机械工业出版社,1998.

[5]毕春长,丁予展.实数编码的遗传算法在斜齿圆柱齿轮传动优化设计中的应用[m].机械科学与技术,2000,11(16,6).

收稿日期:2008-03-27

神经网络隐含层数的确定篇5

关键词:信用卡;违约风险;Bp;神经网络;预测;

中图分类号:tp183文献标识码:a文章编号:1009-3044(2011)10-2348-02

thepredictionoftheDefaultRiskofCreditCardBasedonBpneuralnetwork

Fanwei-qiang1,LiUtun-dong2

(1.73118pLatroops,Xiamen361024,China;2.theautomationDepartment,informationScience&technology,XiamenUniversity,Xiamen361005,China)

abstract:afterimplementationofpredictionofriskofdefaultfromnaturalinformationofcreditcardapplicantsusingBp(Backpropagation)neuralnetwork,thedefaultriskoftheindexsystemisestablished.throughthetrainingandsimulationonsmallsampledata,highlyapproximationbetweenthemodeloutputandtargetoutputisachieved.

Keywords:creditcard;defaultrisk;bp;neuralnetwork;prediction

目前,对于违约风险,银行往往是利用传统的“评分系统”或者所谓“专家评分”来确定申请者风险水平。这种传统的评分方法,有很大的随意性和不稳定性。Bp神经网络,在经济领域已有广泛的应用[2-3],然而,在信用卡风险预测方面尚不多见,本文以三层Bp网络为基础实现信用卡风险预测。银行根据风险水平进一步确定是否发卡及透支额度。

1信用卡违约风险

1.1信用卡违约风险概述[4]

信用卡违约风险是由持卡人做出部分或全部支付的承诺时潜在的支付失败驱动的,它在持卡人在还款期限内出现资金紧张或不愿意偿还时发生。

1.2信用卡违约风险预测指标确定

根据银行专家在个人信用体系构建方面的研究成果[5],确立本预测模型的三个指标变量:个人特征,经济状况和信用记录,每个变量又具体包含更细的指标要素。其中个人特征包括年龄(u1)、婚否(u2)、工作稳定状况(u3)及受教育程度(u4);经济状况包括本人月收入(u5)、家庭月收入(u6)、金融资产(u7)及固定资产状况(u8);信用记录包括是否有不良信用记录(u9)、抵押资产(u10)及贷存比(u11)。

2Bp神经网络基本算法

2.1神经网络Bp算法原理

Bp算法的主要设计思想是,将输入信号通过隐层和输出层节点的处理计算得到的网络实际输出进一步与期望输出相比较,并计算实际输出与期望输出的误差,将误差作为修改权值的依据反向传播至输入层,再修正各层的权系数,并且反复这一过程,直到实际输出与期望输出的误差达到预先设定的误差收敛标准,从而获得最终的网络权值。Bp神经网络听拓扑结构如图1所示:图1中,X1,X2,…,Xn是Bp神经网络的输入值,Y1,Y2,…,Ym是Bp神经网络的预测值,ωij和ωjk为Bp神经网络权值。从图1可以看出,Bp神经网络可以看成一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量。当输入节点数为n,输出节点数为m时,Bp神经网络就表达了从n个自变量到m个因变量的函数映射关系。

2.2Bp神经网络的训练步骤

1)网络初始化。根据系统输入输出序列(X,Y)确定网络输入层节点数n、隐含层节点数l,输出层节点数m,初始化输入层、隐含层和输出层神经元之间的连接权值ωij和ωjk,初始化隐含层阈值a,输出层阈值b,给定学习速率和神经元激励函数。

2)隐含层输出计算。根据输入X,输入层和隐含层间连接权值ωij以及隐含层阈值a,计算隐含层输出H。

(1)

式中,l为隐含层节点数;f为隐含层激励函数,该函数有多种表达形式,本文中选择tansig函数,其表达式为:

(2)

3)输出层输出计算。根据隐含层输出H,连接权值ωjk和阈值b,计算Bp神经预测输出o。

(3)

4)误差计算。根据网络预测输出o和期望输出Y,计算网络预测误差e。

(4)

5)权值更新。根据网络预测误差e更新网络连接权值ωij和ωjk。

(5)

(6)

6)阈值更新。根据网络预测误差e更新网络节点阈值a,b。

(7)

(8)

7)判断算法迭代是否结束,若没有结束,返回步骤(2)。

3信用卡违约风险预测模型构建及matlab仿真

3.1选取训练样本与测试样本

本文使用一个小样本数据集[6]来对其应用情况进行介绍。样本1~20为训练样本,其中前12个为未违约样本(即按时还款,记为Y),后8个为违约样本(即未按时还款,记为n);样本21~23为测试样本。对于样本各项指标的特征,采用评分的方法给出。

3.2模型有关参数的设定

Bp神经网络构建根据系统输入输出数据特点确定Bp神经网络的结构,由于信用卡违约风险预测指标数为11,取输入层神经元数为11;输出层采用线形(purelin)激励函数,神经元数为1;隐含层神经元数根据经验公式[6]l

3.3信用卡违约风险预测仿真

通过matlabR2008a软件验证模型的泛化能力。选取表1中前20组样本数据作为训练数据,后3组的样本数据作为检验数据,对经过训练生成的神经网络模型的预测结果进行验证。

从图2以看出,误差曲线从2.50开始变化,经过781次学习训练后基本达到期望的误差精度0.01。图3反映了目标输出与模型输出的吻合程度,其中前20个样本是训练样本,后三个样本为检验样本,表1显示了检验样本的预测结果。

4结论

本文运用Bp神经网络模型实现了信用卡违约风险预测,预测值与实际值吻合程度高,并具有很强的泛化能力。由于只是通过训练得出输入输出之间联系,得出预测结果,弱化了主观因素对预测的影响,方便进行批量客户处理。但是当出现奇异数据时(样本7、15)Bp算法预测误差变大,此外,神经网络的“黑箱”性质,使预测过程不够透明,各指标对结果的影响因子较其他方法更难解释。

参考文献:

[1]中国人民银行.2010年支付体系运行总体情况[eB/oL].(2011-02-01)./gzdt.

[2]甘昕艳,张钰玲,潘家英.基于股价指数预测的仿真研究[J].计算机仿真,2010(10):297-300.

[3]朱新玲,黎鹏.基于Bp神经网络的人民币汇率拟合与预测研究基于股价指数预测的仿真研究[J].中南民族大学学报:自然科学版,2010(3):113-120.

[4]安哥拉•阿万涅提斯,约•葛列格里.信用产品全面指南[m].金雪军,等,译.天津:南开大学出版社,2004.

[5]熊其康.加快我国个人征信业发展的思考[J].金融理论与实践,2004(12):22-24.

神经网络隐含层数的确定篇6

关键词:Bp神经网络;计算机网络;安全评估

中图分类号:tp18文献标识码:a文章编号:1009-3044(2013)18-4303-05

网络安全从本质上看是网络的信息安全。而从广义来说,涉及到的范围就较大,凡是有关网络信息的完整性、保密性、真实性、可用性和可控性方面,都是网络安全需要考虑与研究的领域。

随着全球计算机技术和internet的迅猛发展,全球信息化进程加速,互联网与千家万户息息相关,在我们的工作和生活中扮演着极其重要的角色。与此同时,网络和网络用户也在以指数级的速度增长。互联网正引领着我们的生活进入一个前所未有的,以网络为基础的信息化环境。由此,网络安全就显得尤为重要。

1网络安全评估的重要性

由于现阶段的计算机系统,其网络设备存在不完善的因素,包括设计的缺陷、漏洞及网络协议等,这样的情况下,计算机网络就潜在各种可能的安全风险。近年来,计算机网络受到的侵害越来越多,网络漏洞各种各样,计算机安全得不到应有的保障。具体表现为:

1)网络病毒更加多样、智能与隐蔽。

2)随着网络扮演越来越重要的角色,各方的生产生活都离不开网络,因此网络服务商、管理部门和运营商都十分重视网络的安全,并提出了更多的需求。

3)网络安全脆弱的根源是漏洞。

目前,针对网络安全进行的恶意活动越来越多,如何有效保证网络安全正常运行已经成为各方都十分关注的问题。在这样的情况下,我们需要事先对系统与网络进行安全检查与评估,分析现有网络是否安全可靠,并且对于检测出的问题,提出并实施相应的有针对性的安全防范措施,力求将损失降到最低,将风险扼杀在潜伏期。

2Bp神经网络技术

2.1Bp神经网络技术介绍

2.1.1神经网络技术概要

Bp(Backpropagation)神经网络这一算法是由Rumelhart和mcCelland等人于1986年提出的。它的主要思想是按照误差逆传播算法训练多层前馈网络,它可以解决多层的网络里所隐含的单元连接的学习问题。这一方法的提出,为此后打开了重要的一片领域,它成为目前应用最为广泛的模型之一。Bp神经网络一般分为三层结构,包括输入层、输出层以及隐含层。

2.1.2输入层、输出层变量及预处理

Bp神经网络输入层变量属于自变量,是需要通过专业的知识来确定的,如果说增加输入层的变量的数量,那么还要进行主成分分析,再对所有的变量进行缩减,使得数量与增加前的输入层数量相当,然后再对输入变量前与缩减变量后的系统误差进行比较,通过比值的大小达到缩减输入层变量的目的。

输入层变量属于因变量,一般系统不对输入层变量的数量进行具体要求,但是为了网络模型得到更好的训练,系统对于Bp神经网络应要进行转换。即把具有多个输入变量的模型转换成多个具有一个输出的模型,以达到更好的效果。

预处理有很多的方法,一般笔者根据实际需求以及喜好,会采用各不相同的方式。但是殊途同归,进行完数据的处理之后,对网络神经输出的结果进行一定程度的变换,最后得到的数据才是所需数据。并且,与处理后,数据值要控制在0.2~0.8之间,使得建立的模型具有一定的外推能力。

2.1.3Bp神经网络的拓扑结构

Bp神经网络的拓扑结构包含隐含层层数、隐含层结点数、动量因子、初始权值、学习率、误差精度等。

Bp神经网络的拓扑结构最应注意的是隐含层结点的数量,过多或过少都会产生问题,或者使得网络训练时间过长、无法找到最优点,或者使得网络的稳定性较差。因此,应合理优化隐含点的节点数,同时考虑网络结构的复杂程度以及误差的大小,综合各方情况确定节点数。

2.2Bp神经网络技术算法

2.2.1Bp神经网络算法学习过程

1)工作信号的正向传播:工作信号的正向传播指的是输入信号经由输入层传向输出层,最终在输出端产生输出信号。

2)误差信号的反向传播:工作信号的反向传播指的是误差信号由输出端向后传播,误差信号指的是网络实际输出信号和期望输出信号之间的差值。

本文以含有三个隐含层的Bp神经网络为例,其结构如下图所示。

9)输入下一个学习样本,返回步骤(3),直至全部z个模式对训练完毕;

10)进入下一轮学习。

2.2.1Bp神经网络算法工作过程

Bp神经网络算法的工作工程并不复杂,具体如下:

1)对神经网络参数初始化。

2)计算隐藏层单元的个数、输出层单元的输出个数、输出层单元误差,若误差在误差范围内,可输出结果。

1)若2)中的误差不在误差范围内,则重新调整中间层到输出层连接的权值和输出层单元,再调整输入层到中间层的连接权值和输出单元,更新学习次数。

1)反复步骤3),当学习次数大于上限或满足误差要求,结束学习输出结果。

2)输出最终结果。

3Bp神经网络算法的优越性

3.1网络安全评估方法

虽然关于网络安全评估的研究在国内仅十多年的历史,但人们已经提出了多种评估方法,其中较有代表性的方法是故障树分析法(Faulttreeanalysis,Fta)、层次分析法(analyticHierarchyprocess,aHp)、模糊综合评判法(FuzzyComprehensiveevaluationmethod,FCe)和基于贝叶斯、Bp神经网络、D_S证据理论等方法。

3.2网络安全评估方法比较

不同的网络安全评估方法具有不同的优缺点,针对网络安全的实际需要,选择不同的评估方法,个方法具体优缺点如下表。

2.该方法要求大量可供参考的历史资料

从以上比较中我们可以看出,基于Bp神经的网络安全评估方法具有良好的优越性,特别是针对故障树分析法、层次分析法、基于贝叶斯、模糊综合评判法等主观性较强、方法繁复的方法,基于Bp神经评估方法的客观性就显得尤为的重要。

4基于Bp神经网络的计算机网络安全评估过程

4.1构建计算机网络安全评估指标集

计算机网络是一个很复杂的体系,能够影响网络安全的因素较多,建立科学的、合理的网络安全评价指标将关系到评价的作用和功能。本文通过归纳网络安全的各个影响因素,以物理安全、逻辑安全和管理安全作为评价指标体系的一级指标,并进行逐层细化,最终建立了完整的网络安全评价指标体系,具体如表2所示。

4.2各评价指标的取值和标准化

在本文设计的各个指标集中,因为所描述的因素各不相同,既有定量的评价指标,也有定性的评价指标,因此在评价时所选择的取值规则也是不一样的。

4.2.1定量指标

对于定量指标,由于其衡量的单位不同,因此必须进行标准化的处理,并将最终取值范围控制在0~1之间,方法如表1所示。

4.2.2定性指标

对于定性指标,该文采用的是专家打分法,专家打分法较为抽象,可采用配值标准化处理,保持与定量指标的一致性。

4.3Bp神经网络结构的设定与训练

确定Bp神经网络对计算机网络安全进行评估的层数。主要利用试凑法,根据输入层输出层神经元个数,确定隐含层神经元个数。

与此同时,设定误差精度与训练次数,当训练的精度或训练次数达到要求后,即停止训练,保存数据。

4.4对计算机网络安全进行评估

将计算机的网络安全评估等级分为四种,分别是安全、基本安全、不安全与很不安全。其中,安全等级的评估值大于或等于0.8、基本安全等级的评估值大于或等于0.7且小于0.8、不安全等级的评估值大于或等于0.6且小于0.7、、很不安全等级的评估值小于0.6。根据网络评估的具体数值,对网络安全进行四种等级的判定。

5基于Bp神经网络的计算机网络安全评估实例

5.1实例探究

本文通过实例对以上的阐述进行探究:设计Bp神经网络输入层的节点为5,输出层节的点为1,隐含层的节点为19,学习精度e设为01001,权值调整参数、网络阈值均设为011,最大迭代次数为1000次,输入层与隐含层之间采用Logsig传递函数,隐含层与输出层之间采用purelin转递函数。

本文收集了40份计算机网络安全评估数据样本,对数据进行处理与分析后,根据前文所表述的评估步骤,对各网络进行了安全评估,具体数据见下图。

5.2实例分析

结合调查获得的实际情况,结果表明,基于Bp神经网络算法的计算机网络安全评估模型精准性较好,与实际情况较为符合。同时我们可以看到,当前许多网络的安全性存在一定的隐患,多数网络的安全等级属于基本安全与很不安全之间,少有安全性很高、评估值大于0.9的网络系统。

另外,应用Bp神经网络计算方法还可以对同一等级内的网络进行不同安全程度的惊喜评定,因此,Bp模型能够精确地对改造后的网络安全进行重新评价,并根据评价结果提出具有针对性的提高网络安全的有效措施。

6结论

当前,网络安全是网络管理人员急需解决的重要问题,网络安全评估作为有效防护网络安全的手段之一,是一项技术要求复杂的工作。而Bp神经网络算法既有神经神经网络自学习、自适应的特点,同时还兼有专家的知识经验,因此成为了非线性映射能力较强的综合评价模型之一。Bp神经网络算法在网络安全评估中的应用,减少了主观因素,提高了检测评估的客观性,有利于用户发现网络安全的漏洞与薄弱,做好安全措施,提高网络安全水平。

本文介绍了Bp神经网络算法,并通过与其他评估方法的对比分析其优越性,提出利用Bp神经网络对计算机网络安全进行评估,并提出相应的评估过程。最后以实例验证了Bp神经网络算法在计算机网络安全评估的应用。但本文亦有不足之处,第一,在实例中缺少其他评估方法的应用,无法突出Bp神经网络算法的优越性;第二,缺少对实例结果精确性的检验,这些工作应在将来予以补正。

参考文献:

[1]Leew.adataminingframeworkforconstructingfeaturesandmodelsforintrusiondetectionsystems[D].newYorkColumbiaUniversity,1999.

[2]LvHY,CaoYD.Researchonnetworkrisksituationassessmentbasedonthreatanalysis[C].2008internationalSymposiumoninformationScienceandengineering,2008:252-257.

[3]Biswajeetpradhan,SaroLee.Regionallandslidesusceptibilityanalysisusingback-propagationneuralnetworkmodelatCameronHighland,malaysia[J].earthandenvironmentalScience,2010,7(1):13-30.

[4]赵冬梅,刘海峰,刘晨光.基于Bp神经网络的信息安全风险评估[J].计算机工程与应用,2007(1).

[5]金峤,方帅,阎石.Bp网络模型改进方法综述[J].沈阳建筑工程学院学报:自然科学版,2001,17(3):197-199.

神经网络隐含层数的确定篇7

[关键词]软件项目风险管理神经网络粗集

本篇论文的中心是基于粗集的人工神经网络(ann)技术的高风险识别,这样在制定开发计划中,最大的减少风险发生的概率,形成对高风险的管理。

一、模型结构的建立

本文基于粗集的Bp神经网络的风险分析模型,对项目的风险进行评估,为项目进行中的风险管理提供决策支持。在这个模型中主要是粗糙集预处理神经网络系统,即用RS理论对ann输入端的样本约简,寻找属性间关系,约简掉与决策无关的属性。简化输入信息的表达空间维数,简化ann结构。本论文在此理论基础上,建立一种风险评估的模型结构。这个模型由三部分组成即:风险辨识单元库、神经网络单元、风险预警单元。

1.风险辨识单元库。由三个部分功能组成:历史数据的输入,属性约简和初始化数据.这里用户需提供历史的项目风险系数。所谓项目风险系数,是在项目评价中根据各种客观定量指标加权推算出的一种评价项目风险程度的客观指标。计算的方法:根据项目完成时间、项目费用和效益投入比三个客观指标,结合项目对各种资源的要求,确定三个指标的权值。项目风险系数可以表述成:r=f(w1,w2,w3,t,t/t0,S/S0,U/U0),R

2.神经网络单元。完成风险辨识单元的输入后,神经网络单元需要先载入经初始化的核心风险因素的历史数据,进行网络中权值的训练,可以得到输入层与隐含层、隐含层与输出层之间的权值和阀值。

(1)选取核心特征数据作为输入,模式对xp=[xp1,xp2,.,xpn]t,dp(网络期望输出)提供给网络。用输入模式xp,连接权系数wij及阈值hj计算各隐含单元的输出。

m

Ypj=1/{1+exp[-(∑wijxpi-hj)]},i=1,2,.,m;j=1,2,Λ,n,

i=1

(2)用隐含层输出ypj,连接权系数wij及阈值h计算输出单元的输出

m

Yp=1/{1+exp[-(∑wjxpi-hj)]},i=1,2,.,m;j=1,2,Λ,n,

i=1

Yp=[y1,y2,……,yn]t

(3)比较已知输出与计算输出,计算下一次的隐含各层和输出层之间新的连接权值及输出神经元阈值。

wj(k+1)=wj(k)+η(k)σpσpj+α[wj(k)-wj(k-1)]

h(k+1)=h(k)+η(k)σp+α[h(k)-h(k-1)]

η(k)=η0(1-t/(t+m))

η0是初始步长;t是学习次数;t是总的迭代次数;m是一个正数,α∈(0,1)是动量系数。σp是一个与偏差有关的值,对输出结点来说;σp=yp(1-yp)(dp-yp);对隐结点来说,因其输出无法比较,所以经过反向推算;σpj=ypj(1-ypj)(ypwj)

(4)用σpj、xpj、wij和h计算下一次的输入层和隐含层之间新的连接权值及隐含神经元阈值。wij(k+1)=wij(k)+η(t)σpjxpi+α[wij(k)-wij(k-1)]

3.风险预警单元

根据风险评价系数的取值,可以将项目的风险状况分为若干个区间。本文提出的划分方法是按照5个区间来划分的:

r

0.2≤r

0.4≤r

0.6≤r

0.8≤r

总之,有许多因素影响着项目风险的各个对象,我们使用了用户评级的方式,从风险评估单元中获得评价系数五个等级。给出各风险指标的评价系数,衡量相关风险的大小。系数越低,项目风险越低;反之,系数越高,项目风险越高。

二、实证:以软件开发风险因素为主要依据

这里我们从影响项目风险诸多因素中,经项目风险系数计算,作出决策表,利用粗集约简,抽取出最核心的特征属性(中间大量复杂的计算过程省略)。总共抽取出六个主要的指标(personnelmanagement/training,Schedule,productControl,Safety,projectorganization,Communication)确定了6个输入神经元,根据需求网络隐含层神经元选为13个,一个取值在0到1的输出三层神经元的Bp网络结构。将前十个季度的指标数据作为训练样本数据,对这些训练样本进行数值化和归一化处理,给定学习率η=0.0001,动量因子α=0.01,非线性函数参数β=1.05,误差闭值ε=0.01,经过多次迭代学习后训练次数n=1800网络趋于收敛,以确定神经网络的权值。最后将后二个季度的指标数据作为测试数据,输入到训练好的神经网络中,利用神经网络系统进行识别和分类,以判断软件是否会发生危机。实验结果表明,使用神经网络方法进行风险预警工作是有效的,运用神经网络方法对后二个季度的指标数据进行处理和计算,最后神经网络的实际输出值为r=0.57和r=0.77,该软件开发风险处于中等和较大状态,与用专家效绩评价方法评价出的结果基本吻合。

参考文献:

[1]王国胤“Rough:集理论与知识获取”[m].西安交通大学出版社,2001

神经网络隐含层数的确定篇8

关键词:神经网络;对外贸易;环境损害预测

中图分类号:F2文献标识码:a文章编号:1672-3198(2013)08-0010-02

1引言

Runge(1993)认为贸易改变了国际间的分工模式,也扩大了经济活动的规模。经济活动与污染的非线性关系说明,除贸易之外,产出结构、技术和环境政策也起着重要作用。根据Runge的分析结果,经济增长规模对环境造成的负面影响,一定程度上被产出结构所抵消。因此从总体上说,贸易自由化在造成污染的同时提高了资源配置效率。人均GDp的增长会使环境保护需求增加,并导致产出结构和生产技术的变化,反过来降低污染物的排放量。anderson,Blackhurst(1992)和Gorden(1997)认为贸易自由化政策实施的同时,采取适当的环境政策可以改进全球福利。Siebert(1990)等人甚至运用最经典的H-o模型论证了贸易自由化提高生产效率,减少资源消耗压力的可能性,认为采用贸易限制手段解决环境问题只会造成进一步扭曲,而基于比较优势的专业化分工能够促进全球资源的有效配置和合理利用,有利于环境保护。因此,更大程度地开放市场,推进贸易自由化进程是减少环境污染的有效途径。贸易有害论观点认为,如果商品生产和消费模式对环境产生负面影响,那么开放贸易后,世界产出的增加会导致环境更进一步的破坏。较早将产权制度不完备性引用H-o扩展模型以分析发展中国家和发达国家间贸易污染问题的学者Chilchilnisky(1994)认为,在私人产权没有得到明确界定的情况下,贸易会加速发展中国家环境资源的破坏,从而对全球环境构成进一步的威胁。Daly,Goodland(1994)和ayres(1996)考察了贸易对污染排放量的影响,结论是自由贸易将加剧环境污染,他们对贸易自由化带来的经济增长与环境保护关系的积极性提出了质疑,认为这种贸易增长不但不是改进社会福利的重要因素,而且与环境保护目标背道而驰。

2基于贸易环境效应的Bp神经网络构造

2.1Bp神经网络预测模型设计

基于Bp算法的多层前馈型网络的结构包括输入层结点,输出层结点,而且有一层或多层隐含结点。对于输入信息,要先向前传播到隐含层的结点上,经过各单元的特性为Sigmoid型传递函数运算后,把隐含结点的输出信息传播到输出结点,最后给出输出结果。网络的学习过程由正向和反向传播两部分组成。在正向传播过程中,每一层神经元的状态只影响下一层神经元网络。这里所采用的Bp神经网络模型,均为包含一个输入层,一个隐含层,一个输出层的3层网络结构,即标准的Bp网络结构模型。文中采用Bp神经网络模型对贸易增长引致的环境损害的预测通过建立两个Bp模型分三步来完成。经过多次模拟训练和参数选择尝试,多个输出接点造成了预测结果的较大误差,因此,最终选择一个输出层节点。首先,建立一个输入层节点数为3、输出层节点数为1、隐含层节点数若干的贸易指标时间序列预测模型。在该模型中,对4个贸易指标分别从1989开始提取样本,每4个样本为一组,前3个样本作为输入,最后1个样本作为输出其次,建立一个输入层节点数为4、输出层节点数为1、隐含层节点数若干的Bp网络隐含层的确定对神经网络系统起着非常关键的作用。对于多层神经元网络来讲,需要解决两个关键问题:一是确定隐含层层数的原则,二是隐含层接点数目的选择。基于上面的分析,在人工神经网络模型之中,我们经过多次模拟训练和尝试后,最终选取一个隐含层和一个输出层并达到了既定预测精度要求。因为一方面本模型的输入是离散的数值,另一方面激活函数是采用单一的S型函数。同时本模型的输入节点比较多,如果选取更多的隐含层,势必增加训练成本,因而整体上来说是不经济的。Bp网络的传递函数有多种。Log-sigmoidS型函数的输入值可取任意值,输出值在0和1之间;tan-sigmodS型传递函数tansig的输入值可取任意值,输出值在[-1,+1]之间;线性传递函数purelin的输入与输出值可取任意值。Bp网络通常有一个或多个隐含层,该层中的神经元均采用sigmoidS型传递函数,输出层的神经元则采用线性传递函数,整个网络的输出可以取任意值。

2.2Bp神经网络训练与模型检验

基于以上网络设计,利用matlab软件建立与贸易指标预测模型和贸易环境效应预测模型相对应的网络拓扑结构分别为3∶20∶1和4∶20∶1的Bp网络模型。初始化后的网络即可用于训练,即将网络的输入和输出反复作用于网络,不断调整其权重和阈值,以使网络性能函数net.performFcn达到最小,从而实现输入输出间的非线性映射。

3结论

本文应用Bp神经网络分别对各贸易指标进行时间序列数据预测,然后再建立贸易与环境之间的面板数据预测模型,对贸易引致的环境损害进行预测。图1表明我国的贸易增长与环保投资都在增长,而环保投资增速明显低于贸易增长速度。

图1预测图图1表明2006年起我国贸易开放度经在经过过快速的攀升后已经开始有下降的趋势,特别是金融危机后,2009年到达一个低点,我们预测2012年到2014年我国贸易开放度有所回升但是回升速度大大放缓,我国工业占GDp的比重一直处于相对平稳缓慢回落的趋势。

由上图可以看出我国的贸易增长是迅速的,并且贸易增长的速度远高于环境保护投资,而在GDp高速增长的同时工业占GDp的比重增长缓慢可以认为我国在工业保持增长的同时其他产业也得到了一定的发展,这将有利于我国环境状况的改善。贸易对我国环境的影响同样是复杂的,贸易增长会从经济规模、产业结构和技术进步等各个方面对我国的环境产生综合复杂的影响。本文将所研究的基于Bp神经网络模型的我国贸易增长与环境损害的预测结果绘制成如下图表:从图1可以看出我国工业固体废物排放量持续迅速下降,总固体悬浮颗粒也呈下降趋势,其他指标也相对趋于稳定。所预测的结果表明从2012年到2014各指标仍然趋于下降趋势,但是速度有所放缓。以上分析结果表明,我国的贸易增长对于环境的效应已经有所转变,更趋向于服从“环境库兹涅茨曲线”理论,随着时间的推移有可能会出现所谓倒U型的eKC曲线,污染物的排放将随着经济发展向上升而后下降。

参考文献

[1]Josem.paruelo,Fernandotomasel.predictionoffunctionalcharacteristicsofecosystem:acomparisonofartificialneuralnetworkandregressionmodels[J].ecol.model,1997,98:173-186.

神经网络隐含层数的确定篇9

关键词高等教育规模预测RBF神经网络

中图分类号:G640文献标识码:a

0引言

高等教育规模预测对政府部门制定高等教育发展规划与政策具有重要意义。目前,国内外常用的高等教育规模预测方法有:时间序列预测法、①回归预测分析法、②logistic模型③和灰色预测模型。④高等教育规模受到诸如经济发展、人口数量及文化环境等众多因素的影响,各种因素的影响比较复杂,导致高等教育规模与影响因素之间呈现复杂的非线性关系,上述传统的预测方法难以获得理想的预测精度。神经网络是一种大规模并行计算模型,对数据本身的知识要求不多,只要给出输入、输出数据,通过网络本身的自学习、自适应能力就可达到较高精度的非线性逼近。RBF神经网络是神经网络的一种形式,具有网络结构简单、收敛速度快等优点。作为一种局部逼近网络,RBF神经网络能以任意精度逼近连续函数。为此,本文将RBF神经网络应用于我国高等教育规模预测中。

1RBF神经网络

径向基(RBF)神经网络是一种3层前馈网络,由输入层、隐含层和输出层构成。各层由若干个结点组成,每个结点代表一个神经元,隐含层的结点数根据具体问题确定。RBF神经网络的学习相当于在多维空间中寻找训练数据样本的最佳拟合平面。每个隐含层结点的函数构成了拟合平面的一个基函数。⑤输出层结点通常由简单的线性函数描述。RBF神经网络结构如图1所示。

RBF神经网络学习中,输入层结点接受输入信号并将其传递到隐含层,隐含层结点的作用函数对输入信号在局部产生响应,即输入信号靠近作用函数的中央范围时,隐含层结点产生较大的输出值,RBF网络的输出为隐含层结点输出的线性组合:

其中,和分别为第个隐含层结点的径向基函数的中心和宽度。

2实例应用

2.1指标选取

运用RBF神经网络对我国高等教育规模进行预测。以高校在校生数作为衡量高等教育规模的指标,根据文献⑥对高等教育规模影响因素的分析,高等教育规模与国内生产总值GDp、第三产业占GDp比重、恩格尔系数、总人口数之间存在稳定的长期均衡关系。为此,本文将以上4项指标作为高等教育规模的影响因素,选取1997-2007年的高校在校生数及影响因素进行实例分析。

2.2网络训练及预测

高校在校生数及影响指标的数量级相差较大,为减少不同量纲对RBF神经网络收敛速度的影响,对数据样本进行预处理,利用下式将数据样本归一化到[0,1]区间:

其中,为原始数据样本,为归一化后的数据样本。将整个数据样本分为两组:前8个数据样本用于训练RBF网络,后3个数据样本用于检验RBF网络的有效性。

建立3层RBF神经网络,输入层为4个神经元,输入值为高等教育规模的各影响指标;输出层为1个神经元,输出值为高校在校生数。隐含层的神经元数设为4。网络的训练精度设为0.00001,径向基函数的扩展速度设为1。利用训练好的RBF神经网络预测2005-2007年的高校在校生数,再将获得的预测值反归一化到原始数据的预测值。

预测结果表明,在预测期内,RBF神经网络对我国高校在校生数的预测精度较高,2005-2007年的预测相对误差都比较小,分别为:0.55%,1.71%和-2.98%。由图2可知,RBF神经网络较准确地预测了我国高校在校生数的变动趋势,预测值比较接近于实际值。2005、2006年的预测值略高于实际值,2007年的预测值略低于实际值。

为进一步验证RBF神经网络在高等教育规模方面的预测性能,采用均方根误差(RmSe)、平均绝对误差(mae)、平均相对误差(mpe)、西尔统计量(tHeiL)4项预测性能评价指标对RBF神经网络进行评价,以上评价指标值越小,说明RBF神经网络的预测性能越好。结算结果表明,RBF神经网络的4项评价指标值RmSe、mae、mpe、tHeiL分别仅为36.9801,31.4670,0.0175和0.0057,这说明RBF神经网络在高等教育规模预测方面具有较好的预测性能,是一种有效的高等教育规模预测方法。

3结论

神经网络隐含层数的确定篇10

关键词:短期负荷预测;神经网络;遗传算法

作者简介:黄国栋(1976-),男,广东阳江人,广东电网湛江供电局,工程师。(广东湛江524005)

中图分类号:tm714文献标识码:a文章编号:1007-0079(2014)06-0261-02

电力短期负荷预测是对未来一周以内(通常为一周或一天)的负荷进行预测。短期负荷预测在电网运行实时控制和发电规划中具有重要地位,短期负荷的预测结果是调度中心制定发电计划、电力系统运行安全评估、电力企业日常经营管理的重要依据。[1]在当前电力系统市场化形势下,提高负荷预测精度对于电力系统的经济运行、合理制定机组检修计划和进行电力需求管理等具有重要意义。

一、电力系统负荷变化的特点及预测方法

电力系统负荷变化受到很多因素的影响。一方面,负荷变化存在由未知不确定因素引起的随机波动;另一方面,具有周期变化的规律性,这也使得负荷曲线具有相似性;同时,由于受天气、节假日等特殊情况的影响,负荷变化又会体现出差异性。[2]整体上讲,负荷曲线是与很多因素相关而且难以用数学公式表达的非线性函数。

相对于早期的统计技术法和专家系统法,神经网络的优点在于它不依靠专家经验,只利用观察到的数据,可以在训练过程中通过学习来逼近任意的非线性输入/输出关系,因此,将神经网络方法应用于电力负荷预测有着明显的优势。但是,神经网络存在两个主要问题:收敛速度慢和容易陷入局部极小点。因此,本文采用遗传算法优化人工神经网络,建立电力短期负荷预测模型,并将结合广东省某城市的电力负荷的实际情况对预测方法进行探讨和研究。

二、人工神经网络模型

Bp(Backpropagation)神经网络是一种按误差逆传播算法训练的多层前馈网络,神经网络模型中的所有神经元按照功能一般分成三层(输入层、隐含层和输出层),各层顺次连接。[3]其三层模型拓扑结构如图1所示。

Bp算法的学习过程分为正向传播过程和反向传播过程两个阶段。

1.正向传播过程

输入信息从输入层经隐含层逐层计算各单元的实际输出值,各神经元的状态只对下一层神经元的状态产生影响。设Bp网络的输入层有n1个节点,隐含层有n2个节点,输出层有n3个节点,输入为xi,输入层与隐含层之间的权值为wki,隐含层与输出层之间的权值为wjk;隐含层的阈值为bk,输出层的阈值为bj;隐含层的传递函数为f1(·),输出层的传递函数为f2(·)。则隐含层节点输出zk和输出层节点输出yj分别为:

k=1,2,……n2

(1)

j=1,2,……n3

(2)

2.反相传播过程

若网络实际输出值与期望值之差,即误差超出允许值,则逆向逐层修正连接权值。设Bp网络有p个输入样本,采用平方型误差函数,于是得到全局误差为:

(3)

式中:为第p个样本的实际输出,为期望输出。

采用累计误差Bp算法依次调整输出层权值wjk和隐含层权值wki误差使全局误差变小,即:

(4)

(5)

式中:η为学习率。

如此往复不断调整权值,直到使网络的误差满足要求。

三、遗传算法

1.遗传算法的基本原理

遗传算法(Geneticalgorithms,简称Ga)是一种高度并行、自适应全局优化搜索方法。[4]它借鉴自然界遗传和选择机理,首先初始化一个种群,然后按照某种指标在每一代选取较优个体,利用遗传算子(选择、交叉和变异)对这些个体进行组合,产生新一代个体,重复此过程,直到满足优化准则为止。遗传算法是基于对生物遗传和进化过程的计算机模拟,它能使各种人工系统具有良好的自适应能力和优化能力。目前,遗传算法已经广泛应用于规划设计、组合优化、自适应控制、经济运行、模式识别、人工智能、分子生物学、故障诊断以及计算机技术等领域,并取得了很好的效果。

2.遗传算法的实现过程

(1)将问题的解以编码形式表示出来,并随机生成若干个体,即初始群体。

(2)译码,计算目标函数得出个体适应度值,判断是否满足停止条件。

(3)根据个体适应度值的高低,应用选择、交叉和突变算子进行遗传操作,产生下一代群体。

(4)返回步骤(2),反复执行,直到满足停止条件。最后,搜索到最优个体,即问题的最优解。[5]

3.遗传算法优化Bp网络权值、阈值

由于遗传算法是以最大值作为优化目标,为适应神经网络算法的要求,将适应度函数取反,即变为以最小值为优化目标。遗传算法优化Bp神经网络算法的步骤:

(1)构建Bp网络,确定遗传算法个体长度。

(2)生成初始种群,确定种群规模。对遗传算法个体进行编码,编码由神经网络的输入层与隐含层的连接权值、隐含层阈值、隐含层与输出层的连接权值和输出层阈值四部分组成。

(3)根据个体得到Bp网络的权值和阈值,应用训练数据训练,得到网络的输出。计算实际输出与期望输出的误差,并依据此误差计算个体适应度值。

(4)根据个体的适应度进行选优操作,选择若干适应度强的个体直接进入下一代,适应度差的个体被淘汰。

(5)进行交叉、变异操作,生成下一代群体,然后返回步骤(3),直到得到最优解。

四、实例分析

本试验分别采用单一神经网络预测法、遗传算法和神经网络的组合预测法,分别对广东省某城市某一日的时负荷进行预测与分析。以该市2010年6月2日~21日和2010年6月3日~22日(只选取工作日)的整点负荷训练样本集,根据6月23日各整点的时负荷数据和24日各整点的温度与天气,预测6月24日的时负荷。

1.数据预处理

根据神经网络的建模原理,训练样本的准确性对于模型的预测准确性至关重要。由于系统故障、线路停电检修、通信错误等原因,历史负荷数据中经常存在一些不良数据。这些不良数据具有很强的随机性,会对网络的预测精度和预测速度产生严重影响。因此,在建立电力短期负荷预测模型前,先对训练用的数据样本进行预处理。应用格拉布斯准则判别是否有不良数据,如果有要直接消除并以相应的插值代替,从而提高数据的准确度和可信度。经计算,本实例的样本数据正常,符合实际情况。

数据归一化方法是神经网络预测前对数据常做的一种处理方法。数据归一化处理把所有的数据都转化为[0,1]之间的数,其目的是取消数据间数量级差别,避免因为输入/输出数据数量级差别较大而造成网络预测误差较大。最后需要进行反归一化,得到最终预测结果。[6]数据归一化的方法主要有最大最小值法和平均数方差法。本文采用最大最小值法。

2.确定Bp神经网络结构

考虑到该城市位于中国南端,纬度较低,影响电力负荷最主要的因素是温度等天气情况。采集预测日前一天每小时的负荷数据和预测日当天各小时的温度值(取平均值)、气象类型(晴、阴、雨)作为预测条件。由此确定Bp神经网络模型的输入节点数为3;输出节点数为1;隐含层节点数取8。为方便计算,将气象类型数字化、归一化处理,温度值和负荷数据归一化处理。本文采用分散式建模方法,即为一天的24小时各建立一个模型,共建立24个。分散式建模方法相对于集中建模方法(24小时用一个模型),虽然模型多,但是预测准确度高。每个整点的时负荷采用相应的Bp神经网络模型进行预测。建模工具选用matlab7.0。[7]

3.遗传算法优化神经网络

以整点负荷、温度数据和气象数据作为网络的训练样本集,应用遗传算法对基于单一神经网络建立的各个模型(每小时各建一个模型,共24个)进行优化,得到每个模型近似最优权值和阈值。应用优化的权值和阈值对Bp神经网络进行训练,并保存训练好的网络。最后,应用训练好的网络对各整点时负荷进行预测。

表12010年6月24日负荷预测值与误差

时间实际值Bp神经网络

方法预测误差/%遗传算法神经网络方法预测误差/%

0:00404.743412.3751.886397.470-1.797

1:00382.280376.397-1.539382.009-0.071

2:00359.937369.2082.576352.735-2.001

3:00355.508352.308-0.900357.1150.452

4:00347.836341.504-1.820346.528-0.376

5:00347.545342.354-1.494346.586-0.276

6:00354.184356.6500.696360.6551.827

7:00364.504363.920-0.160360.123-1.202

8:00395.881392.358-0.890390.042-1.475

9:00462.394471.5721.985464.2390.399

10:00500.344502.9040.512494.610-1.146

11:00514.415515.9500.298513.479-0.182

12:00477.935489.8982.503485.7921.644

13:00479.680473.516-1.285472.638-1.468

14:00470.148477.4031.543462.066-1.719

15:00482.950490.3021.522474.556-1.738

16:00487.295483.800-0.717486.028-0.260

17:00501.225503.2650.407505.4650.846

18:00470.361462.391-1.694466.165-0.892

19:00455.995443.791-2.676463.7881.709

20:00493.266494.1780.185494.6820.287

21:00489.909498.1151.675486.195-0.758

22:00474.146486.4932.604480.3481.308

23:00446.201436.293-2.221441.855-0.974

单一神经网络方法和遗传算法优化神经网络方法得出的预测结果见表1和图3。从图3中3条曲线对比可以看出,应用遗传算法优化神经网络预测模型得到的预测结果比单一神经网络的更接近实际负荷曲线。单一神经网络预测的负荷最大误差为-2.676%,平均误差1.408%,而用基于遗传算法优化神经网络预测的负荷最大误差为-2.001%,平均误差为1.034%,精度显然大于单一神经网络。

五、结论

本文利用遗传算法优化了Bp神经网络结构,并且应用此模型对实际电力短期负荷进行了预测试验分析。实证证明,遗传算法的全局优化搜索能力有效弥补了Bp神经网络容易陷入局部极小值的缺陷,在此基础上建立的预测模型的可靠性、准确性都有所增强,证明了基于遗传算法优化的神经网络的短期负荷预测方法是可行的。

参考文献:

[1]牛东晓,曹树华,赵磊,等.电力负荷预测技术及其应用[m].北京:中国电力出版社,2002.

[2]陈金赛,张新波.基于改进Bp人工神经网络的电力负荷预测[J].杭州电子科技大学学报,2011,34(4):173-176.

[3]田景文,高美娟.人工神经网络算法研究及应用[m].北京:北京理工大学出版社,2006.

[4]王小平,曹立明.遗传算法[m].西安:西安交通大学出版社,

2002.

[5]李玲纯,田丽.基于遗传算法和Bp神经网络的短期电力负荷预测[J].安徽工程科技学院学报,2009,24(3):57-60.