数学建模经典算法十篇

发布时间:2024-04-26 04:04:03

数学建模经典算法篇1

(河南理工大学大学土木学院,焦作454000)

摘要:为能够更加精确、快速地对建筑工程项目造价进行估算,提出基于模糊数学的建筑工程项目造价估算方法。从建筑工程项目的成本分析着手,研究总结影响工程项目造价的因素,利用模糊数学的方法建立估算模型,并通过与典型工程案例对比,定量估算欲估工程与已建工程的相似贴近度,以择近原则实现对预估工程的造价估算,并采用动态系数修正估算结果。

关键词:工程造价;模糊数学;估算;择近原则;修正

中图分类号:tU723.3文献标识码:a文章编号:1006-4311(2015)17-0016-03

作者简介:张春生(1974-),男,河南漯河人,河南理工大学土木学院党政办公室主任,副教授,主要从事结构工程研究。

0引言

随着我国城市化进程的加剧与房地产市场的繁荣,工程造价作为整个建筑工程项目的重点环节,已经得到了整个建筑行业的普遍重视[1-2]。当前,建筑工程项目造价估算的准确性、快速性也已经成为关注的焦点[3]。

在传统工程造价估算方面,常利用预估工程的既有的情况以及相应的影响因素,借助专家经验以及其他项目的工程资料等,进行较为粗略的估算[4],这类方法对我国建筑行业的造价研究起到了巨大的推动作用,但是随着对项目预算精度要求的提升以及多因素影响下的工程造价日趋复杂,传统的工程造价估算方法已经不再适用于我国建筑工程项目估算的发展需要。近年来,随着计算机技术、建筑估算方法、理论的结合,大量的数学方法引入到了建筑工程项目估算中,如模糊数学方法、专家系统方法、数理统计方法、人工神经网络方法、自适应过滤技术等[5-8],这些方法在实践过程中都有一定的优点,但也存在诸多不足。相较而言,模糊数学方法在建筑工程项目造价估算中的应用取得了较为理想的效果,能够对预估项目造价进行快速、准确的估算,为项目的预算与决策提供支撑。基于此,笔者研究了影响建筑工程项目造价的重大因素,建立了基于模糊数学的造价估算模型,并根据具体的建筑情况引入动态修正系数,实现对建筑工程项目造价估算。

1基于模糊数学的建筑工程项目造价估算模型的建立

建立建筑工程项目造价估算模型首先应明确模型建立的指标框架,并选择合适的计算方法。本文建立了项目造价影响指标体系,并通过典型工程项目对比分析的方法,计算并修正估算结果。

1.1建筑工程项目造价影响指标因素的确定

影响建筑工程项目造价的指标因素众多,概括来讲,可以分为如下三个方面:第一,设备以及工器具的购置费用。这些工器具、设备的购置使按照设计要求而定的,需要录入到固定资产。第二,工程的建筑、安装费用。它由两大部分构成,即工程的安装费用以及建筑工程费用。第三,其他费用。该部分属于一些不能归于上述两类费用的合规费用。从细处上看,建筑工程项目造价的影响指标因素可分为建筑结构的基础类型、结构类型、建筑物的层数、层高,住宅户型、进深、层高、屋面的内外装饰情况、楼地面的装饰情况、门窗类型、水电期气防情况、设备购置情况、运距以及建筑用地的情况等。在实际的建筑工程项目造价估算中,往往选择上述因素中具有代表性的特征元素进行考虑分析,本文将上述因素归为如下几类特征元素:

R=[基础类型,结构形式及层数,水电气防,层高、装修情况,门窗类型]。评价指标如图1所示。

1.2基于模糊数学的工程造价估算方法

1.2.1典型工程的选取

分析已有的建筑工程项目的造价情况,选取其中n个作为用于与预估工程作对比的典型工程,将这些工程编号为a1,a2,a3,……,ai(i=1,2,…,n)。

1.2.2工程造价影响因素特征元素间模糊关系的确立

工程造价影响因素特征元素间模糊关系的确立一般选用指标间对比的方法:一般选用某类特征因素作为参考比较的基准,其造价占比较大、计算较为复杂,并将这一特征元素设为1,其他的几种特征元素与该元素进行比较,分别在0到1的区间上进行取值,具体的取值数值要根据具体的情况而定。若选取的典型工程有m个,工程造价影响因素的特征元素有n个,则可以构建一个m行n列的特征元素模糊关系矩阵:

1.4动态修正系数的确定

修正系数的引入是为了修正因建筑工程的使用年份等客观存在的因素带来的影响。在之前的估算模型中,未考虑年份等因素所对应的人工费用、材料、政策等情况,但是实际上各个年份的原材料成本、人工以及相应的政策等都有较大的变动,对于建筑工程的实际造价有显著影响,因此,需要引入动态修正系数f以修正上述问题,f取值一般在0.6~1.6之间。

1.5建筑工程项目造价估算模型可行性验证

对于建立的工程造价估算模型,需要采取合适的方法对其进行可行性验证,以证实其估算结果的可信度,完善修正模型。以欲估工程作为估算的典型工程,参照上文所述方法与步骤进行估算,然后将估算的结果与实际的典型工程造价进行对比,若估算误差在5%以内,则可以信任估算结果,估算模型可行。

2实例应用分析

本文选取了郑州市某钢筋混凝土框架剪力墙结构住宅进行了实例估算与分析,分析选取其中6个与欲估工程作对比的典型工程,分别为a1,a2,a3,…,a6。采用指标间对比的方法确立各工程造价影响因素特征元素间的模糊关系。如表1所示。

2.1欲估工程与典型工程相似贴近度计算

将欲估工程作为典型工程反向估算已建工程进行验算,得出估算误差为4%,小于5%。可以认为,基于模糊数学的建筑工程造价估算方法可行、结果准确。

3结论

①归纳了建筑工程项目造价影响因素,确定了基础类型、结构形式及层数、水电气防、层高、装修情况、门窗类型等六个特征元素。

②利用模糊数学的方法确定了特征元素间的模糊关系,通过典型工程的选取以及相似贴近度计算,构建基于模糊数学的造价估算模型,估算方法快速、准确。

③基于模糊数学的造价估算方法引入了动态修正因子,使得估算过程动态化,估算结果更加贴近实际水平。

参考文献:

[1]刘兵.房地产造价管理的可视化探析[J].中国新技术新产品,2014,34(4):52-55.

[2]高红云,黄晓军.浅谈房地产造价控制[J].经营管理者,2011,14(11):18-21.

[3]唐林风.建筑工程造价快速估算的研究[J].价值工程,2010,22(10):28-31.

[4]董士波.全生命周期工程造价管理研究[D].哈尔滨工程大学,2003.

[5]涂胜利.房屋建筑设计造价控制的理论方法及其应用研究[D].湖南大学,2011.

[6]吴子燕.基于人工神经网络的高校建筑工程造价预测系统的研究与应用[D].西北工业大学,2006.

数学建模经典算法篇2

关键词:神经网络;模拟电路;故障智能诊断

applicationsofneuralnetworkinanalogcircuitfaultintelligentdiagnosis

HuangQian1,LuLi2

nanchanginstituteoftechnologyJiangXinanChang330029

abstract:thearticlemainlydescribedevelopmentcourseofneuralnetworksimulationcircuitandthecommonmethodoffaultdiagnosisofsimulationpowerbasedonneuralnetworkatthisstage,thefocusanalysisedBpneuralnetworkfaultdictionarymethodandtheSomneuralnetworkfaultdictionarymethodandrespectiveofcalculationmethod,andbasicthought,andtechnologydifficultiesanalysis,discussedapplicationproblemofneuralnetworkmethodininanalogcircuitfaultintelligentdiagnosis,lasttalkaboutdevelopmenttrendofsimulationcircuitneuralnetworkdiagnosismethod.

Keyword:neuralnetwork;analogcircuits;intelligentfaultdiagnosis

引言

随着神经网络等人工智能技术的发展,模拟电路故障诊断的研究又开辟了一条新路,基于神经网络的模拟电路故障诊断方法已经成为新的研究热点。20世纪80年代末期起有学者研究将人工神经网络应用到模拟电路的故障诊断中,现阶段已经提出多种基于神经网络的模拟电路故障诊断方法,有些方法如Bp(errorBackpropagationnetwork)神经网络故障字典法已经能有效应用于滤波电路、模拟放大电路等非线性容差电路的故障诊断,效果优于传统的故障字典法。

1神经网络故障字典法

神经网络故障字典法把模拟电路的故障诊断看成是一个分类问题,利用神经网络的分类功能来诊断故障。在测前把神经网络训练成一部故障字典,字典的信息蕴含在网络的连接权值中,只要输入电路的测量特征,就可以从其输出查出故障。

1.1Bp神经网络故障字典法

Bp是一种多层网络误差反传学习算法。

1)初始化,随机给定各连接权[w],[v]及阀值θi,rt。

(2)由给定的输入输出模式对计算隐层、输出层各单元输出

式中:bj为隐层第j个神经元实际输出;ct为输出层第t个神经元的实际输出;wij为输入层至隐层的连接权;vjt为隐层至输出层的连接权。

式中:dtk为输出层的校正误差;ejk为隐层的校正误差。

(3)计算新的连接权及阀值,计算公式如下:

(4)选取下一个输入模式对返回第2步反复训练直到网络设输出误差达到要求结束训练。

应用Bp神经网络故障字典法进行模拟电路故障诊断步骤如下:

(1)确定待测电路的故障集和状态特征参量,采用电路仿真或实验的方法获取电路每一故障状态下的状态特征数据,经筛选和归一化处理后构造训练样本集。设计Bp神经网络并进行训练。

(2)用训练样本集中的样本训练好网络,即完成学习的过程。一般采用3层Bp神经网络,输入层节点数与电路状态特征参量的维数相同,输出层节点数可与电路待测故障类别数相同,也可小于待测故障类别数,隐层节点数则需按经验公式试凑。实际诊断时给被测电路加相同的测试激励,将测得的实际状态特征参量输入到训练好的Bp神经网络,则其输出即可指示相应的故障状态。

1.2Som神经网络故障字典法

Som(Self-organizingFeaturemap)神经网络是芬兰教授Kohonen于1981年提出的一种自组织特征映射神经网络。这种自组织特征映射神经网络通过对输入模式的反复学习,使连接权矢量空间分布密度与输入模式的概率分布趋于一致,即连接权矢量的空间分布密度能反映输入模式的统计特性。

Som二维网络拓扑结构图

Som网络能对输入模式自动分类,通过输入模式的自组织学习,在竞争层将分类结果表示出来。应用Som神经网络建立模拟电路故障诊断字典的具体步骤如下:

(1)确定电路的故障集和激励信号。通过仿真获取电路在每一故障状态下的状态特征向量,并进行预处理得到训练样本数据。

(2)确定Som网络结构。Som网络只有输入层和输出层两层,没有隐层,输入层的形式与Bp网络相同,其结点数应与电路状态特征向量的维数相同。输出层即竞争层的神经元一般采用二维平面阵结构排列,也可采用一维线阵或三维栅格阵的结构排列。采用一维线阵时,输出层结点数可与电路的故障类别数相同。

(3)经过Som训练形成具有容差的故障字典。Som网络的学习算法可采用标准的Kohonen算法。可以看出,Som网络法与Bp网络法构建故障字典的方法步骤完全相似,Som网络法一般适用于交流电路,以电路响应的频域参量为状态特征,它能更有效地克服容差因素对故障定位的影响,Som网络法实际诊断时容易出现模糊故障集,诊断过程要比Bp网络法复杂。

1.2神经网络故障字典法难点

同经典的故障字典法相比,神经网络故障字典法突出的优点是测后诊断速度快,实时性强,其原因是该方法利用了神经网络高度并行的信息处理能力。经典的故障字典法需要进行繁琐的模糊集分割处理,且一般只能诊断硬故障。而神经网络故障字典法由于神经网络的泛化能力,可以诊断容差模拟电路,而且对软故障情况也有很好的应用前景。应用该方法难点包括以下几个方面:

(1)神经网络的结构和参数等只能依据经验反复调试,难以确定所设计的神经网络是最优的。

(2)数据预处理技术和训练样本集的筛选至关重要,神经网络故障字典法的诊断效果主要依赖于此。如何根据实际电路对原始数据进行预处理以突出故障特征信息及如何优选训练样本。

2神经网络优化诊断法

传统的优化诊断法依据被测电路的解析关系,按照一定的判据(目标函数),估计出最有可能出现故障的元件。优化诊断法是一种测后模拟的逼近法,可在较少的测量数据下诊断故障,避免元件的容差问题,可以诊断软故障和多故障但传统优化诊断法存在一个复杂的重复过程,需要多个优化过程和多次电路模拟,测后计算量很大。

神经网络优化诊断法对传统方法进行改进,利用Hopfield神经网络的优化计算功能寻优,克服了传统的优化诊断方法测后计算量大、实时性差的缺点。由于该方法最终是通过求解元件参数或参数增量来判定故障元件的。

神经网络优化诊断法的基本思想是将模拟电路的故障诊断方程转换为带约束条件的优化问题,然后利用Hopfield神经网络进行优化问题的求解。将优化问题映射到一种神经网络的特定组态上,此组态相应于优化问题的可能解,然后再构造一个适合于待优化问题的能量函数(对应于目标函数),当Hopfield神经网络从某一初始状态沿着能量函数减小的方向运动,其稳定平衡解即对应于优化问题的解。对于线性电阻电路,可以以元件参数增量和可测节点电压变化量建立故障诊断方程,该诊断方程通常为一组欠定方程。

应用Hopfield神经网络求解此类带约束条件的优化问题的步骤如下:

(1)分析问题:分析网络输出与问题的解相对应。

(2)构造网络能量函数:将实际待解决优化问题的目标函数表达成能量函数的相应形式,能量函数最小值对应问题最佳解。

(3)设计网络结构:将能量函数与目标函数相比较,求出能量函数中的权值和偏流。

(4)运行网络求出稳定平衡态:由网络结构建立网络的电子线路,运行该电子线路直至稳定,所得稳态解即为优化问题所希望的解。

3其它神经网络故障诊断法

aRt(adaptiveResonancetheory)神经网络故障诊断法。aRt神经网络是一种基于自适应共振理论aRt的学习算法,包括aRt1型、aRt2型和aRt3型三种结构形式。文献三中的作者探讨了一种采用aRt1型神经网络进行模拟电路故障诊断的方法,将电路的各种故障分出层次,并按一定特征给故障类型进行编码形成故障数据样本,将故障数据样本输入aRt1型神经网络进行训练,训练完成后该aRt网络即可用于诊断。aRt最大的特点是既能识别已有的故障模式,又能较好地诊断新发故障。基于神经网络的网络撕裂法。网络撕裂法是一种大规模模拟电路分层诊断的方法,将网络撕裂法与神经网络故障字典法相结合就形成基于神经网络的网络撕裂法。

aRt的基本思路是,当电路网络分解到一定程度后,电路子网络继续分解往往越来越困难,这时可以引入神经网络故障字典法,分别为每一电路子网络构建一个神经网络,则电路子网络级的诊断采用神经网络故障字典实现。

与传统的网络撕裂法相比,该方法测后工作量小,诊断过程更加简单,诊断速度加快。基于神经网络求解非线性方程的模拟电路故障诊断方法。

4模拟电路神经网络诊断法发展趋势

近年来,一个值得重视的现象是神经网络与专家系统、模糊控制、遗传算法和小波分析等技术相结合应用于模拟电路的故障诊断领域的研究。如神经网络与模糊逻辑理论相结合,即所谓的“模糊神经网络”用于模拟电路的故障诊断,其基本思想是在Bp神经网络的输入层与输出层中间增加1到2层模糊层构造模糊神经网络,利用神经网络处理低层感知数据,利用模糊逻辑描述高层的逻辑框架,其对模拟电路软故障的诊断效果优于单一的神经网络分类器。又如小波分析与神经网络结合应用于模拟电路的故障诊断。

小波与神经网络的结合有以下两个途径:

(1)辅助式结合,比较典型的是利用小波分析对信号进行预处理,然后用神经网络学习与判别。

(2)嵌套式结合,即把小波变换的运算融入到神经网络中去,其基本思想是用小波元代替了神经元,即激活函数为已定位的小波函数基,通过仿射变换建立小波变换与神经网络的联接,小波神经网络由于把神经网络的自学习特性和小波的局部特性结合起来,具有自适应分辨性和良好的容错性。

参考文献

[1]王显强.谈谈神经网络在模拟电路故障诊断中的应用问题[J]

电路技术.2012(06)

[2]刘华.基于神经网络的模拟电路故障诊断方法研究[J]微电子学报.2010(03)

[3]董伟.谈aRt1型神经网络进行模拟电路故障诊断方式分析.[J]电路科技.2012(05)

[4]王承.基于神经网络的模拟电路故障诊断方案探究.[J]电路科技.2013(06)

[5]张宇.基于神经网络的模拟电路故障诊断方案探究.[J]计算机测量与控制.2012(07)

[6]王承.基于神经网络的模拟电路故障诊断方案探究.[J]电路故障.2013(02)

[7]刘盛灿.神经网络的模拟电路故障的应用.[J]电路科技.2013(06)

[8]万磊.神经网络在模拟电路故障诊断中的应用若干问题探讨[J]

电路技术.2011(08)

[9]郭明强.神经网络在模拟电路故障诊断中的发展历程分析[J]电路技术.2013(08)

数学建模经典算法篇3

1.1建立模糊比较矩阵

本文选取对工程投资影响较大的几个主要因素,如项目主要技术标准(t1)、工程地质条件(t2)、桥隧比(t3)、征地拆迁情况(t4)、材料价格水平(t5)等,组成建设项目的特征集合,如式(1):设V1、V2、V3、…Vm为m个相似的建设项目,按各特征对拟建项目同类特征的影响程度,两两进行比较可得到其特征模糊比较矩阵,如式(2):式中:tmn———第m个工程第n个特征元素对应的隶属函数值(隶属度)。为使得到的矩阵正规化,将各个对比结果化成[0,1]区间内的数值,以便以下计算与比较。

1.2隶属度的计算

隶属度也称贴近度,可作为模糊识别的间接方法。实际上就是将2个建设项目特征靠近的程度,用2个模糊子集表示。设a与B是论域U上的模糊子集,定义a与B的隶属度θ为:式中:tn1,tn2———为识别的对象,本文指模糊造价系数。式(4)是模糊数学中的一种算法,“a·B”和“aB”为a与B的内积和外积,内积是a与B所对应的隶属函数,先取小再取大;外积是a与B所对应的隶属函数,先取大再取小。隶属度值越大,说明两者之间的相似程度越接近。本文选取与拟建项目最相似的前3项已建项目,隶属度按照从大到小依次排序是θ1、θ2、θ3,而相应的典型工程投资估算指标(万元/km)设为e1、e2、e3。其中e1为与拟建项目最相似,e2次之,e3排第三。

1.3拟建项目投资估算公式

依据隶属度确定的最接近拟建项目的前3个已建项目的工程投资,从已建项目资料中查出e1、e2、e3。建立拟建项目投资估算预测公式,方法是,取与拟建项目最相似的前3项典型工程,由第3项工程估算推测第2项工程估算、再由第2项工程估算推测第1项工程估算、最后由第1项工程估算推测拟建工程估算,按照指数平滑法理论推导出的预测计算式为:式中:λ———调整系数。考虑到从已建项目中查到的3个项目与拟建项目只是相似而不是相同,故利用已建典型工程建立的模型(式(5))与实际工程投资估算还存在一定的差距,所以,隶属度不同的已建典型工程对拟建工程造价影响程度是不同的,故需乘上调整系数λ。根据有关资料和经验,计算λ的经验公式为:式中:m———工程特征模糊合集t中的特征元素的个数;tw———拟建工程项目模糊造价系数和;tθ1、tθ2、tθ3———与θ1、θ2、θ3相应的已建典型工程的模糊造价系数和。将tw和tθ1、tθ2、tθ3中数值最大者设为1,其他各工程的模糊关系系数是与最大值的比值。

2工程实例

拟建铁路工程线路长652.5km,国铁Ⅰ级双线,桥隧比例42.3%,采用2012年第2季度材料价格水平,拟建项目与4个已建相似项目的对比如表1所示。以项目一与拟建项目的贴近度为例,采用表1中对应的主要技术标准、工程地质条件、征地拆迁情况等5项的模糊造价系数,按式(4)计算如下:a·B=(0.85∧0.85)∨(0.9∧0.9)∨(0.95∧0.95)∨(0.75∧0.85)∨(0.4∧0.4)=0.85∨0.9∨0.95∨0.75∨0.4=0.95aB=(0.85∨0.85)∧(0.9∨0.9)∧(0.95∨0.95)∧(0.75∨0.85)∧(0.4∨0.4)=0.85∧0.9∧0.95∧0.85∧0.4=0.4将0.95和0.4代入式(3)θ1=12×[0.95+(1-0.4)]=0.78同理可计算出其他3个已建项目与拟建项目的隶属度θ2=0.73θ3=0.75θ4=0.7将数字由大到小排序θ1>θ3>θ2>θ4。根据贴近原则,取前3个θ1、θ3、θ2,即取项目一、项目三及项目二的估算资料对拟建项目进行预测。由表1中各项目的模糊造价系数,可计算出拟建项目的模糊造价系数和为4,项目一的模糊造价系数和为3.85,项目三的模糊造价系数和为3.55,项目二的模糊造价系数和为3.6。将tw和tθ1、tθ2、tθ3中数值最大者设为1,则:tw=1,tθ1=3.85/4=0.96tθ2=3.55/4=0.89tθ3=3.6/4=0.9将所得数字代入式(6):λ=1+151.8×10.96()-1+0.8×10.89()-1[+0.4×10.90(-1)]=1.05将表1中各项目的经济指标和求得的θ1、θ2、θ3及λ值代入式(5),可求得拟建项目每正线公里的估算指标:e*=1.05[7175×0.78+6829(1-0.78)×0.75+8430(1-0.78)(1-0.75)0.73+(7175+6829+8430)(1-0.78)(1-0.75)(1-0.73)÷3]=7560万元那么,拟建工程投资估算总额为:7560×652.5=493.3亿元在实际工程设计中,该工程按照《铁路基本建设工程投资预估算估算编制办法》(铁建设[2008]10号)和《铁路基本建设工程投资预估算估算设计概预算费税取值规定》(铁建设[2008]11号)编制的投资估算总额为510.8亿元,两者的估算误差为3.4%,在可控范围内,满足精度要求。

3结束语

数学建模经典算法篇4

针对传统基于稀疏字典对的超分辨率(SR)算法训练速度慢、字典质量差、特征匹配准确性低的缺点,提出一种基于改进稀疏编码的图像超分辨率算法。该算法使用自适应阈值的形态组成分析(mCa)方法提取图像特征,并采用主成分分析算法对训练集进行降维,提高特征提取的有效性,缩短字典训练时间,减少过拟合现象。在字典训练阶段,使用改进的稀疏K-奇异值分解(K-SVD)算法训练低分辨率字典,结合图像块的重叠关系求解高分辨率字典,增强字典的有效性和自适应能力,同时极大地提高了字典的训练速度。在Lab颜色空间对彩色图像进行重建,避免由于颜色通道相关性造成的重建图像质量下降。与传统方法相比,该算法重建图像质量和计算效率更优。

关键词:

超分辨率;稀疏表示;形态组成分析;主成分分析;颜色空间;机器学习

中图分类号:

tp391.41

文献标志码:a

imagesuper-resolutionalgorithmbasedonimprovedsparsecoding

abstract:

thetraditionalSuper-Resolution(SR)algorithm,basedonsparsedictionarypairs,isslowintrainingspeed,poorindictionaryqualityandlowinfeaturematchingaccuracy.inviewofthesedisadvantages,asuper-resolutionalgorithmbasedontheimprovedsparsecodingwasproposed.inthisalgorithm,amorphologicalComponentanalysis(mCa)methodwithadaptivethresholdwasusedtoextractpicturefeature,andprincipalComponentanalysis(pCa)algorithmwasemployedtoreducethedimensionalityoftrainingsets.inthisway,theeffectivenessofthefeatureextractionwasimproved,thetrainingtimeofdictionarywasshortenedandtheover-fittingphenomenonwasreduced.animprovedsparseK-SingularValueDecomposition(K-SVD)algorithmwasadoptedtotrainlow-resolutiondictionary,andthesuper-resolutiondictionarywassolvedbyutilizingoverlappingrelation,whichenforcedtheeffectivenessandself-adaptabilityofthedictionary.meanwhile,thetrainingspeedwasgreatlyincreased.throughthereconstructionofcolorimagesintheLabcolorspace,thedegradationofthereconstructedimagequality,whichmaybecausedbythecolorchannelscorrelation,wasavoided.Comparedwithtraditionalmethods,thisproposedapproachcangetbetterhigh-resolutionimagesandhighercomputationalefficiency.

Keywords:

super-resolution;sparserepresentation;morphologicalComponentanalysis(mCa);principalComponentanalysis(pCa);colorspace;machinelearning

0引言

超分辨率(Super-Resolution,SR)即通过硬件或软件的方法提高原有图像的分辨率,通过一系列低分辨率图像来得到一幅或多幅高分辨率的图像过程。因其能够提供更高的像素密度和更多的细节,超分辨率技术在医学图像、卫星图像、监控等领域获得了广泛的应用。由于成本较高、工艺水平限制等原因,通过硬件提升获取高分辨率图像并不是经济的手段,所以现有的SR方法主要集中在软件领域,主要分为三类:基于插值的方法、基于重建的方法和基于学习的方法。

基于插值的方法简洁快速,但易产生模糊的边缘和不清晰的细节。常见方法有:双线性插值、双立方插值、基于自适应的2-D回归模型[1]等。基于重建的方法根据图像降质模型,利用各种先验知识来估计超分辨率图像,这类算法可以重建出较好的边缘,降低锯齿效应,但其使用的先验知识往往具有局限性,如轮廓梯度信息[2]、边缘信息[3]等。

基于学习的方法使用高分辨率和低分辨率图片训练集来预测低分辨图像中丢失的高频信息。通过训练字典,这类算法可以产生低分率图像中没有的细节信息,但是对训练集的依存度比较高,同时对噪声的抑制能力差。Freeman等[4]利用马尔可夫随机场,通过置信传播来建立低分辨图像块和高分辨率图像块之间的映射关系,需要的图片数量较大,且训练时间较长。Chang等[5]则采用流形学习算法,使用局部线性嵌入(LocalLinearembedding,LLe)规则,映射低分辨率图像块的局部特征到高分辨率图像块,然后通过近邻的线性组合来产生高分辨率图像块;该方法虽需要较少的样本图片,但易产生欠拟合或过拟合现象。Gao等[6]在LLe的基础上,提出了一种稀疏邻域选择算法来重建图像,该算法虽然解决了欠拟合和过拟合现象,但对于复杂结构图像的重建效果差。Yang等[7-9]使用稀疏表示算法,利用高、低分辨率图像块之间的稀疏关联建立词典对,低分辨率的稀疏表示可用来重建高分辨图像;虽然这种方法重建效果较好,但训练时间过长,字典缺乏有效性。杨玲等[9]使用K-奇异值分解(K-SingularValueDecomposition,K-SVD)方法训练字典,利用RGB颜色通道的稀疏表示提取彩色图像块,训练速度较快;然而直接使用低分辨率图像本身作为训练集,虽保持了颜色信息,但造成特征冗余,易出现过拟合现象。wang等[10]结合Yang[7]和Freeman[4]方法的优点,采用稀疏表示方法对图像中的中、低频信息进行编码,虽然提高了字典的有效性,但自适应能力差,训练时间长。

针对传统方法的缺点,本文提出一种使用改进稀疏编码的单张图像超分辨率算法。使用自适应阈值的

形态组成分析(morphologicalComponentanalysis,mCa)方法提取低分辨率图像的纹理和几何结构特征,采用高分辨率的高频分量构建训练集。针对训练集过大的缺点,使用主成分分析(principalComponentsanalysis,pCa)算法对训练集进行降维,降低计算复杂度和字典尺寸。为了提高训练速度,使用改进的稀疏K-SVD算法进行稀疏字典的训练。同时,字典具有很好的灵活性和自适应性。根据图像块的重叠关系,优化求解高分辨率字典,所得字典质量更好。在图像重建时,利用Lab颜色空间的特点,避免颜色通道的操作对图像一致性造成的影响。

2本文算法

基于稀疏表示的超分辨率模型的主要内容包含三个方面:特征提取、训练稀疏字典和重建超分辨率图像。本文使用自适应阈值的mCa方法提取低分辨图像特征与高分辨率图像块的高频分量作为训练集,用pCa方法对训练集进行降维;使用改进的稀疏K-SVD算法训练低分辨率字典,然后利用图像块的重叠关系求解高分辨率字典;在Lab颜色空间重建图像,所得图像质量更优。

2.1稀疏字典学习

稀疏字典的训练方法可以分为两类:基于分析的方法和基于学习的方法。基于分析的方法一般首先构建数据的数学模型,然后使用一个分析结构去表示这个模型,wavelets、Contourlets等均属于这类方法。在基于学习的方法中,稀疏字典是采用机器学习方法,从训练集中学习得到。这类方法具有很好的自适应能力,实际应用表现更好,但具有较高的计算复杂度,较多的限制条件和冗余,这类方法包含pCa、K-SVD等。

2.1.1改进的稀疏K-SVD算法

Rubinstein等[13]在K-SVD[12]算法的基础上,提出了稀疏K-SVD算法。这种算法结合了两类学习方法的优点,采用加入“基字典”的稀疏模型,使用这个新的参数框架训练字典,具有较低的计算复杂度、更好的自适应性和稳定性;而且稀疏K-SVD可以和任意追踪算法组合使用,便于进行改进。

针对超分辨率传统字典训练方法耗时长、字典质量差的缺点,本文对使用类似Smith等[14]的方法对稀疏K-SVD进行改进,进一步提高其训练效率,当处理规模较大的训练集时,优势明显。改进措施在稀疏K-SVD的两个主要部分进行:字典更新阶段和稀疏编码阶段。在字典更新阶段,通过引入“更新循环”机制,即将仅循环一次的字典更新过程循环多次。这是因为字典训练时间大部分消耗在稀疏编码阶段,仅进行一次更新循环往往并不能得到最优的结果,而循环多次,也并不会明显增加训练时间,反而能够降低稀疏编码阶段的负荷,提高字典学习的效率。改进的稀疏K-SVD过程见算法2。

在稀疏编码阶段,使用上轮追踪过程后得到的k/3个(k为系数稀疏度)最大的系数进行初始化,然后计算剩余的2k/3个系数。系数重用操作更改omp(orthogonalmatchingpursuit)算法并不能带来明显的速度提升,当加入类似CoSamp(CompressiveSamplingmatchingpursuit)[15]中的“支集合并”和“剪枝”操作,改进Batch-omp[17]就可以明显地提高编码的效率,达到快速执行编码的目标。“支集合并”操作:将当轮近似过程计算的结果与已经计算出的集合进行合并,然后计算稀疏表示。“剪枝”操作:从由最小二乘法计算出的近似结果中选出最大的k(或者小于k)个系数。具体过程见算法1。

算法1改进Batch-omp算法

2.2图像特征提取与训练集构建

由于人眼对高频信息更加敏感,传统方法一般选择低分辨率图像的高频信息作为特征,例如拉普拉斯算子、高斯微分函数和梯度提取算子等。但是,它们通常只考虑到图像的几何特征,图像的纹理特性被忽略掉了,无法完整地体现图像的视觉特征。本文使用自适应阈值的mCa[17]来解决这个问题。

4结语

本文提出了一种基于改进稀疏编码的图像超分辨率新方法。使用mCa/mom方法提取低分辨率特征和高分辨率的高频分量作为训练集,对训练集进行降维,减少所需样本数量与字典训练所需时间,降低字典尺寸。使用改进的稀疏K-SVD算法和优化的字典对求解过程,能快速高效地得到超分辨重建所需字典。在Lab颜色空间重建所得图像能够保持颜色通道的一致性。虽然本文方法可以有效提高图像重建质量和计算效率,但利用图片本身的相似性来减少训练所需样本数量,提高特征提取效率;进一步提高该算法以应用到实时系统中;如何应用该算法到视频的超分辨率重建中都将是下一步的研究方向。

参考文献:

[1]

ZHanGX,wUX.imageinterpolationbyadaptive2-Dautoregressivemodelingandsoft-decisionestimation[J].ieeetransactionsonimageprocessing,2008,17(6):887-896.

[2]

maRQUinaa,oSHeRSJ.imagesuper-resolutionbytV-regularizationandBregmaniteration[J].JournalofScientificComputing,2008,37(3):367-382.

[3]

taiYw,LiUS,BRownmS,etal.Superresolutionusingedgepriorandsingleimagedetailsynthesis[C]//CVpR2010:proceedingsofthe2010ieeeConferenceonComputerVisionandpatternRecognition.piscataway:ieeepress,2010:2400-2407.

[4]

FReemanwt,JoneStR,paSZtoReC.example-basedsuper-resolution[J].ComputerGraphicsandapplications,2002,22(2):56-65.

[5]CHanGH,YeUnGDY,XionGY.Super-resolutionthroughneighborembedding[C]//CVpR2004:proceedingsofthe2004ieeeComputerSocietyConferenceonComputerVisionandpatternRecognition.piscataway:ieeepress,2004.:275-282.

[6]

GaoX,ZHanGK,taoD,etal.Jointlearningforsingle-imagesuper-resolutionviaacoupledconstraint[J].ieeetransactionsonimageprocessing,2012,21(2):469-480.

[7]

YanGJ,wRiGHtJ,HUanGtS,etal.imagesuper-resolutionviasparserepresentation[J].ieeetransactionsonimageprocessing,2010,19(11):2861-2873.

[8]

ZeYDeR,eLaDm,pRotteRm.onsingleimagescale-upusingsparse-representations[C]//proceedingsofthe7thinternationalConference,LnCS6920.Berlin:Springer-Verlag,2012:711-730.

[9]

YanGL,LiUY,HUanGR,etal.newapproachforsuper-resolutionfromasinglecolorimagebasedonsparsecoding[J].JournalofComputerapplications,2013,33(2):472-475.(杨玲,刘怡光,黄蓉刚,等.新的基于稀疏表示单张彩色超分辨率算法[J].计算机应用,2013,33(2):472-475.)

[10]

wanGJ,ZHUS,GonGY.Resolutionenhancementbasedonlearningthesparseassociationofimagepatches[J].patternRecognitionLetters,2010,31(1):1-10.

[11]

DonoHoDL.Formostlargeunderdeterminedsystemsoflinearequationstheminimall1‐normsolutionisalsothesparsestsolution[J].Communicationsonpureandappliedmathematics,2006,59(6):797-829.

[12]

aHaRonm,eLaDm,BRUCKSteina.K-SVD:analgorithmfordesigningofovercompletedictionariesforsparserepresentation[J].ieeetransactionsonSignalprocessing,2006,54(11):4311-4322.

[13]

RUBinSteinR,ZiBULeVSKYm,eLaDm.Doublesparsity:learningsparsedictionariesforsparsesignalapproximation[J].ieeetransactionsonSignalprocessing,2010,58(3):1553-1564.

[14]

SmitHLn,eLaDm.improvingdictionarylearning:multipledictionaryupdatesandcoefficientreuse[J].SignalprocessingLetters,2013,20(1):79-82.

[15]

neeDeLLD,tRoppJa.CoSamp:iterativesignalrecoveryfromincompleteandinaccuratesamples[J].appliedandComputationalHarmonicanalysis,2009,26(3):301-321.

[16]

RUBinSteinR,ZiBULeVSKYm,eLaDm.efficientimplementationoftheK-SVDalgorithmusingbatchorthogonalmatchingpursuit[R/oL].[2012-10-10].http:///en/document/view/6635304/efficient-implementation-of-the-k-svd-algorithm-using-technion.

[17]

StaRCKJL,moUDDenY,BoBinJ,etal.morphologicalcomponentanalysis[C]//proceedingsofthe11thSpieConferenceonSignalandimageprocessing:waveletapplicationsinSignalandimageprocessing.SanDiego:SpiCe,2005,59(14):1-15.

[18]

BoBinJ,StaRCKJL,FaDiLiJm,etal.morphologicalcomponentanalysis:anadaptivethresholdingstrategy[J].ieeetransactionsonimageprocessing,2007,16(11):2675-2681.

[19]

ninGQ,CHenK,YiL,etal.imagesuper-resolutionviaanalysissparseprior[J].SignalprocessingLetters,2013,20(4):399-402.

[20]

iRanim,peLeGS.motionanalysisforimageenhancement:resolution,occlusion,andtransparency[J].JournalofVisualCommunicationandimageRepresentation,1993,4(4):1993-12.

数学建模经典算法篇5

   车辆模拟器具有工况设置方便、试验重复性好、安全性高等优点,在驾驶培训、车辆新产品的研究和开发、人—车—环境试验中有着重要作用,良好的车辆运动模拟技术是车辆模拟器质量的保障。本文以“车辆人—机—环境模拟器”项目为依托,围绕车辆模拟器运动模拟技术中三维虚拟道路建模、车辆动力学建模与仿真、动感模拟算法等展开研究。提出了随机激励路面轮廓三维高程数据生成方法;对Vortex车辆动力学建模特别是车辆悬架参数的设置进行阐述,并给出了车辆动力学仿真的实例;提出了基于六自由度平台杆长的模糊自适应动感模拟算法,最后建立了车辆动力学、动感模拟算法与六自由度平台虚拟样机组成的车辆模拟器开发综合仿真平台。论文阐述了项目中车辆模拟器的组成及工作原理,阐述了模拟器运动感觉模拟的机制,对模拟器运动系统做了详细的介绍,为车辆模拟器运动模拟技术奠定基础。

   给出了车辆模拟器三维虚拟道路建模所需的路面轮廓数据和路形数据建模和生成方法,为车辆动力学仿真提供路面激励数据。利用路面不平度二维功率谱密度的表达式,通过二维傅里叶逆变换法得到了路面轮廓不平度三维路面高程数据生成方法,生成的高程数据的功率谱特性和各向同性特性均优于已有方法。推导了路面轮廓中包含的随机瞬态成分的空间位移特征与路面等级的关系,提出了三维空间内随机瞬态成分生成方法。根据道路路形特征给出了三维空间曲线道路建模方法,并采用线切割方法将道路与地形进行了融合。

   阐述了Vortex车辆动力学建模的方法和流程,针对Vortex车辆动力学参数化建模的特点,设置不同的悬架参数,进行车辆行驶平顺性和稳定性仿真,然后进行结果分析对比。对不同路面类型以及各种车辆运动的典型工况进行了动力学仿真,为动感模拟算法的设计和优化提供数据支持。针对经典动感模拟算法参数不能在线实时调整而导致平台空间利用率低的问题,在经典动感模拟算法和基于平台单自由度约束的模糊自适应动感模拟算法的基础上,提出了基于平台杆长约束的模糊自适应动感模拟算法。

   首先解决了动感模拟算法中输入信号预处理、倾斜角速度限制环节处理以及自由度解耦等几个问题,然后提出了模糊自适应算法的原理与模糊自适应规则,并对几种动感模拟算法进行了仿真分析对比,结果显示基于平台杆长约束的模糊自适应动感模拟算法具有参数调节简单意义明确、调节作用平滑无冲击、不需要考虑多自由度之间耦合作用的优点,能充分利用平台的运动空间而提高动感模拟逼真度。

   建立了车辆动力学、动感模拟算法、六自由度平台虚拟样机的Vortex、Simulink、aDamS联合仿真系统。首先阐述了联合仿真系统的组成、原理及作用,然后建立了六自由度平台aDamS虚拟样机模型,并将其与Simulink相联接。以动感模拟运动的可视化与数据监控以及蛇形试验专用动感模拟算法为例,对联合仿真系统的应用进行了举例说明。

数学建模经典算法篇6

关键字:贪心策略最优化效果

贪心策略是信息学算法中解最优化问题的一种常用且可行的策略,它接近人的直观思维,采用阶段性的贪心选择来达到整体的最优。能用贪心策略的题目必须满足最优选择性,通俗地说是指通过局部的贪心选择,从而实现全局的最优解,从它的含义可知,要实现整体的最优,阶段性的贪是最有效且必不可少的一种策略,算法思想可用求最短路径的例题形象地体现出来。假如每个路口作为一个阶段,只需在每一个阶段中作出最优的贪心选择,就能得到整个路径的最优解,教学实践证明,只要选择好阶段性辅导过程中贪的标准,这种解题策略适合于农村学校的noip辅导。

一、贪的必要性与重要性

近年来,信息学科得以迅速发展,但是由于一些原因,信息学科的地位与传统的经典学科相比还处于绝对劣势,说起竞赛,即使在绍兴这样的强市,noip在大部份农村初中仍处于刚起步的状态;与此同时,面对现行的考试评价制度,农村大部份家长和学生对信息学竞赛持不理解、不参加的观点;学校抱可有可无的态度。上述情形在现实层面上直接体现出竞赛生源少、参加竞赛的学生综合素质不如人意等现象;更重要的是:noip包含语言语法学习、数据结构、算法构建及高中组合数学等内容,有些内容甚至是大学里的计算机专业课程,这对于可自主支配时间少、计算机基础差的初中学生来说,无形提高了竞赛的门槛,特别是近年来noip竞赛的发展出现难度加大,知识面加广的趋势;这些对辅导老师来说都形成了一道不可逾越的障碍。

总之,面对学生基础差、课外时间少、学科地位弱、外部支持力度少但学习内容多、专业深的这样一对矛盾,在不可改变外力的情况下,辅导教师能做的就是如何把矛盾化解掉,争取达到最优化辅导效果,在此我们采用贪心辅导贪略。

二、贪的策略

从算法的角度说,达到最优化效果有多种方式,但是从时间效率上来讲,贪心是最省时的一种方法,竞赛辅导同样如此。其中关键是在辅导中如何贪心地选择辅导内容和辅导方法来实现辅导效果的最优化。针对上面存在的现实矛盾,可以按以下顺序来解决。

1.不会走路也要学跑――起点贪高

古人云:“一步一个脚印才能品尝到成功的甜蜜滋味,否则就会欲速则不达”,但是在noip辅导中就是不能按部就班,如果按照“学语言――学算法――学数据结构――应用”这种‘学以致用’模式来教学,除了时间不允许外,结果也会是很惨酷的,不但学生获奖有问题,对于学生知识、能力、思维的提高也没有多少帮助。故辅导开始就应定位于高起点,高标准,以复赛的要求为起点,抓住如何构建算法、分析算法优劣这个核心来进行。而不是一开始就陷入学繁琐的语法这个圈子。

例如:输入两个数,输出它们的和。

这个题是很简单的,但是不能只用它来完成几条语法或者语句的讲解,而是要定位高标准,全面训练学生思维,培养全面思考问题的能力,可如下进行:

1、读题并进行思维扩散、想算法

2、确定最终算法

3、如何表示两个数:用a、B

4、程序如何实现并调试――不懂再去学。

5、用一定的数据来测试验证是否正确。

上面的分析几乎包含了noip竞赛的所有要求,平时应作为一种规范化的解题步骤加以训练,由简单题来贪解题过程的复杂化及思维的规范及完整性,养成对问题进行全面分析的习惯。

2.思路决定出路,方法决定结局-观念与方法贪新。

“思路决定出路,方法决定结局”,这句话在以算法构建为主的noip辅导中体现得更淋漓尽致,在教学辅导中教师应比较并选择合适的教法,应多采用任务驱动式、启发式、引导式、小组合作与竞争式等教学模式;同时要求学生在学习前树立起自主学习、交流学习、在错误与不懂中学习的观念,从而让学生掌握分析问题的方法、培养在陌生问题情景下对算法的自主构建能力。只有这样才能避免平时做了大量试题,比赛时却对类似问题的算法确定犹豫不决的情况。

仍以上题为例,当学生分析完问题后发现语法与iDe环境不懂,或是在应用过程中出现了一些错误,此时学生就应主动的去学习,在不懂与错误中学习,这就是所说的学生贪学习观念。当上面的5步都完成后,学生体会到成功感后教师应抛出‘当a、B非常大时如何考虑数据结构的描述及高精度的实现’这样的问题,通过引导、启发、交流来完成学生知识体系的完善,学生在逐步深入与不断的错误中来学到知识。

在培训中如坚持贪上面所列举的教法与学法两个方面,不要怕在一题上花太多的时间,引导学生实现一题多解的求异思维与多题一解的求同思维,将使学生的能力在归纳总结与比较中得以跳跃式的发展,当遇到复杂背景或多种算法的综合应用模型时,学生最终将实现算法的自主创新构建。

3.创新源于经典例题贪经典。

在前面贪的教学中会用去大量的时间,再加上信息学科本身辅导时间较少,故选择例题为载体时应宁少勿多、贪经典。经典题目由于它本身承载了事物或算法的本质特征,同时问题背景及模型构建相对简单,因此教学较容易。

比如穷举法,它在算法的讲解中是最基本的,但却也是最重要、扩展性最强的算法,作为它的讲解完全可以通过少量的、简单的经典题目来揭示它的本质。

例:输入一个数,判断其是否为质数。如果是质数输出‘Yes’,否则输出‘no’。

这是一道最基本的经典入门题目,每位老师一定都讲过,但是许多学生对这个问题的求解没有进行深一步的探究,实际上本题可以完整的把穷举法的五要素体现出来,假定这个数为X,具体分析如下:

a)、穷举对象:求什么穷举什么。

b)、穷举范围:有三种范围,分别是2到x-1,2到xdiv2和2到sqrt(x)取整。

c)、可性行条件判断。在穷举范围内是否能被整除。

d)、剪枝优化:两种情况,一是缩小穷举范围,此时选用2到sqrt(x)取整的范围;另一种是当遇到能被整除的数后,可用逻辑开关或者中断语句终止试除。

e)、程序模式:

穷举在一定范围内的对象

对枚举出的对象进行可行性判断,如可行,则求出解,结束穷举;否则枚举下一个。

穷举结束。

注:本题实现较简单,具体程序省略

数学建模经典算法篇7

【关键词】模型库;成本会计;计量系统

中图分类号:F275.3文献标识码:a文章编号:1004-5937(2014)28-0013-04

一、引言

成本计量的传统模式一般是将其嫁接在会计账户系统上。早在八十多年前,工程师和会计师们结合了会计账户系统与成本记录,创立了一套程序化、规范化的成本计量模式,形成了一套较为成熟的成本会计方法。这种方法的出现有效提高了企业经营管理的信息质量,促进了管理方法及理论的进步,同时,成本会计这一新的会计分支学科也由此诞生。因其独立的理论和方法,这一分支学科至今受到广大学者的深入研究。现代环境下,企业经营环境在信息不断更迭的时代潮流中变化巨大,在这种变化下,企业的管理科学不断发展,管理科学的发展也不能离开成本计量的发展。成本计量的要求在当今经济社会的督促下不断提高,日益增长的需求在旧的计量模式下已经无法得到满足,例如:成本计量的传统模式忽视了“核心竞争”;成本重心前移所产生的信息“时滞”现象;传统成本计量模式与现代化的管理思想相互制约;过于简单地对待间接费用,因而不能将业务活动背后真正的成本动因展现出来;大量战略信息被传统的成本计量所淹没,难以真正体现出企业绩效等缺陷。

因为传统模式下的成本会计取决于账户,然而本身的构造型缺陷难以符合多目标的要求。RobertS.Kaplan和H.t.Johnson指出,现在的成本会计系统期望在三个方面得到满足:(1)为了能及时编制财务报表,要事先将部分期间成本分配到产品上;(2)提品成本估计数据给经营管理者及产品;(3)将过程控制信息提供给成本中心管理者。传统模式只用一种简单的成本系统来实现上述目标。但是由于占据思想主导地位的是财务会计,因此往往只能适用于首要目标。这种仅仅能够适用于外部财务报告的系统对于控制成本中心的过程来说却并没有实质性的帮助,严重的情况下还会造成产品成本错误。分配模式的差异,报告期的差异,以及成本计量对象的差异等决定了成本预算和产品成本以及控制过程的目标。仅仅依赖账户系统是不足以支撑三种成本计量去正确完成每一项规定的任务。所以,一个能够打破传统计量模式的,改变其固有缺陷的,全新的模式需要被建立起来。

二、国内外成本计量理论研究的现状

如今,越来越多的学者开始认识到了传统成本计量模式的局限性,他们对此进行了大量研究并期待能够去改变其弊端。目前的研究者主要有三类,第一个研究方阵是主流的财务人士,工作的性质使他们需要不断提高信息品质,能够把会计计量模式构建成一种能满足各类信息需求人员的模型。当然该模型包括成本计量的规则。另一个重要的方阵是管理会计师,管理会计师们需要创造出全新的产品成本管理方式及成本计量模式来更好地满足管理需要。产品全生命周期成本、资本成本计算、战略成本会计、质量成本计算、作业成本会计以及现金流量制会计等新方法和新概念不断涌现,为成本计量提供了更加广阔的视野。第三个研究方阵是信息工程师,他们来自于企业管理信息系统方面,通过网络技术和计算机来优化企业信息化管理,考虑整个企业管理信息的成本计量问题来对其提出整体的解决方案。第三个研究方阵属于会计界外部人士,其优点是其能够不被传统的方式所局限,很好地致力于新奇思路的探索。这一优点也使会计外部人士成为了发展会计新的成本模式中的重要一支。在国内,有不少学者开始致力于成本管理问题的研究,例如陈胜群、郭道扬、胡玉民、欧阳清、潘飞、王化成、徐政旦、余绪缨、杨雄胜等学者对成本管理多方面进行研究,并且取得了非常好的效果。遗憾的是这一领域的研究仍然处于缺乏系统性的阶段,主要表现是:(1)打破会计账户系统进行成本计量的研究尚无;(2)在信息化和管理视角来研究成本计量的学者并不多;(3)系统研究成本计量规范的论文少见。

目前在西方,主要有传统和创新两大成本会计研究的学派观念。守旧型的传统学派往往束缚于传统模式,其所研究出来的成本技术方法对现实企业的管理需要无法充分满足,落后于时代的发展;然而创新学派却缺少理论体系的系统性优势,虽然他们融入了大量相关学科的研究成果(如数学、管理工程、计算机等)来构建新的成本会计计量模式,但往往只是对这些科学成果进行呆板的拼凑,机械地注入会计学科,从而脱离了新的会计理论体系。同时一些新成果不符合传统会计规范,用规范理论无法解释和支撑。往往最不应该被忽视的是会计界之外的第三种研究力量,他们虽然一般是其他行业的设计师或者信息工程师,但却能在会计计量领域提出较多的新方法和新思路,突破了传统会计思路的思维桎梏,如Jayaram(1999)、Leeet.al(1997)、Vanackee(1993)、Sterman(1989)等,从流程重组以及战略、信息技术、运筹学、系统动力学等不同角度与学科领域对成本计量进行了深入研究,提出了许多大胆且独具创意的新思路,本文在研究前人跨界思想后受到启迪,有了创新思考。

三、跨管理会计与财务会计的成本计量系统设计思想和结构

不同于传统模式和生搬硬套拼凑出的新规范,本研究希望构想出一个突破会计账户框架的跨管理会计与财务会计的成本计量的开放性系统,这样一个系统应该是多维成本计量的、基于三层结构的、开放式的计量系统。

(一)现代成本计量系统的要求

一般而言,现代的新成本计量有以下5个基本要求:

(1)为企业提供战略成本信息,以对其进行长远规划和整体策略服务;

(2)提供成本信息来进行定价决策和资源分配决策;

(3)分配给成品部分期间成本,方便编制财务会计报表;

(4)对人员服务进行评价,衡量业绩指标;

(5)提供成本控制和成本计划服务来实施企业经营活动。

第一个要求面向战略管理,分析企业经营环境,规划整个企业运营的策略,通过价值链分析发现经营中的威胁和机会,此时成本信息能够支持决策。第二个要求面向战略层,同时也面向执行层,为资源分配提供一定的帮助。而第三个要求则是针对外部的财务会计,新计量系统把所需的成本数据信息传递给外部会计。第四个要求和第五个要求针对核心的管理层,为管理者提供一定的信息帮助,使之做出正确决策。

(二)成本决策支持系统设计思想

成本信息系统应该使用决策支持系统来保证成本信息能进行多目标的决策。该决策支持系统(DSS)结合了人与计算机在信息处理能力上的优势,帮助决策者解决了半结构化及非结构化决策问题。此系统能对不同的数据输入进行分类处理与人机交互,而且反应速度快,可以满足多目标的决策要求等。成本决策支持系统设置有两个基本库――模型库和数据库,不同的计量和确认规则存放在模型库,而会计交易的基本事项则记载在数据库。在使用成本信息时,系统鉴别出不同信息使用者的不同使用目的来制定相应的确认和计量规则,组合起密切关系到信息使用者决策的成本信息内容,从而避免了传统成本计量系统中的某些缺点,例如所提供会计数据的固定规则性。

(三)成本计量模式的三层结构

一般将成本计量模式划分为公司战略层成本计量、管理控制层成本计量和作业层成本计量三层结构。成本计算顺序一般是由作业层开始来记录和计算原始成本;用原始信息帮助管理控制层控制成本预算;最后利用之前两层结构的成本信息提供战略层分析与决策思路。成本分析则相反:公司战略层对“成本链”的成本相对优势采用价值链分析工具进行分析;管理控制层则是控制成本预算,评价成本过程;作业层成本则通过对特定对象的分析来完成成本改善。

(四)突破账户约束的开放系统结构

应在账户系统之外构建一个突破了会计账户系统的开放性的成本计量模式。在设计底层的作业层成本计量系统的同时考虑其上两个层次的具体需求,以获取更为准确和可行的汇总数据。

图1左边体现了成本计量系统的内在逻辑结构。(1)设计成本对象。成本对象的多维性包括产品、商标、作业、客户、部门、项目、服务等。由于增加一个成本对象带来的是级数倍的新增系统数据处理数量,因此要谨慎地确定对象数量。(2)成本对象的划分取决于动态的直接和间接成本。直接成本纳入特定成本对象,而间接成本则采用分配计入的方式。一般而言,直接成本越多,越能准确计算出成本,但是会大大增加其计算花费。(3)汇总逻辑关系以确定成本等级。制造企业通常有产量层成本、批量层成本、工厂服务成本、产品支持成本四个成本等级。这种等级划分能满足不同层次管理者对成本分析的需要,从而确定合适的成本动因。(4)选择合适的成本计算制度。实际工作中,往往用混合成本计算制度替代了较为少见的单纯成本计算制度。(5)确定间接成本库数量。成本动因分析在较多的间接成本库数量下更为有利,也能更加方便地采取措施降低成本应对价值链上低效率或不增值的活动。

(五)改变传统成本计算的数据流向

传统模式中的数据流向顺序是:财务系统――管理系统――业务系统,也就是说首先要将财务凭证把交易事项记录到账簿上,然后业务部门通过账簿把所需要的信息提供给其他部门,使信息帮助各部门正确做出决策。但是在未来发展中,这一传统流向会发生根本性的改变。如图1右所示,数据将首先由业务系统转向管理会计,然后管理系统流转到财务系统。新的数据流向中,业务部门对发生的事项进行准确的记录,达到物流、人流、资金流完整统一的数据链后管理信息将流转到管理系统,以供管理部门进行成本的管理和控制,而相对于管理系统而言,财务会计系统所需要的信息是较为严格的,财务部门应该把符合会计准则的成本信息从业务数据库中提取到会计账簿系统中,把那些不符合会计准则的信息从系统中剔除出来。

(六)成型于模型库的成本计量系统结构

决策支持系统包括了管理会计信息系统,可以参照决策支持系统的数据库和模型库所组成的结构来进行设计。其中,模型库是管理会计信息系统不同于财务会计信息系统的重要特征,作为管理信息的核心,数据库同时和财务信息系统共享数据信息。管理型会计在做出决策时需要的各种基本模型都可以在模型库中找到。管理型会计在模型库中通过对模型进行分析、调用和运算,从而作出决策。成型于模型库的管理会计的信息系统如图2所示。

该系统包含三个子系统,也就是数据库的子系统、问题处理及人机交互的子系统、模型库的子系统。一个是依照决策内容和分析方法的区别,需要将各种数据库文件分别建立在系统之中,将维护和管理系统中所使用的各种数据文件的任务交给数据库管理系统。它包含有分析、决策模型里用到的基本数据以及产生结果后的决策。一个是通过模型库分类管理会计中经常使用到的分析、决策方法,这些方法是寻找问题解决方案的重中之重,另外模型库管理系统所进行的最主要的工作是运行管理模型记忆管理存储。一个是问题处理及人机交互的子系统,该系统能够进行数据处理与数值计算、人机对话、组合运行多模型结构等,具有作出决策的模型库综合。

四、成本会计计量系统的模型规范及推广运用

(一)模型库中的组织及存储

构造出管理信息系统的一个重点问题是模型的储存和组织。一般用模型文件和模型描述来刻画一个基础模型,通过模型把相关事项涉及到的各种信息如实记录到模型描述中,记录应该包括模型的名称、模型的接口以及其所属模型库等内容。有的模型文件是数据文件,当然也有可能是程序文件。

通常模型库中模型文件库和模型字典库这两个部分实现对模型和模型描述的区分,而模型的管理、查询、存储模型信息主要依赖于模型字典库。模型字典库的优点主要有以下几个方面:

首先,模型字典库能够将模型进行分类。由于社会的不断向前发展,会计决策中出现的问题也会越来越多,新类型的模型需要不断被建立。针对不同的问题需要不同类型的模型来做出不同的决策和解决办法。基于此,模型的分类就显得很有必要。而模型分类的首要步骤就是字典库分类。

其次,模型字典库可以索引模型文件。模型的四个组成部分为说明文件、源程序、目标程序和数据文件。模型的增加导致这些部分同时增加。构建文件索引,能够方便各模型与模型文件的联系,是相当重要的。

最后,方便查询和维护模型。因为字典能索引模型文件,通过索引能快速找到某事项适用的模型,也使得清除、增加和更改等操作更加方便。数据库形式、菜单形式和文本形式组成模型字典库,而数据库形式被运用于决策支持系统,使每个模型形成一个记录,然后使用关系数据库的模式来存放模型字典的内容。

这是一种适用于模型的查询、区分及更改的组织形式。把模型字典分为三个部分:其一是表层,它记录模型的总体信息,如模型名、模型类及子类和模型号等信息。其二是中间层,它记录着各个模型的个体信息,如模型文件、模型存储位置、单元模型间连接等内容。其三是内层,它记录的是模型参数和变量间信息,如类型、变量名、变量说明、长度、上下限等内容。

模型在计算机中以文件的形式表现出来。基于此,建立模型字典库的同时,也应该建立模型文件库,在不同的子栏目下应该记录不同的模型文件,其中应包含目标程序文件、变量文件、模型说明文件、模型数据文件和源程序文件等。这种储存形式由两部分组成,第一部分是模型文件库,具有文件形式,也是模型的主体,主要按文件方式存储;第二部分是模型字典库,它是一种组织结构形式,不过以模型文件名来存储。需要注意的是应该在模型字典中指明模型文件的存取路径。

(二)成本计量模型库管理系统功能

模型库管理系统能提供给决策者各种模型来支持其做出决策,主要功能如下:

1.管理模型的存取

该功能涵盖新建、查询和更新模型。新建模型是指定义模型语言,用户可以通过它来进行模型的新建,随着模型数量的增加,模型字典中的数据也发生变化。查询模型是指用户通过模型语言查询对模型特征加以了解并且从模型库中调出模型,从而查询模型文件。更新模型是指利用数据更新来修改模型参数,并且不改变模型的结构。这一工作不修改模型字典,只修改了模型文件;但是在对模型的变量和参数有所增加或减少时,就需要对相应的模型字典加以修改。

2.数据库链接

启动数据库管理系统和数据析取系统来储存初始数据和运算结果。

3.维护模型

修改模型字典,对模型进行集成、联接、重构和删除等维护操作。

4.控制模型运行

模型的单独运行和组合运行同时进行。对于其运行控制机制,所属机构要提供顺序、选择、循环的基本控制机制。这时模型文件需要通过模型字典协助运行,首先应该做的是确定模型文件的运行路径,进而找到具体文件启动模型的运行。

5.人机交互系统的联系作用

决策者直接将模型库交互系统与管理系统加以联系,方便用户进行使用和控制。

五、总结

基于会计账户系统的传统成本计量模式已不能适应当今企业的发展需求,它的种种落后于社会的弊端,无疑不利于企业作出决策,有时还会导致企业出现错误决策。在这种情况下,基于模型库的成本计量分析系统则在分析理念与分析方法方面与时俱进,因此逐渐得到各界人士的青睐。今后,应当基于成本计量模式的三层结构,按照成本决策支持系统的思路设计出不拘泥于账户约束的开放式系统结构,并且变换传统成本计算的数据流向,以构建出一套开放性的成本计量系统。另外,要认识到模型字典库和成本计量模型库管理系统的关键性作用,更进一步挖掘它们对成本会计计量系统构建起到的正面作用。相信,经过后人的不懈努力,基于模型库的成本计量分析系统必将在未来的会计成本分析领域大展身手。

【参考文献】

[1]丁友刚,姚姿.RobertS.Kaplan学术成果述略[J].会计之友,2009(8):35-37.

[2]江其玟.跨财务会计与管理会计领域的成本计量研究[J].东南大学学报(哲学社会科学版),2005(5):32-36.

[3]冯军,毕义明,王丽丽,罗波.模型库管理系统的开发研究[J].兵工自动化,2010(5):89-92.

[4]杨倩诗.基于价值管理的成本计量模式研究[D].东北林业大学硕士学位论文,2008.

[5]闫冰.管理会计在高职院校成本管理中的探讨[J].科教导刊(上旬刊),2010(7):205-206.

[6]韩讴明.企业财务会计与管理会计的结合优势探究[J].中国集体经济,2012(7):160-162.

[7]明雄.财务会计与管理会计融合的可行性分析[J].西南金融,2006(11):58-59.

数学建模经典算法篇8

摘要:

目的基于学习的超分辨率重建由于引入了先验知识,可以更好地描述图像的细节部分,显著地增强图像的分辨率,改善图像的视觉效果。将超分辨率重建应用在素描人脸识别中,既可以增加人脸图像的质量也可以有效地提高识别精度。方法首先利用特征脸算法根据素描图像合成人脸灰度图像,然后对合成的人脸图像利用稀疏表示进行超分辨率重建,最后利用主成分分析对重建前后的合成人脸分别进行识别。结果在香港中文大学的素描人脸库(CUFS)上进行实验。经过超分辨率重建之后的人脸在眼睛等部位细节描述更好。同时,由于重建过程中引入了先验知识,重建之后的素描人脸识别率有提高。支持向量机算法得到的识别率由重建前的65%提高至66%,本文利用的主成分分析算法得到的识别率由重建前的87%提高至89%。结论基于超分辨率重建的素描人脸识别算法可以有效地改善合成人脸图像的视觉效果并且提高素描人脸识别精度。

关键词:

素描人脸识别;超分辨率重建;稀疏表示;特征脸;字典学习

近几年,计算机自动检索识别技术不断成熟和完善,在公安执法、视频监控、银行安保等领域的应用也越来越广泛[1-4]。素描人脸识别技术可以根据绘画的素描图像在警方数据库中对相近人脸图像进行自动检索,从而有效地帮助警方缩小或者确定潜在嫌疑人,因此一直是刑侦领域的研究热点。素描图像与真实的人脸照片最大的区别是素描图像具有夸张性,它往往会夸张地表示人面部的某处细节。比如说一个人的鼻子比较大,画师在绘画过程中可能将其的鼻子描绘得更大一些。这对人的主观认知很有帮助,但是对于计算机自动识别,这种夸张性使得传统的人脸识别方法在素描人脸领域的应用效果不尽如人意。目前素描人脸识别方法可以主要分为两大类,基于特征的识别[5-7]和基于转换的识别[8-12]。利用提取的不同特征进行素描人脸识别可以解决素描人脸图像与真实人脸照片之间的结构差异问题。基于转换的素描人脸识别方法将素描图像与人脸照片统一到一个空间中,同样也可以解决由于素描夸张性产生的二者之间结构差异。本文在tang等人[10-12]提出的素描人脸识别算法的基础上,加入了超分辨率重建方法。对转换的人脸图像进行超分辨率重建,可以在不增加额外设备的条件下,有效地增加图像的分辨率提高图像视觉效果。同时,由于重建过程中引入了先验知识,重建的人脸图像在面部细节部分描述得更好,比如眼睛鼻子等,因此加入超分辨率重建的素描人脸识别率较之前也有所提高。

1素描人脸转化

特征脸算法是一种经典的人脸识别方法并且被广泛应用。它可以有效地对多维数据进行降维,实现高速运算。虽然特征脸算法对表情、光照和旋转角度较敏感,但是在刑侦领域中使用的素描图像和人脸照片通常是标准正面人脸图像,所以效果并不受影响。这里将特征脸算法应用在素描人脸转换中。根据素描图像和人脸图像的内部结构相似性,可以认为合成的pr是一幅接近于真实人脸的人脸图像。对于这样一个合成过程,在合成素描过程中所占权重值大的素描训练图像其对应的人脸图像在合成人脸图像过程中所占的权重值也大。利用素描图像和训练集合成一幅对应人脸图像,可以有效解决素描图像与人脸图像之间的结构差异性。

2合成人脸图像的超分辨率重建

根据素描图像合成的人脸图像在刑侦领域往往需要进行进一步的观察和匹配检索。然而合成后的人脸图像存在着细节较为模糊,分辨率较低等不足。超分辨率重建在不需要引入额外设备的情况下,可以有效地提高图像的分辨率,改善图像的视觉效果。超分辨率重建算法现在大致可以分为两类,基于重建[13]和基于学习[14-20]。基于学习的超分辨率重建算法由于对训练样本的学习,引入了先验知识,对图像的细节信息恢复较好,从而可以在更好刻画人面部细节的同时有效增加素描人脸识别的精度。研究表明[14],图像块可以由一组超完备字典中的原子线性组合很好地表示。利用这个性质,对合成的人脸图像在一个过完备字典下寻找一个稀疏表示,然后利用这个稀疏表示重建出高分辨率的图像。

2.1基于稀疏表示的超分辨率重建X和Y分别表示高分辨率图像和对应的低分辨率图像,二者之间的关系为根据图像的稀疏表示理论,对于由训练集中的图像训练得到的过完备字典D,存在唯一的最稀疏表示z与图像块x相对应。

2.2低分辨率图像块的特征表示通常情况下,人们对于低分辨率图像块的特征提取使用的是高通滤波器。这是因为人们对于图像中的高频分量往往更敏感。低分辨率图像块中的高频分量对于预测目标高分辨率图像中丢失的高频分量部分十分关键。对于特征的提取,不同文章中使用了不同的方法。Freeman等人[21]采用了高通滤波器来提取低分辨率图像的边缘信息作为特征。Sun等人[22]采用了高斯滤波器来提取低分辨率图像块的轮廓信息。高涛等人[23]采用了一阶和二阶梯度作为特征。由于一阶二阶梯度信息获取的便捷性和有效性,在这里也选择作为低分辨率图像块的特征。

2.3联合字典学习训练集中的图像块x和y分别表示的是高低分辨率图像的图像块。联合学习高低分辨率图像块的字典可以使得高分辨率图像块的稀疏系数在相应的低分辨率图像块中保持一致。这样,就可以在超分辨率重建的过程中对于高低分辨率的两个字典进行相同策略的学习,从而保证了低分辨率图像块在字典Dl中的稀疏系数与相应高分辨率图像块在字典Dh中的稀疏系数是一致的。

3素描人脸图像识别

人脸识别是一种基于生物特征的识别技术,吸引着越来越多研究者的兴趣与关注,同时关于人脸识别技术的研究也非常广泛[24-25]。主成分分析是一种经典的人脸识别方法,并且已经被广泛应用。在第1节中,为了将素描图像转换成一幅相应的人脸图像,在训练集中分别构建了素描人脸空间Us和特征人脸空间Up。对于合成的人脸图像pr进行基于稀疏表示的超分辨率重建可以得到p'r。将超分辨率重建后的合成人脸图像p'r映射到特征脸空间中,可以得到一个权重系数。因为这里d反映的是超分辨率重建之后的合成人脸与真实人脸图像之间的接近程度,d越小表示超分辨率重建的合成人脸图像与真实人脸图像越接近。因此,将d作为人脸识别的判别条件。将超分辨率重建后的合成人脸图像与测试集中的100幅真实人脸图像分别进行主成分分析,欧氏距离最近的认为两幅图像来自同一人。

4实验结果与分析

为了验证本文超分辨率重建的素描人脸识别算法的有效性,在香港中文大学的素描人脸数据集(CUFS)上进行了实验。CUFS数据集中包含188位学生的人脸信息,每位同学有一幅真实的人脸图像和一幅与之对应的由专门画师绘制的素描人脸图像。素描人脸转换过程中,选择了88幅人脸照片和与之对应的88幅素描人脸图像作为训练集,其余100位学生的素描图像作为测试集,与之对应的100幅真实人脸照片用于测试超分辨率重建后的合成人脸的识别率。首先利用特征脸算法对训练集中的数据分别进行训练得到一个素描特征脸空间Us和一个特征脸空间Up。将测试的素描图像映射到特征素描空间,得到一组权重向量bs。

利用计算出的这个权重向量bs和特征脸空间Up,可以计算得到一幅近似的合成人脸图像pr。图1展示了使用特征脸算法实现素描人脸转化的效果。为了更好地展示合成人脸图像的细节信息,将合成的人脸图像进行基于稀疏表示的超分辨率重建。由于超分辨率重建过程中的字典训练过程引入了先验知识,所以重建后的人脸图像可以有效地克服之前的合成人脸图像细节较为模糊,分辨率较低等不足。图2展示了使用基于稀疏表示的超分辨率重建算法重建的合成人脸图像的实验效果。细节部分,经过超分辨率重建的人脸图像在眼睛等部位的效果优于直接使用双三次插值算法放大的图像效果。同时,图3中展示了超分辨率重建前后,合成人脸图像的灰度直方图信息。可以看出超分辨率重建之后,同一人脸图像的分辨率有效增加了,同时重建前后人脸图像的灰度直方图包络相似,并且合成人脸灰度信息的极值部分经过超分辨率重建之后更平滑更接近于包络线。这一平滑过程是由于重建过程中,字典学习引入了先验知识,也更符合真实的人脸图像。

结构相似性(SSim)是一种衡量两幅图像相似度的指标,其值越大表示两幅图像之间的结构越近似,最大为1。均方根误差(RmSe)是用来衡量观测值同真值之间的偏差。其值越小表示合成的图像越接近真实图像,最小值为0。表1展示了超分辨率重建前后合成人脸图像与真实人脸图像之间的结构相似性和均方根误差。为了验证提出算法的有效性,在香港中文大学素描人脸数据集上对超分辨率重建前后的人脸图像采用主成分分析分别进行人脸识别。支持向量机SVm(supportvectormachine)是一个有监督的学习模型,在人脸识别领域中已经被广泛应用。同样也对超分辨率重建前后的合成人脸图像采用SVm算法进行识别,实验结果作为对比结果。在CUFS数据集中,选取88幅人脸照片及其对应的素描画像作为训练集,剩余的100幅人脸照片及其对应的素描画像作为测试集,实验结果如表2所示。表2中,超分辨率重建前的测试图像是tang等人[10]提出的素描人脸识别算法得到的合成人脸图像,超分辨率重建后的测试图像是根据本文提出的算法进行实验得到的。由于对合成人脸图像进行超分辨率重建的过程中,字典学习引入了先验知识,所以重建后的合成人脸图像在细节部分表示得更好,识别率有所提高。

5结论

数学建模经典算法篇9

关键词:文本自动分类技术,分词,特征提取,向量映射,机器学习

1.引言

文本自动分类最初是应信息检索(informationRetrieval)系统的要求出现的。文本自动分类系统的目的就是对文本集进行有序组织,把相似的、相关的文本组织在一起。它作为知识的组织工具,为信息检索提供了更高效的搜索策略和更准确的查询结果。现有文本自动分类技术主要有基于知识库(专家系统)方法和归纳学习方法(基于词典的方法)。目前比较常用的是基于词典的方法,即通过已知类别的训练集构造出一个分类函数或分类模型(分类器),并利用此分类模型将未知的文档映射到给定的类别空间。本文根据中文文本分类所要用到的算法和技术,给出了一个可行的中文文本分类系统的基本构架,并给出了详细的系统设计方案。其中文本分类的关键是如何构造分类函数(也称为分类器),将未知文本与给定的类别模板进行匹配。目前有许多种分类器的构造方法,如统计方法、机器学习方法、神经网络方法等。其中基于关键词匹配的机器学习算法是网页文本自动分类的主流。机器学习算法主要有naiveBayes算法、Knn(k-近邻算法)、SVm(支持向量机)等。本系统在文本处理的过程中,将采用SVm分类算法,将文本映射到向量空间进行表示。

2.系统设计目标

(1)本系统的主要目的是实现一个面向中文的文本分类系统。主要处理两类事务:

对样本数据进行学习,生成分类器的内部表示。在这个事务的处理过程中,系统要协调分词模块对训练样本进行预处理,生成规范的文本表示。接着要协调特征提取模块提取适当数量的特征生成基础词典。然后调用向量映射模块将文本表示为向量,最后提供给支持向量机进行学习。

   利用生成好的分类器对未知测试文本进行分类。在这个事务的处理过程中,系统要打开上一个事物生成的中间数据——基础词典,协调向量映射模块利用词典把文本表示成向量,然后用分类器对文本进行分类。

(2)对应系统的两类事物,系统的输入也分为两类:

训练文本集:已经由人工分好类的一系列中文文本的集合,每类文本赋予一个分类标签。这些文本可以是原始文本数据,也可以是经过预处理后,只剩下词干的预处理格式。

   测试文本集:待分类的一系列中文文本的集合,这类文本可以没有分类标签,也可以有分类标签。如果没有分类标签则用系统进行分类。如果有分类标签则可用来验证系统分类的准确度。

(3)系统的中间数据。通过前面对系统两类事务流程的描述,可以看到有如下数据输出:

基础词典。这个数据集是向量空间模型中基础维的表示。它包含了系统用来将文本表示为向量时选取的特征词根。同时它也存储了特征词根在训练文本中的基本统计数据:词根出现的文档数目;词根在每类中出现的文档数目。

训练文本的向量表示。这个数据集是训练文本用基础词典在向量空间模型下映射的向量表示。它可以被支持向量机读取并学习。

分类器模型。这个数据集是支持向量机学习后生成的分类器。它包含了能将文本进行分类的源数据。

      分类标签。这个数据集是系统对测试文本集分类后的分类标签。

3.系统设计思想

在一个中文文本分类系统的实现过程中,有分词、特征提取、向量表示和机器学习四个主要步骤。在每个步骤中多存在着许多不同的策略和实现方案。在本系统的实现过程中,希望能够兼容不同的策略,并提供一定的方案由用户进行扩展。

出于对上面要求的考虑,主要采用Bridge(桥梁模式)和Listenner(监听器模式)。

在流程耦合度低处,使用Bridge模式(如图1),为每个步骤提供一个抽象化(abstraction)角色,同时提供不同实现和不同策略实现化(implementor)角色。通过这个模式的应用做到了对不同策略的兼容和提供可扩展性的接口。

                                                   图1:Bridge模式

在流程耦合度较高处,使用监听器模式,将特定步骤抽象成监听器,进而将步骤独立出来。再通过监听器的不同实现完成不同策略的异构。

4.总体设计

本系统由分词模块、特征提取、向量映射模块,SVm学习模块和SVm分类模块五部分组成。总体框架设计如图2:

                                                       图2:系统总体设计图

本系统主要流程就是对数据的加工处理,每个模块都有自己的输入和输出,各模块间相互独立,以各自的输入、输出数据进行链接。流程1为分类系统的训练过程,流程2为分类系统的分类过程。词条字典、训练文档向量表示、测试向量文档表示是流程中间数据,SVm分类器和分类标签是最终数据输出结果。

5.各模块功能描述

分词模块:对中文文本进行分词

输入输出:模块输入为中文文本,输出为文本分词表。

特征提取模块:对给出文本建立向量空间模型,并进行特征提取和维度压缩,生成字典

输入输出:模块输入为分词表,输出为词条字典。

向量映射模块:按照词条字典把中文文本映射为向量表示形式。

输入输出:模块输入为文本分词列表和词条字典,输出为文档向量表示。

SVm学习模块:用SVm对向量和字典进行学习,生成学习模型。

输入输出:模块输入向量表示的文本训练集,输出为训练SVm分类器。

SVm分类模块:用SVm学习模块的训练得分类器对测试文本进行分类。

输入输出:模块输入为SVm分类器和测试文本的向量表示,输出为分类标签。

6.结束语

中文文本的自动分类是中文信息处理领域中的重要研究课题。本文对中文文本分类技术做了初步的探讨,给出一个基于中文文本自动分类系统分析。首先,分析系统的输入、输出以及中间过程,从而明确系统的设计目标。接着进一步解析系统内部的组织结构,形成统一的设计思想。最后,结合这些分析给出一个系统的框架的设计。按照该系统的设计思想和进一步的详细设计可以搭建一个相对系统化、功能较为全面、具有较高效率的中文文本自动分类系统平台。由于整个系统涵盖的范围较大,设计到的技术细节多,在很多实现细节上采用了比较简单的方法,以便于整个系统的顺利实现。今后在很多方面还需要继续进行深入的研究,以提高整个文本自动分类过程的识别准确率。

  本文作者创新点:对中文文本自动分类系统进行分析给出一个系统框架设计,按系统设计思想和进一步的详细设计可搭建相对较高效率的中文文本自动分类系统平台。

作者对本文版权全权负责,无抄袭

数学建模经典算法篇10

电路(系统)诞失规定功能称为故障,在模拟电路中的故障类型及原因如下:从故障性质来分有早期故障、偶然故障和损耗故障。早期故障是由设计、制造的缺陷等原因造成的、在使用初期发生的故障,早期故障率较高并随时间而迅速下降。统计表明,数字电路的早期故障率为3~10%,模拟电路的早期故障率为1~5%,晶体管的早期故障率为0.75~2%,二极管的早期故障率为0.2~1%,电容器的早期故障率为0.1~1%。

偶然故障是由偶然因素造成的、在有效使用期内发生的故障,偶然故障率较低且为常数。损耗故障是由老化、磨损、损耗、疲劳等原因造成的、在使用后期发生的故障,损耗故障率较大且随时间迅速上升。从故障发生的过程来分有软故障、硬故障和间歇故障。软故障又称渐变故障,它是由元件参量随时间和环境条件的影响缓慢变化而超出容差造成的、通过事前测试或监控可以预测的故障。硬故障又称突变故障。它是由于元件的参量突然出现很大偏差(如开路、短路)造成的、通过事前测试或监控不能预测到的故障。根据实验经验统计,硬故障约占故障率的80%,继续研究仍有实用价值。间歇故障是由老化、容差不足、接触不良等原因造成的、仅在某些特定情况下才表现出来的故障。从同时故障数及故障间的相互关系来分有单故障、多故障、独立故障和从属故障。单故障指在某一时刻故障仅涉及一个参量或一个元件,常见于运行中的设备。多故障指与几个参量或元件有关的故障,常见于刚出厂的设备。独立故障是指不是由另一个元件故障而引起的故障。从属故障是指由另一个元件故障引起的故障。

二、测前横拟法SBt

测前模拟法又称故障字典法FD(FaultDictionary)或故障模拟法,其理论基础是模式识别原理,基本步骤是在电路测试之前,用计算机模拟电路在各种故障条件下的状态,建立故障字典;电路测试以后,根据测量信号和某种判决准则查字典。从而确定故障。选择测试测量点是故障字典法中最重要的部分。为了在满足隔离要求的条件下使测试点尽可能少,必须选择具有高分辨率的测试点。在大多数情况F,字典法采用查表的形式,表中元素为d…i=l,2,…,n,j=1,2,…,m,n是假设故障的数目,m是测量特性数。

故障字典法的优点是一次性计算,所需测试点少,几乎无需测后计算,因此使用灵活,特别适用于在线诊断,如在机舱、船舱使用。此法缺点是故障经验有限,存储容量大,大规模测试困难,目前主要用于单故障与硬故障的诊断。

故障字典法按建立字典所依据的特性又可分为直流法、频域法和时域法。

(一)直流故障字典法。直流故障字典法是利用电路的直流响应作为故障特征、建立故障字典的方法,其优点是对硬故障的诊断简单有效,相对比较成熟。

(二)频域法。频域法是以电路的频域响应作为故障特征、建立故障字典的方法,其优点是理论分析比较成熟,同时硬件要求比较简单,主要是正弦信号发生器、电压表和频谱分析仪。

(三)时域法。时域法是利用电路的时域响应作为故障特征而建立故障字典的方法。主要有伪噪声信号法和测试信号设计法(辅助信号法)。当故障字典建立后,就可根据电路实测结果与故障字典中存储的数据比较识别故障。

三、测后模拟法Sat

测后模拟法又称为故障分析法或元件模拟法,是近年来虽活跃的研究领域,其特点是在电路测试后,根据测量信息对电路模拟,从而进行故障诊断。根据同时可诊断的故障是否受限,Sat又分为任意故障诊断(或参数识别技术)及多故障诊断(或故障证实技术)。

(一)任意故障诊断。此法的原理是利用网络响应与元件参数的关系,根据响应的测量值去识别(或求解)网络元件的数值,再根据该值是否在容差范围之内来判定元件是否故障。所以此法称为参数识别技术或元件值的可解性问题,理论上这种方法能查出所有元件的故障,故又称为任意故障诊断。诊断中为了获取充分的测试信息,需要大量地测试数据。

(二)多故障诊断。经验证明,在实际应用中(高可靠电路),任意故障的可能性很小,单故障概率最高,如果考虑一个故障出现可能导致另一相关故障,假定两个或几个元件同时发生的多故障也是合理的。另外对于模拟LSi(LargeScaleintegration,大规模集成电路)电路加工中的微调,也是以有限参数调整为对象的。因此在1979年以后,Sat法的研究主要朝着更实用化的多故障诊断方向发展。即假定发生故障的元件是少数几个,通过有限的测量和计算确定故障。因该法是先假定故障范围再进行验证,所以又称为故障证实技术。

四、其他方法

(一)近似技术。近似技术着重研究在测量数有限的情况下,根据一定的判别准则,识别出最可能的故障元件,其中包括概率统计法和优化法。此法原理与故障字典法十分类似,属于测前模拟的一类。采用最小平方准则的联合判别法和迭代法,采用加权平方准则的L2近似法,采用范数最小准则的准逆法等。这些方法都属于测后模拟,由于在线计算量大,运用不多。