最小RBF网设计的进化优选算法

北极星电力网技术频道作者:佚名 2008/1/4 17:50:33

关键词: ＲＢＦ设计

最小RBF网设计的进化优选算法

及其在动力配煤过程状态预测建模中的应用

魏海坤，徐嗣鑫，宋文忠，吴福保

(东南大学自动化研究所，江苏南京210096)

摘要：文中提出一种RBF网设计的进化优选算法，该算法能设计出满足给定学习精度的最小RBF网络，从而使所得到的RBF网具有较好的泛化能力。我们以煤灰软化温度预测为例，介绍了如何将该算法应用于动力配煤过程的状态预测建模。我们还把ESA算法与另外2种最常见的RBF网设计方法，即聚类方法和OLS算法作了比较，结果表明，用进化优选算法设计的RBF网模型具有最好的泛化能力。

关键词：RBF网；泛化能力；动力配煤；建模

1引言

动力配煤是发展洁净煤技术的有效途径之一。所谓动力配煤，就是将2种或多种单煤按一定比例混合加工，形成混煤，并在混煤的媒质指标满足用户要求的前提下，使生产成本达到最小。由于混煤燃烧过程的复杂性，混煤成分及媒质指标往往不等于各单煤成分及媒质指标按配比简单加权平均，而且某些媒质指标与煤成分之间的关系也有待进一步研究。所以，建立配煤过程状态预测模型，是成功配煤的前提。

由于传统的加权平均方法或经验回归公式的预测效果不太理想，殷春根等人使用BP网对上述状态预测问题建模，并获得了较好的效果［1，2］。但是，BP网本身依然存在许多问题：易陷入局部最小点，收敛速度较慢，很难确定学习精度，结构设计困难等。给基于BP网的动力配煤过程状态预测建模带来了难度。

事实上，径向基函数网(RBF网)更适合于函数逼近和非线性系统建模［3］。使用RBF网时也存在结构设计问题，但根据Moody准则，在相同的学习精度下，当神经网络中的有效参数越少，神经网络的泛化能力就越好［4］。所以，应设计满足给定精度的最小结构RBF网，即选择最少数目的隐节点，以保证RBF网的泛化能力。

设计RBF网的最常用算法是聚类方法[5]和正交最小二乘算法［6］(OLS算法)。OLS算法能自动设计满足精度要求的网络结构，但学习精度无法确定，且往往不能设计出最小结构的RBF网［7］；聚类方法的隐节点数据中心通过对样本输入聚类产生，不存在设定学习精度的问题，但对确定隐节点数(即聚类数)却没有好的方法。当然我们可以用Cross-Validation方法确定最优聚类数，但此时由于不能把所有样本都用于网络训练，所设计的RBF网的泛化能力便会受到影响。

针对上述问题，本文提出一种RBF网设计的进化优选算法(ESA算法)。ESA算法也从样本输入中选取数据中心，RBF函数也采用最常见的高斯型函数，但ESA算法能设计出满足给定精度的最小RBF网。由于设定合理的学习精度很重要，我们还给出一种确定ESA算法学习精度的工程方法。

2OLS算法的学习机理

RBF网是一种三层前向网(见图1)，图中X＝(x1，x2，…，xn)T∈Rn为输入矢量，W＝(w1，w2，…，wm)T∈Rm为输出权矢量，w0为输出单元偏移量，f(X)为网络输出，Ψ(*)为径向基函数(RBF

如果知道了网络的隐节点数及数据中心，RBF网从输入到输出就成了一个线性方程组，此时输出权值可用最小二乘法求解。所以RBF网设计的关键，是如何确定满足精度要求的最少的隐节点数及相应的数据中心。但是，尽管OLS算法所设计的网络能满足学习精度，但却并不保证能找到最小结构［7］。

2.1OLS算法的数学描述

假定共有N个训练样本，其输入为S＝(X1，X2，…，XN)，相应的样本输出(教师信号)为t＝(y1，y2，…，yN)。RBF网的学习问题，就找到最优个数的一组数据中心及相应的一组权值，使样本输入后的网络输出能以给定精度逼近教师信号。如前所述，数据中心从样本输入数据中选取。如果把所有的样本输入选为RBF网的数据中心，则网络有N个隐节点，且隐节点的输出都可以确定下来。当输入为Xi，i＝1，2，…，N时，第j个隐节点的输出为：

hij＝Ψ(‖Xi－Cj‖)(1)

式中Cj＝Xj为该隐节点RBF函数的数据中心。于是可定义RBF网的隐层输出阵为H＝［hij］，H∈RN×N。此时RBF网的输出为：

此时RBF网在样本输入点的输出等于教师信号。但样本较多(N值较大)或样本输出含噪声时，上述方案就不很现实。一种解决方法是从H的N个列矢量中找出M≤N个矢量构成H＾∈RN×M，使(3)式能由下式逼近：

显然，选择不同的H＾，直接影响着RBF网的性能。为了描述什么样的H＾才是“最优的”，先引入排列阵和选择阵的概念：

定义1［7］H′∈RN×N是H的一个排列阵，如果H′的每一个列矢量都是H中的不同的列矢量。

H′与H仅有列矢量的排列次序不同，即

H′＝HP(9)

式中P为单位阵IN的一个排列阵。H总共可以有N!个不同的排列阵。

定义2［7］S∈RN×M是一个选择阵，如果其M个列矢量由(9)中P的M个列矢量组成。

选择阵右乘H，即可选择H的某些特定列。

借助选择阵的概念，(6)式可表示为

可见，ε是S和y的函数：ε＝g(S，y)。在设计RBF网时，通常是给定一个逼近精度ε0及一组样本数据，要求设计出满足精度要求的具有最小结构的网络。于是我们可以给出最优选择阵的定义：

定义3给定一个逼近精度ε0，令集合C＝

选择阵S的列矢量数，则称S0是H的一个最优选择阵。最优选择阵是满足ε<ε0的所有选择阵中具有最少列矢量的选择阵。

由于H＾的列矢量数M就是RBF网的隐节点数，故找到了最优选择阵，也就能设计出最小RBF网。综上所述，可给出如下结论：如果数据中心从样本输入中选取，则RBF网的最小结构设计问题，等价于给定逼近精度下寻找最优选择阵。

再给出选择路径的定义：

定义4行矢量O＝［o1，o2，…，oN］称为H的一条选择路径，如果oi∈｛1，2，…，N｝，i＝1，2，…，N，且i≠j时，oi≠oj。

oi表示H的列矢量被选中的次序。H的一条选择路径实际上对应着H的一个排列阵，所以H也有N!条选择路径。如果选择路径O的前d个元素Od＝［o1，o2，…，od］，d≤N，所对应的选择阵S也能满足ε<ε0时，称路径O是可缩简的，当d缩简至最小时，称此时的d为路径O的有效长度。如果路径O在H的所有选择路径中具有最短的有效长度，则O的缩简路径Od所对应的选择阵便是最优选择阵。

2.2OLS算法的不足

OLS算法对H的列选择是在对H作Gram-Schmidt正交化的过程中实现的。步骤如下：首先，令H的N个列矢量为P11，P21，…，PN1，它们构成N维欧氏空间EHN，把输出数据矢量y投影到P11，P21，…，PN1上，如果某个Pk1具有最大的投影(对y有最大能量贡献)，则把Pk1选为第一个数据中心，Pk1构成一维欧氏空间E1；第二步，对剩下的N－1个矢量作Gram-Schmidt正交化，使之正交于E1，得到P12，P22，…，PN－12，再找出与y有最大投影的Pj2，并选择Pj1为第二个数据中心；重复以上步骤直至找到M个数据中心，使它们的能量贡献之和达到给定精度为止。

OLS算法与主成分分析方法在形式上类似，故文［7］把OLS算法与主成分分析方法作了比较后发现，由于H的列矢量不是正交的，它们对y的能量贡献也相互影响，尽管OLS算法在每一步都试图找到有最大能量贡献的基矢量，但这并不保证最终能找到最少个数的基矢量组。也就是说，即使某一选择路径O＝［o1，o2，…，oN］中的某个ok所对应的Pjk不能给出最大的能量，沿着这条路径依然有可能找到一条最优选择路径。

3进化优选算法(ESA)

进化优选算法(ESA算法)利用进化策略在解空间对选择路径进行多点随机搜索，由于所有选择路径都可能被搜索到，使它有可能找到全局最优解。

3.1进化策略简述

进化策略［8］是一种简单高效的启发式多点随机搜索算法，它只用到了进化论中竞争和淘汰的概念，通过不断的竞争和淘汰，使群体的适应度不断提高。最常见的(μ＋λ)型进化策略概要为：首先在解空间内随机生成μ个候补解，成为第一代亲体；然后在每个亲体周围再随机生成λ－1个子个体(群体内个体总数为μ*λ)；通过竞争从群体内选择μ个最好的个体，作为下一代亲体，其余个体则被淘汰。

随着上述过程的不断进行，群体的适应度便不断提高，直至满足终止条件。最终代内具有最佳适应度的个体便是优化问题的解。

3.2选择路径的进化机制

编码：ESA算法中，一条选择路径代表一个个体。如果RBF网的输出阵H的列矢量是N维的，则共有N!条选择路径，它们组成了解空间。

适应度函数：选择路径的有效长度d越大，该选择路径的适应度就越低。如果两条选择路径的有效长度相同，则逼近精度ε更小的路径具有更高的适应度。通常d≥1，于是可取适应度函数

式中O＝［o1，o2，…，oN］为选择路径；K为一实数，0≤Kε<1，以避免ε较大或较小时产生计算上的问题。

d值计算方法如下：假定缩简路径Oi＝［o1，o2，…，oi］对应的选择阵为Si，令i从1到N逐渐增加，如i＝k时的选择阵第一次满足ε<ε0，则d＝k。学习结束后，如果多条路径的有效长度和逼近精度都相同，且它们只有元素排列顺序的不同，则它们对应同一个RBF网。

子个体产生：令O＝［o1，o2，…，oN］为亲体，随机产生两个位置i，j≤N，交换oi和oj的位置，便可产生一个子个体，我们称该过程为变异。

当路径矢量的维数较高时，产生一个子个体也可以经多次变异得到。称变异次数与路径矢量的维数之比为变异率。变异率可以大于1。

有了上述概念，ESA算法便可按(μ＋λ)型进化策略的步骤寻找最优选择路径，从而设计出最小结构的RBF网。

3.3确定算法的学习精度和扩展常数

尽管ESA算法能自动设计满足精度要求的ε0最小RBF网，但该算法能成功应用的前提是给出合理的ε0。当ε0较小时，ESA算法将选择更多的隐节点；而当ε0较大时，ESA算法将设计出较小结构的RBF网。由于RBF网能以任意精度逼近紧集上的实连续函数，而训练样本中总是含有噪声，因此当ε0过小时，神经网络将拟合数据中的噪声，产生过拟合；ε0也不能选得过大，因为此时RBF网将无法逼近目标函数，产生欠拟合。过拟合和欠拟合都会影响RBF网的泛化能力。另外，RBF函数的扩展δ常数也是ESA算法的重要参数，如果该参数值取值不当，也会影响RBF网的泛化能力。

在聚类方法设计RBF网时，尽管隐节点数需要预先确定

[1][2]下一页

来源：中国电力资料网

嗨，快来啊！光看电力文章太乏味，82万电力人喊你一起来探讨，点此进入最火电力论坛!
北极星电力网为广大电力人士打造的期刊分享平台正式上线啦！文章发表，杂志订阅全部免费啦！

投稿热线:010-52898473

>>更多热门电气招聘公告

《最小RBF网设计的进化优选算法》的相关文章

《最小RBF网设计的进化优选算法》的相关新闻

热门文章
最新文章

最小RBF网设计的进化优选算法

>>更多 热门电气招聘公告

《最小RBF网设计的进化优选算法》的相关文章

《最小RBF网设计的进化优选算法》的相关新闻

>>更多热门电气招聘公告