模糊系统与数学

《数学技术之模式识别计算(三)》模式识别方

《数学技术之模式识别计算(三)》

模式识别方法

模式识别是通过计算机利用数学方法根据样本的特征对模式进行分类的,下面就简单介绍几类常用的模式识别数学方法。

模式识别方法(Pattern Recognition Method)众多,所用算法更广,主要方法包括统计模式识别、结构模式识别、模糊模式识别和人工神经网络模式识别等四大类方法。前两类方法发展得比较早,理论相对也比较成熟,在早期的模式识别中应用较多;后两类方法目前的应用较多,由于模糊方法更合乎逻辑,神经网络方法具有较强的解决复杂模式识别的能力,因此日益得到人们的重视。在实际应用中,基于实际应用领域的特殊性,与其它一些方法如和人工智能相结合,各个应用领域又有一些特殊的、独有的一些方法和算法,将在模式识别各个应用领域中进行介绍。

模式识别与人工智能(图片来自互联网)

一、统计模式识别方法

统计模式识别方法,又称决策理论方法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示,许多模式识别系统在数字化环节之后还需要进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且更易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间,为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。

统计模式识别方法以概率论和数理统计为基础,它包括参数方法和非参数方法。参数方法主要以Bayes决策准则为指导,其中最小错误率和最小风险贝叶斯决策是最常用的两种决策方法。假定特征对于给定类的影响独立于其他特征,在决策分类的类别N已知与各类别的先验概率P(ui)及类条件概率密度P(X1i)已知的情况下,对于一特征矢量X根据公式计算待检模式在各类中发生的后验概率P(X1i),后验概率最大的类别即为该模式所属类别。在这样的条件下,模式识别问题转化为一个后验概率的计算问题。在贝叶斯决策的基础上,根据各种错误决策造成损失的不同,人们提出基于贝叶斯风险的决策,即计算给定特征矢量X在各种决策中的条件风险大小,找出其中风险最小的决策。?参数估计方法的理论基础是样本数目趋近于无穷大时的渐进理论。在样本数目很大时,参数估计的结果才趋近于真实的模型。然而实际样本数目总是有限的,很难满足这一要求。另外参数估计的另一个前提条件是特征独立性,这一点有时和实际差别较大。

统计模式识别的基本原理是:有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”。分析方法是根据模式所测得的特征向量Xi=(xi1,xi2,…,xidT(i=1,2,…,N),把一个给定的模式归入C个类ω1,ω2,…, ωc中,然后根据模式之间的距离函数来判别分类。其中,T表示转置;N为样本点数;d为样本特征数。

统计模式识别的主要方法有:判别函数法,近邻分类法,非线性映射法,特征分析法,主因子分析法等。

在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(训练样本)学习,是更简便有效的方法,因而获得了广泛的应用,但它是一种启发式技术,缺乏指定工程实践的坚实理论基础。统计推断理论研究所取得的突破性成果导致现代统计学习理论——VC理论的建立,该理论不仅在严格的数学基础上圆满地回答了人工神经网络中出现的理论问题,而且导出了一种新的学习方法——支持向量机(SVM)。

上一篇:地质导向软件发展现状、趋势及国产化建议 (2)
下一篇:没有了