基于神经网络的金融风险评估研究

更新时间:2024-06-13 06:51:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

毕业论文中文摘要

基于神经网络的金融风险评估研究 摘 要: 20世纪80年代末以来,随着经济全球化趋势的不断蔓延,世界金融市场无疑面临各种各样的挑战,对于金融风险的评估和管理的重要性日益加强。 我国的市场经济处于由计划经济向市场经济转轨的关键时刻,作为经济总枢纽的商业银行在运营过程当中无时无刻不面临着各种各样的金融风险,并随着经营业务领域和面向的群众普及率大幅开阔与提高,可谓步步如履薄冰。世界银行对全球银行业危机的研究指出,信用风险的管理不善是导致商业银行的风险防范和控制出现危机的主要原因。 国外在运用数据挖掘技术对信用风险的评估中,广泛采用基于统计判别方法的预测模型,常见的模型有:多元判别分析模型(MDA)、logit分析模型、近邻法、分类树方法等。 上述方法均属于线性模型,分析方法简单、计算复杂度低,但是具有过于严格的限制条件,并且不适用于我国目前的经济情况。因而我选用神经网络模型,进行我国商业银行的信用风险的评估分析。 神经网络模型对任意函数具有逼近能力、学习能力、自组织和自适应能力,能够比较精确的描述因素之间的映射关系。并且神经网络模型在应用中的优势在于,它结构简单,学习方法快,推广能力优异。因而可以对于商业银行的信用风险进行一个较为准确的评估。 关键词:信用风险,数据挖掘,信用风险评估模型,神经网络模型 1

毕业论文外文摘要

Title Financial risk assessment studies based on neural network Abstract Since the late 1980s, with the trend of economic globalization continues to spread, the world's financial markets will undoubtedly face a variety of challenges, increasingly the importance of financial risk assessment and management. China's market economy is in a critical moment of transition from a planned economy to a market economy, which as the economic hub of commercial banks operating in the process all the time facing a variety of financial risks, and with the popularity of the area of operations and for the masses rate significantly broaden and improve, can be described step by step in perpetuity. The World Bank study pointed out that the global banking crisis, mismanagement of credit risk leading commercial banks risk prevention and control of the main reasons of the crisis. Abroad in the use of data mining technology for credit risk assessment, widely used prediction model based on statistical discrimination method, the common model: multiple discriminant analysis model (MDA), Logit analysis model, the nearest neighbor method, the classification tree method. The above-mentioned methods are linear model analysis method is simple, low computational complexity, but overly stringent restrictions, and does not apply to the current economic situation in our country. Thus, I chose to use a neural network model, China's commercial banks credit risk assessment analysis. Neural network model for any function approximation ability, learning ability, the mapping between the self-organizing and adaptive capacity can

1

be more precise description of factors. And the advantage of the neural network model in the application, its simple structure, learning methods, and excellent generalization ability. Thus a more accurate assessment of the credit risk of commercial banks. Keywords:Credit risk;data mining;credit risk assessment model;neural network model 2

目 录

1 绪论 ................................................................ 1

1.1论文选题的依据及其意义 .......................................... 1 1.2 针对金融风险的研究 ............................................. 2

1.2.1 金融风险的概述及影响 ..................................... 2 1.2.2 我国经济现状下的金融风险 ................................. 3

2 信用风险概述 ........................................................ 4

2.1 信用风险理论 .................................................. 4 2.2 我国所面临的信用风险现状分析 .................................. 5 3 信用风险评估 ........................................................ 7

3.1 信用风险评估方法的概述及分类 .................................. 7

3.2 专家制度 ...................................................... 7

3.2.1 专家制度的概述 ........................................... 7 3.2.2 专家制度的步骤 ........................................... 8 3.2.3 专家制度的缺陷 .......................................... 11 3.3 信用风险评估模型概述 ......................................... 12

3.3.1 判别分析法 .............................................. 13 3.3.2 Logit方法 ............................................... 13 3.3.3 近邻法 .................................................. 14 3.4 统计方法的缺陷 .............................................. 14 4 神经网络模型 ....................................................... 16 4.1 神经网络模型理论 ............................................. 16

4.1.1 神经网络模型的概述 ...................................... 16 4.1.2 神经网络模型的应用可行性 ................................ 18 4.2 基于神经网络模型的信用风险评估模型建立 ...................... 19

4.2.1 模型的研究方向 .......................................... 19 4.2.2 模型的建立原理 .......................................... 20 4.2.3 样本输入选择 ............................................ 21 4.2.4 模型的设计 .............................................. 23 4.3 模型结果及分析 .............................................. 25 结 论 ................................................................ 27 参 考 文 献 ........................................................... 29 致 谢 ................................................................ 30

1

1 绪论

1.1论文选题的依据及其意义

近年来,随着金融的全球化趋势及金融市场的波动性加剧,国际金融界对信用风险的关注也日益加强。银行是一国金融体系的核心,在国家金融发展和经济发展中占有十分重要的地位,没有发达的银行业,也就没有发达的经济。银行作为金融的一个重要组成部分,对经济的发展起到很大的促进作用,反过来,经济的发展也促进了银行的发展和创新。

国际上对于银行业金融风险研究的重视程度逐渐提到一定高度。银行依存于经济环境,受到一国经济体制、国家经济政策、法律制度、国民经济水平、社会信用观念等的方面的影响,但是最重要的风险还是信用风险。基于信用风险对银行经营和管理的影响程度,国际性的大型商业银行和研究机构都对信用风险度量和管理提出了许多的理论和评估方法,并进行了不断的实践总结。

目前,国外研究和开发的度量信用风险技术方法和模型还存在一定的缺陷,并且由于我国银行业的改革滞后于经济发展,在风险度量和管理方面还很薄弱,因而,研究和发展风险度量模型和方法对于我国银行业具有十分重要的意义。需要不断的推陈出新,联系我国的经济现状找到真正适合我国商业银行的信用风险评估方法。

我国已加入世界贸易组织,这是促进经济发展的好机会,同时也是一项考验,促使我国必须学习国外先进的、科学的信用风险度量和管理方法的同事,结合我国实际情况,发展适合我国银行业的信用风险度量和管理技术,只有这样才能在与国外同行业的竞争中获得比较优势。同时由于信用是市场经济赖以存在和发展的基石,信用风险度量和管理研究对于银行加强信用风险度量和管理、加强银行内控体系建设和风险监管、健全我国的信用制度,构筑严格的国家信用管理体系,进而建立完善的社会主义市场经济体系等方面起到一定的作用。

本文详细研究学习数据挖掘技术,找到它与信用风险评估模型的契合点,运用这门最新的技术来分析国外常用的几个用于信用风险评估的统计模型,多元判别分析模型(MDA)、logit分析模型、近邻法、分类树方法,并联系我国商业银行经营现状,进行适合我国商业银行信用风险评估模型——神经网络的建立和实现。

1

3 信用风险评估

3.1 信用风险评估方法的概述及分类

信用风险的评估受很多因素的影响,如企业财务状况、管理水平、行业竞争、宏观经济政策等等,目前国外商业银行处理这一问题采用所谓的“经验主义方法论”,即把信用风险评估看成是模式识别的中的一类分类问题——将企业划分划分为能够按期还本付息和违约两类。其具体做法是根据历史上每个类别的若干样本,从已知数据中发现规律,从而总结出分类的规则,建立判别模型,用于对新样本的判别。尽管有人将这种方法称为“粗暴的经验主义方法”,但在目前的金融理论状况下,它有可能是最有效的方法,也是国际金融界和学术界是为主流的方法。国际上,通常将商业银行信用风险的测度转化为企业财务状况的衡量问题,因为信用风险的形成——企业是否能如期还本付息要取决于企业财务状况。影响企业财务状况的因素很多,我们不能仅仅根据企业的某些单一指标,而应根据影响企业财务状况的多为指标来评估企业的财务状况,因此,这一方法的关键步骤和难点在于,指标体系的确立和评估模型的选择。

如何将多维指标综合起来,金融界对于这一探索可追溯到上世纪30年代,并在60年代以后成为热点。目前采用的方法有专家制度、统计方法、神经网络技术等等。

3.2 专家制度

专家制度是一种最古老的信用风险分析方法,它是商业银行在长期的信贷活动中所形成的—种信用风险分析和管理制度。这种方法的最大特征就是:银行信贷的决策权是由银行里那些经过长期实践、具有丰富经验的信贷官所掌握,并由他们做出是否贷款的决定。因此,在信贷决策过程中,信贷专家的专业知识、主观判断以及关键要素的权衡均为最重要的决定因素。 3.2.1 专家制度的概述

采用这种方法的绝大多数银行都将重点集中在借款人的“5C”上,即品德与声望(Character)、资格与能力(Capacity)、资金实力(Capital or Cash)、担保(Collateral)、经营条件或商业周期(Condition)。也有银行将信用分析的内容归纳为“5W”或“5P”。“5W”系指借款人(Who)、借款用途(Why)、还款期限(When)、

7

担保物(What)、如何还款(How);“5P”系指个人因素(Personal)、目的因素(Purpose)、偿还因素(Payment)、保障因素(Protection)、前景因素(Perspective)。而“5C”最为著名,下面就以“5C”为例,加以简要说明:

1)品德与声望。主要是指借款人偿债的意愿及诚意。即确定信贷资金的用途是否有明确、是否符合银行的信贷政策,借款人是否具有负责任的态度和真诚的还款意愿、借款人过去的信用状况如何等。

2)资格与能力。首先,必须确定借款人是否具有申请贷款及签署贷款协议的资格及合法权利。其次,应分析借款人的经营管理能力,对企业借款人而言,其主要负责人经营管理的才能和经验、受教育程度、应变能力、思维能力和判断能力、指挥与组织能力。最后,分析借款人的还款能力,这可以通过借款人的收益变动状况来考查。

3)资金实力。主要是指借款人资产的价值、性质和变现能力,以及考察借款人的股东的股权分布状况以及财务杠杆状况,分析经营净现金流是否充足。

4)担保。主要指抵押品及保证人。即分析抵押品的价值、已使用年限、专业化程度、市场流动性(易售性)、是否投保。对于由第三者提供保证的贷款,应分析考察保证人是否具备担保的资格,并审核保证人的资金实力及其提供的抵押品。

5)经营条件和商业周期。主要是指企业自身的经营状况和外部的经营环境。内部条件包括企业的经营特点、经营方式、技术情况、竞争地位、市场份额、劳资关系等,这些因素基本上属于企业自身能决定的内容。外部条件非企业自身所能控制,涉及范围也很广,如社会环境、商业周期、通货膨胀、国民收入水平、产业结构调整、本行业发展趋势、同业竞争状况、市场价格变动等。 3.2.2 专家制度的步骤

上述对借款人“5C”的信用分析,只是银行做出贷款决定前所需做的最基本的工作。就某—笔信贷业务而言,银行还要动用大量人力、物力、财力进行较为复杂的分析,这个过程包括以下主要步骤:

1)确定借款人(公司)为何需要这笔贷款,这笔贷款申请是否符合国家的政策、当前银行的政策和偏好。

2)对该公司的会计报表进行分析,分析公司的经营能力、偿债能力、财务能力、流动性,以及未来发展趋势和主要风险因素等。银行经常采用的一些指标见表1。

3)分析公司的管理能力、发展战略、信用品质、公司政策的连续性等问题;分析公司的法人治理结构和关联交易情况。

8

4)对该公司的行业状况和市场状况进行分析,分析行业的发展趋势、国家的行业政策和人民银行的信贷政策导向等;分析公司在该行业的地位、竞争能力、竞争优势和竞争力的持续性。

5)对公司所处的行业结构状况进行认真分析,对该行业的发展趋势、公司在行业中的地位、竞争力以及政府对该行业的管制状况给予特别的关注。

6)根据调查的情况,撰写信贷审批所需的资料,包括客户评价报告、信贷业务调查报告、项目评估、担保评价报告等等。

7)审批会议审批,根据上报的信贷业务资料,信贷官对信贷做出是否同意的审批决策文件。

8)对审批同意的,要认真准备和签署信贷合同文书。在准备这些文件时,应把所有的相关问题尽量考虑进去,做到全面准确。

9)贷款的发放和回收。银行要按合同约定履行义务,同时要行使权利,对贷款进行检查,确保按期回收。

9

表1 银行在信用评估中经常使用的财务比率指标

类型 经营能力 比率 息前税前折旧前收益/销售收入 净收入/销售收入 实际有效税率 净收入/净资产 净收入/总资产 销售收入/固定资产 偿债能力 息前税前折旧前收益/利息支付 (经营活动现金流量-资本支出)/利息支付 (经营活动现金流量-资本支出-股息)/利息支付 负债能力 长期债务/资本总额 长期债务/有形净值 总负债/有形净值 (总负债-长期资本)/长期资本 长期资本=总净值+优先股+次级债务 流动负债/有形净值 流动性 流动比率 速动比率 存货占净销售收入比率 存货占净流动比率 流动负债占存货比率 原材料、半成品、产成品占存货总量比率

10

关于整个信用评估过程,用下图进行详细描述:

借款人还款意愿如何?借款同时有否其他需要的金融服务? 动机分析:借款人(公司)为何向银行借款 银行对该公司是否有偏好,它的风险-收回比率可接受吗? 业务及战略评价:该公司是否有明确发展方向,怎样达到,它这样做可行吗? 对企业管理层人员分析:能力、一致性以及信用品质 财务报表分析:平衡表和现金流量表分析 ——效益与成本 ——盈利状况 ——收入的稳定性 ——杠杆状况 ——项目评估 ——未来发展趋势分析 行业分析包括:行业地位 市场价额 价格领先 创新趋势 将定性分析置于信贷备忘录里 财务模拟 盈亏点定价 压力测试 风险评估 契约条款 贷款文件 法律意见 贷款的管理 建立筹资计划 数据系统 贷款的谈判事宜 贷款申请的提出 贷款申请的批准 贷款文件 其他法律文书 文书的审查 贷款发放 贷款管理 贷款收回

3.2.3 专家制度的缺陷

尽管古典信用评估方法——专家制度在银行的信用评估中发挥着积极的重要作用,然而实践却证明它存在许多难以克服的缺点和不足。

1)要维持这样的专家制度需要相当数量的专门信用分析人员,随着银行业务量

11

的不断增加,其所需要的信用分析人员就会越来越多,必然会带来银行冗员、效率低下、成本居高不下等诸多问题。

2)专家制度实施的效果很不稳定。这是因为信贷官员本身的素质高低和经验多少将会直接影响该项制度的实施效果。例如,对于公司所提供的一套财务报表和文件,不同的信贷官员对其进行分析会得出不同的分析结果,差异很大。

3)大大降低了银行应对市场变化的能力。银行由于长期以来一直采用较为严格的等级制度,贷款流程复杂、审核程序苛刻,但现在金融市场已经呈现出灵活多变的特征,传统的操作方法已经越来越不适应市场。

4)加剧了信贷过度集中的问题。在专家制度下,专家对某一行业或某类客户有着强烈的偏好,选择的客户都具有较高的相关性,这就加剧了银行贷款的集中程度,必然给银行带来潜在的风险。

综上所述,专家制度有着许多难以克服的弊病,这就不得不促使人们去寻求更加客观、更为有效的度量信用风险的方法,来提高银行信用评估的准确性,如有些银行将专家制度和专家系统结合起来以提高信贷审批决策的正确率。

3.3 信用风险评估模型概述

从前面对专家制度的分析可知,专家制度基本属于一种定性分析法,当然它也运用了许多财务会计信息对各种财务比率进行比较分析,属于一种单变量的测定法。单变量测定法一个最大的缺陷就在于它不能够对不同的财务比率的重要性进行排序,对强比率和弱比率之间怎样进行综合分析也无能为力,如一个借款人(公司)的利润指标相对较低,而流动性指标则高出平均水平,那么应当如何综合考虑借款人的信用状况。在这种情况,人们便开始了构筑多种变量的信用风险预测法的研究和探讨工作,。

从国内外信用风险评估技术的应用现状以及发展趋势看来,在商业银行信用风险管理领域中有着广泛的应用并且在不断进步。

目前,在西方发达国家,商业银行的信用风险管理已形成了一整套较为成熟的管理体系,许多的技术和工具、软件已付诸实际应用,继传统的比例分析之后,统计方法得到广泛的应用,

国外在对信用风险的评估中,广泛采用基于统计判别方法的预测模型,常见的模型有:多元判别分析模型(MDA)、logit分析模型、近邻法、分类树方法等,它们接

12

受定义在已选变量集合上的一个随机观测值样本,建立判别函数,进行分类。其中以MDA和logit分析模型应用最为广泛。 3.3.1 判别分析法

在针对分类问题的多种不同的统计方法中,最常用的是多元判别分析法MDA,根据观察到的一些统计数字特征,对客观事物进行分类,以确定事物的类别。它的特点是已经掌握了历史上每个类别的若干样本,从中总结出分类的规律性,建立判别公式,当遇到新的事物时,只要根据总结出来的判别公式,就能判别式无所属的类别。

MDA的关键在于建立判别函数,目前,统计学中建立判别函数常用方法有:一是已知总体分布的前提下求得平均出错概率最小的分类判别函数,通常成为贝叶斯判别函数;二是未知总体分布或未知总体分布函数时,费歇准则下的最优线性判别函数。在这里判别分析模型是通过采用极大化组间比和组内方差的费歇方法来建立的。在满足如下条件时,可以证明,由费歇方法得出的判别规则最优极小化误判代价。

1、每组均服从多元正态分布; 2、每组的协方差矩阵相同;

3、每组的均值向量、协方差矩阵、先验概率和误判代价是已知的。 MDA有两个总体与多个总体判别之分,在两个总体判别时,判别公式为:

1DF(?)??T??1(?1??2)?(?1??2)T??1(?1??2)

2其中,?1,?2和?分别是各组均值和共同协方差矩阵,依据一定判别规则即可对原始样本进行分类。显然,判别函数DF(?)是各独立变量(或指标)的线性函数。在满足上述三个条件假设下,它能使得误判达到最小。

Altman应用判别分析法建立了著名的Z-score模型和在此基础上改进的ZETA模型,这两个模型的目的是预测企业破产的概率,为银行贷款决策提供支持。目前ZETA模型已商业化,广泛应用于美国、意大利等国的商业银行的业务中,取得了巨大的经济效益。不过,这个方法最大的缺陷在于其过于严格的假定条件,在实际应用中,各种案例均会不同程度的违背方法条件限制。 3.3.2 Logit方法

为了克服线性判别函数统计假设过于苛刻的不足,开始采用Logit模型以及非参数统计等方法来建立违约判别函数。Logit分析与判别分析法的本质差异在于前者不要求满足正态分布或等方差,模型采用Logistic函数,

13

p1Y? ,??c0??ciXi

1?e?i?1其中Xi?1?i?p?表示第i个指标,ci是第i个指标的系数,Y是一表示企业财务状况好坏的概率。

由于Logit是采用一系列财务比率变量来分析公司破产或违约的概率,然后根据银行、投资者的风险偏好程度设定风险界限,以此对分析对象进行风险定位和决策,企业财务状况的评价可以看作是基于一系列独立变量基础上的分类问题,企业财务状况的好坏与财务指标是非线性的,财务指标可能是高度相关的,并且并不服从正态分布,而采用Logit方法对预测企业破产尽管有所改进,但仍不够理想。 3.3.3 近邻法

近邻法是一种非参数方法,当已知总体表现为非正态分布时,特别是当属于同一类的样本在变量空间形成聚类时,近邻法十分有效,与参数类方法相比,近邻法用于对总体分布施加很少约束的情况下,是一种十分灵活的方法。

近邻法不仅放松了正态性假定,也避免了传统技术对模型函数形式设定的困难。任何一个样本到底划归哪一类是由k个近邻划归类型所确定。任意两个样本之间的距离可定义为d?x,y???x?y?cov?1?x?y?,其中cov?1是合并协方差的逆。这样,一个样本划归为它的k个近邻的多数(即当一个样本的k个近邻的大多数划归一类,则该样本也应划属一类)。

T3.4 统计方法的缺陷

统计模型的最大优点在于其具有明显的解释性,评估方法简单、计算复杂度低,但是这些方法都是基于线性模型的评估方法,有着过于严格的前提条件,而且商业银行的风险因素错综复杂,各个因素之间错综复杂,存在着不确定、非线性特点,无法用简单的线性模型做出准确的评估,。

上述三种方法在国外已有大量应用,实证结果发现:1)企业财务状况的评价可以看作是一类基于一系列独立变量基础上的分类问题;2)企业财务状况的好坏与财务比率的关系常常是非线性的;3)预测变量(财务比率)可能是高度相关的;4)大量实证结果表明,许多指标不成正态分布。

并且我国的现代商业银行体制刚刚建立,各种风险的评估与管理体制仍不健全,

14

对信用风险的研究还处于传统的风险分析阶段,这远不能满足我国商业银行发展的需求。

因此,传统的分类方法不能很好地解决这些问题。作为研究复杂性的有力工具,神经网络技术近年来在模式识别与分类、识别滤波、自动控制、预测等方面已展示了其非凡的优越性,特别是能处理任意类数据,这是许多传统方法所无法比拟的。通过不断学习,能够从未知模式的大量的复杂数据中发现其规律。神经网络方法克服了传统分析过程的复杂性及选择适当模型函数形式的困难,它是一种自然的非线性建模过程,毋需分清存在何种非线性关系,给建模与分析带来极大的方便。该方法用于企业财务状况研究时,一方面利用其映射能力,另一方面主要利用其泛化能力,即在经过一定数量的带噪声的样本的训练之后,网络可以抽取样本所隐含的特征关系,并对新情况下的数据进行内插和外推以推断其属性。

15

4 神经网络模型

4.1 神经网络模型理论

4.1.1 神经网络模型的概述

神经网络最早是由心理学家和神经生物学家提出的,旨在寻求开发和测试神经的计算模拟。神经网络是一组连接的输入/输出单元,其中每个连接都与一个权值相关联。在学习阶段,通过调整神经网络的权值,使得神经网络模型可以预测输入样本的正确分来来学习。神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一种相对来说比较有效的简单方法。

虽然神经网络的理论可追溯到40年代,但在信用风险分析中的应用还是90年代的新生事物。神经网络是从神经心理学和认识科学研究成果出发,应用数学方法发展起来的一种并行分布模式处理系统,具有高度并行计算能力、自学能力和容错能力。神经网络的结构是由一个输入层、若干个中间隐含层和一个输出层组成。如图2,是一个简单的三层神经网络结构。

输入层 隐含层 输出层

图2 简单的神经网络结构

人工神经网络是对生物神经的简化和模拟。生物神经元由细胞体、树突和轴突三部分组成,树突是细胞的输入端,轴突是细胞的输出端。树突通过连接其他细胞体的突触接受周围细胞由轴突的神经末梢传出的神经冲动;轴突的端部有众多神经末梢作为神经信号的输入端,用于传输神经冲动。生物神经元具有兴奋与抑制两种状态,当传入的神经冲动使细胞膜电位升高到阀值时,细胞进入兴奋状态,产生神经冲动,由轴突输出;若传出的神经冲动使细胞膜电位低入阀值时,则细胞进入抑制状态,没有神经冲动输出。

为了模拟生物神经细胞,可以把一个神经细胞间化为一个人工神经元,人工神经

16

元用一个多输入、单输出的非线性节点表示,如图3:

x1 w 1 i 阀值? i 激活函数

x2 w 2 i I yi

输入信号 求和

?if(.)xn wni 连接权

图3 人工神经元模型

神经细胞i的人工神经元的输入输出关系可以描述为:

?Ii??wjixj??i?j?1?yi?f?Ii???n (4.1)

式(3.1)中,xj由细胞j传送到细胞值,?i是细胞i的阀值,

I输入量。wji是从细胞到细胞的连接权

f是传递函数,yi是细胞i的输出量。

神经元上的传递函数,是样本由输入层神经元传递到输出层神经元时进行的变换。传递函数有很多种,但常用的基本传递函数有以下三种:

(1) 阀值函数

f?Ii??

?1,若Ii?00,若Ii?0 (4.2)

式(4.2)也通常称为阶跃函数,若传递函数采用阶跃函数,则人工神经网络即

17

为著名的MP模型。此时神经元输出取0或1,反映了神经元的兴奋或抑制。

(2)分阶线性函数

f?Ii???1,若Ii?1Ii,若1?Ii??10,若Ii??1 (4.3)

式(4.3)在[-1,+1]线性区内的放大系数是一致的,这种形式的传递函数可以看作是非线性放大器的近似。有两种情况时分段函数的特殊形式,一是若在执行中保持现行区域而使其不进入饱和状态,则会产生线性组合器;二是若线性区域的放大倍数无限大,则分段线性函数简化为阀值函数。

(3)Sigmoid函数

Sigmoid函数也称为S型函数。到目前为止,它是人工神经网络中最常用的激励函数。S型函数定义如下:

1f?Ii?=1+e?aIi (4.4)

式(4.4)中a是Sigmoid函数的斜率参数,通过改变参数a,我们会获取不同斜率的Sigmoid函数。当斜率参数接近无穷大时,此函数转化为简单的阀值函数,但Sigmoid函数对应[0,1]一个连续区域,而阀值函数对应的只是0和1两个点,此外,Sigmoid函数是可微的,而阀值函数是不可微的。 4.1.2 神经网络模型的应用可行性

神经网络模型对任意函数具有逼近能力、学习能力、自组织和自适应能力,能够比较精确的描述因素之间的映射关系。并且神经网络模型在应用中的优势在于,它结构简单,学习方法快,推广能力优异。因而可以对于商业银行的信用风险进行一个较为准确的评估。

神经网络在很大程度上克服了统计模型方法的不足,特别是针对信用风险评估系统的应用特点和数据特点,神经网络表现出更好的针对性和适用性。

(1)神经网络适合处理连续型的数据。对于以财务指标为主的信用风险评估,对连续型数据的处理能力及处理结果的准确性十分重要。

(2)神经网络对噪声数据具有较高的承受能力,在经过一定数量的带噪声的样本训练后,神经网络仍然具有很好的泛化能力。对于分类精度要求较高的信用风险评估问题,神经网络对噪声数据的承受能力使评估模型具有稳定的分类准确率。

18

(3)神经网络对数据分布要求不严格,也不必要详细表述自变量与因变量之间的函数关系。对数据分布的假设是限制传统的信用风险评估方法应用的主要原因,因为大多数信用数据都是随机分布的。

(4)非线性映射能力。在现实世界中,大多数数据关系都是非线性关系,比如信用风险评估指标和信用风险等级之间的关系。神经网络的非线性映射能力使信用风险评估模型更具科学性和准确性。

在信用风险评估系统中,神经网络最主要的任务是从历史数据集中学习隐含在其中的知识,揭露信用风险评估指标之间的内在关系,并建立同实际情况一致的信用风险评估模型。由此可见,神经网络的学习算法对信用风险评估系统有着十分关键的意义。

4.2 基于神经网络模型的信用风险评估模型建立

4.2.1 模型的研究方向

有了合理的建模方法,并不意味着得到了合理的信用风险评估模型。单从模型的角度看,合理的评估模型是必须在具有合理的隐含层节点数、训练时没有发生“过拟合”现象、求得全局极小点和同时考虑网络结构复杂度和误差大小的综合结果。而从全局角度看,合理的评估模型还包括信用风险评估指标体系、样本数据准备及其模式划分、指标数据的预处理方法和评估模型的泛化和改进等等。为了得到合理的信用风险评估模型,本文将从以下方面展开研究。

(1)建立科学、完善和适用的信用风险评估指标体系。这是建立合理的信用风险评估模型的首要条件,因为只有对正确的指标进行学习和分析,才可能得到正确的模型。指标体系的建立包括指标的确定和指标数据的预处理等。

(2)确定评估模型的网络结构。评估模型的输入节点数量由评估指标决定,输出节点数量由信用等级数量确定,而隐含层节点数量是确定模型网络结构的难点。 (3)样本数据的准备。采用 BP 神经网络方法建模要求有足够多的典型性好和精度高的样本。为监控训练过程使之不发生“过拟和”和评价建立的网络模型的性能和泛化能力,必须将收集到的样本数据随机分成训练样本和测试样本(20%)两个部分,数据分组时还应尽可能考虑样本模式间的平衡。

(4)评估模型的训练。BP 网络模型的训练是通过应用误差反传原理不断调整网

19

络权值,使网络模型输出值与已知的训练样本输出值之间的误差达到期望值。模型的训练包括模型参数的初始化及误差函数和精度的选择等工作。模型的训练一般是不断反复进行的,已使模型收敛于全局极小点。

(5)模型的评价和改进。合理的评估模型对非训练样本具有很好的泛化能力,即有效逼近样本蕴含的内在规律,而不是看评估模型对训练样本的拟合能力。要分析评估模型的泛化能力,应该用非训练样本误差的大小来表示和评价。BP 网络模型有很多优点,但也存在很多缺点,比如易陷入局部极小点和学习收敛速度慢等问题,为提高评估模型的泛化能力和训练效率,应对 BP 学习算法进行适当的改进。 4.2.2 模型的建立原理

神经网络模型的三要素摄信息流动方向、网络的拓扑结构和学习方式。 根据信息流向和网络的拓扑结构, 可以将神经网络模型分为前馈网络和反馈网络两大类。前馈网络的神经元分层排列, 各神经元接受前一层输入并输出到下一层, 每一层的神经元之间没有信息交流。前馈网络包括感知机和多层前馈 神经网络两种基本形式。感知机由一个输入层和一个输出层组成, 它只能解决线性可分的分类问题。多层前馈神经网络由一个输入层、若干个隐含层、一个输出层组成, 它可以用来解决非线性分类问题。反向传播(BackPropagation,BP)网络就是一种多层前馈神经网络, 是目前应用最广的一种神经网络。误差反向传播算法(Error Back-propagation Algorithm,简称HP算法)应用最为广泛, 相应的前馈网络称为BP网络。

BP网络的学习由以下四个过程组成:输入模式由输入层经隐含层向输出层的“模式顺传播”过程, 网络的期望输出与实际输出之差的误差信号由输出层经隐含层逐层修正连接权的“误差逆传播”过程, 由“模式顺传播”与“误差逆传播”的反复进行的网络“记忆训练”过程, 网络趋向收敛即网络的总体误差趋向极小值的“学习收敛“过程。

对三层BP网络, 设输入层、隐含层和输出层结点个数分别为I, J, K训练样本的个数为P, 网络的输入为XP?xpi?,期望输出为TP?tpk?,实际输出为OP?op?,输入层与隐含层的连接权为Wq,隐含层与输出层的连接权为Wkj,其中

p??1,2?,P,i?,??1?,2,?I,k,?2,激,活函数为?,?1?,KSigmoid函数

20

f?x??1,则对一个输入样本,平方误差Ep定义为:

1?c?xEp?12 (1) (t?o)?pkpk2kE?12P??(tpk?opk) (2) 2Pk 利用优化理论中的最速下降法对网络进行学习,调整各连接权,可使总体误差极小,学习公式如下:

?pwkj???pkopj ?pwji???pjopj

其中:?表示学习步长,?pk和?pj分别为:

?pk?(tpk?opk)opk(1?opk) ?pj?opj(1?opj)?(?pkwkj)

k4.2.3 样本输入选择

神经网络输入模式的正确选择对财务比率的特征抽取和网络的泛化能力有重要的影响。由于Altman比率在学习研究和实际工作中广泛使用,它能反映企业流动性、盈利性、增长性、偿债性等方面指标,因此本模型选择Altman的财务比率作为输入模式,具体指标如下:

Xp1——营运资本/总资产(Working Capital/Total Assets,WC/TA)。 WC/TA是公司净流动资产相对于总资本的一种衡量, 其中WC是公司流动资产与流动负债之差。

Xp2——留 存 收 益/总 资 产 (Retained Earnings/TotalAssets, RE/TA)。 RE/TA是公司盈利累积性的一种衡量, 它同时考虑了公司的存续时间。

Before Interest andTaxes/TotalAssets, Xp3——息税前利润/总资产(Earnings

EHIT/TA)。EBIT/TA是衡量除去税收或其他杠杆外, 公司资产的真实获利能力。

Xp4——权 益 的 账 面 价 值/总 债 务 的 账 面 价 值 (BookValue of Equity/BookValue of Total Debts, BVE/BVTD)。BVEIBVTD能够说明在公司资不抵债前, 公司资产能够下降多少。

21

Assets, S/TA)。S/TA指资产周转率, 是Xp5——销售收入/总资产 (Sales/Total

一种能够反映公司资产营运能力的标准财务比率, 它可以衡量企业在竞争状态下的管理能力。

系统选取的学习样本既要能反映系统平稳发展时的性质, 又要能反映系统发生突变时的特性, 同时还要兼顾系统发展的各个阶段, 样本必须具有代表性。我们析取大连市36家企业作为样本, 按照银行提供的企业信贷偿还状况, 将这36家企业分为正常和违约(即不能如期偿还贷款的企业)两类。选择28企业作为训练集, 其中正常和违约企业各为14家, 剩下8家企业, 除了留2家作为应用实例外, 全部作为测试集, 测试集中的正常和违约企业各3家。网络输出结果为正常和违约两种, 对应的输出值分别为布尔型离散变量1和0。实验数据如表1。

表1 实验数据

风险状况 正常 企业编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 违约 1 2

WC/TA RE/TA ENIT/TA BE/BVID S/TA 输出结果 0.04170 0.96933 0.48094 0.25853 0.80558 0.999818 -0.01327 0.04287 0.08778 0.15364 0.54995 0.979739 0.00973 0.00000 0.32815 0.27930 0.91725 0.999698 0.04154 0.24085 0.10307 0.22654 0.44152 0.994744 0.20726 0.65363 0.47663 0.32419 0.25223 0.999799 0.21741 0.41938 0.18074 0.21667 0.39426 0.999568 0.10087 -0.11258 0.01140 0.20543 0.17648 0.927517 0.44631 0.36753 0.34236 0.25405 0.37267 0.999860 0.06389 0.10410 0.11967 0.18204 0.75195 0.999007 0.04937 -0.42523 0.01702 0.19094 0.29547 0.828510 0.16479 0.32806 0.35369 0.21104 0.54390 0.999739 0.20762 0.40377 0.27555 0.20004 0.99732 0.999845 0.02086 0.47795 0.22988 0.19810 0.20721 0.991099 -0.00250 0.12103 0.07569 0.12835 0.54636 0.979532 -0.07281 -0.73726 -0.40298 0.12532 0.90715 0.022212 -0.10338 -0.90922 -0.13664 0.10073 0.60240 0.015263 22

3 4 5 6 7 8 9 10 11 12 13 14 正常 1 2 3 违约 4 5 6 正常 违约 7 8 -0.25719 0.04195 0.04300 0.14008 0.37565 0.004390 0.01915 -0.56711 -0.01714 0.18056 0.14388 0.123090 -0.14087 -0.79810 -0.38736 0.20724 0.18243 0.000185 -0.16750 -0.53283 0.01210 0.14078 0.31797 0.005575 -0.08518 -0.19176 0.04077 0.13918 0.19873 0.041799 -0.19181 -0.27714 -0.26876 0.15000 0.31472 0.000385 -0.10084 -0.18692 -0.18959 0.17007 0.10737 0.001104 -0.05068 -0.94407 0.00383 0.15989 0.31669 0.051826 0.10225 -0.21302 -0.25864 0.11396 0.19327 0.057749 -0.07470 -0.26154 -0.08706 0.14418 0.19210 0.007877 -0.12219 0.08419 0.05760 0.11901 0.32661 0.096746 -0.27031 -0.50753 -0.03059 0.13485 0.63986 0.004272 0.16403 0.99248 0.98124 0.18109 0.91316 0.999897 -0.02556 0.01278 0.01278 0.37935 0.08755 0.498990 -0.02556 0.01278 0.01278 0.37935 0.08755 0.498990 -0.04824 -0.79329 -0.02938 0.13960 0.26746 0.023838 -0.38504 -2.17633 0.00740 0.10172 0.27361 0.000136 -0.27678 0.04851 0.05265 0.20493 0.25223 0.002148 0.49737 -0.48981 0.00822 0.25099 0.10684 0.999652 -0.10801 -3.20241 -0.37250 0.11776 0.07141 0.000138 4.2.4 模型的设计 1、权值的修改方式。一般,权值的修改有两种方式:一是对于每一个训练样本,就调整一次权值,称为On-line处理,另一种是输入全部的训练样本后才修改一次权值,称为Batch处理。其差别在于计算?W是从(1)式中的Ep出发还是从有(2)式中的E出发。On-line处理虽与生物神经网络的学习过程一致,针对特定的训练样本,能减少误差,但可能增大其它训练样本的误差,而我们的处理总是以减小总体误差函数为目标,采用后一种处理方式。

2、初始权值与初始输入的确定。由于输入初始值和初始权值对学习是否达到局部最小和能否收敛关系很大,有必要对输入的初始值进行预处理,即归一化处理。我

23

们通过一定的处理方式将初始输入调到较小的区间[-1,1]内,初始权值是通过随机函数生成[-0.5,0.5]之间的随机数赋给各连接权,避免由于大的输入或权值使网络陷入饱和状态。

3.网络层次的选定。有时候,网络层次的增加可减少各隐含层单元总个数,同时使学习过程变得更容易,但可能增加网络的学习时间。在模式空间中,即使各样本分布在相互犬牙交错的复杂区域内,三层神经网络就能构成所需要的复杂判别函数。由于本模型是用于模式分类的判别函数的神经网络,因此我们采用三层BP网络。 4.隐含层单元个数确定。隐含层单元个数的选择是十分复杂的问题,它与所求解问题的要求、输入输出层的单元数都有关系,目前主要依靠经验确定其数目,还没有一致认同的理论指导。一般说来,隐含层单元数越多,越有助于训练样本的拟合,但同时也约束了模型的自由度,降低了模型的泛化能力,形成过度训练。对于三层网络,确定隐含层节点的主要经验法则是:隐含层节点既不是各层中节点数最少的,也不是最多的;隐含层节点数介于输入输出节点数之和的50%一70%之间;隐层节点数应小于学习样本数,若节点数大于样本数,则必有冗余节点可归并,若节点数等于样本数,则网络成为插值网络,插信网络的泛化能力较差。另外,对于三层网络,确定隐层单元数的以下经验公式可供参考。 ①n1?的常数; ②n2n?m?a其中m为输入层单元数,n为输入层单元数,a为1—10之间

?log2n,n为输入层单元数;

nn1p?C(③?i)

i?0 式中p为样本数,n1为隐层单元数,n为输入层单元数,如果i?n1,C(in1)?0经过多次反复试验得知, 在输入节点数为5, 输出节点数为1的情况下, 隐层结点数取3时, 网络收敛最快, 误判率最低。如下图所示。

24

5、权值的调整公式及学习参数的确定采用最速下降法调整权值, ,对那些严重卷绕的非凸函数效果不佳,往往不易收敛,即使收敛也需很长时间,这里采用改进BP算法,加上惯性项,即

?wkj(n?1)???k?j?a?wkj(n) ?wj(n?1)???j?i?a?wji(n)

n?1表示第n?1次迭代,?、a分别表示学习因子和动量因子,此法比最速下降发收敛速度快,对?、a的确定,可以采用试值法: 先初始化?、a的值,再一次调整?、a到合适的值,使网络以较快速度收敛,又不出现震荡。利用试值法得出本模型里的?、a分别为0.9,0.70.

4.3 模型结果及分析

对前述的实验数据进行了计算, 具体数据及计算结果见表1。由计算得到所有28个学习样本的系统误差E为0.002499。从表1可以看出, 在14个正常企业中,只有第10号企业的输出低于0.9(输出为0.828510), 其它输出均大于0.92, 在14个违约企业中, 只有第4号企业的输出高于0.06(输出为0.12309), 其它企业输出均低于0.06;测试样本中只有第2号样本输出不太理想( 输出为0.49899),很难从输出结果判断企业的种类。此时决策者容易犯第一类错误, 即把测试样本中信用好的2号企业误判为信用差的企业, 但这比犯第二类错误(即把信用差的企业误判为信用好的企业) 要好,因为犯第一类错误时, 银行损失的是机会成本, 而犯第二类错误就会给银

25

行带来真正的损失。因此,要尽量避免第二类错误的发生。试验说明, 本模型能达到这一效果。总的来说,本模型判断结果较好, 从训练、测试和应用的结果看, 判断准确率达90%以上。判断率很高的原因之一是神经网络具有很好的知识发现和特征抽取能力, 另一原因可能是所有数据均为内插数据。

26

本文来源:https://www.bwwdw.com/article/gu76.html

Top