搜索
您的当前位置:首页信用风险智能分析系统设计

信用风险智能分析系统设计

来源:智榕旅游
2010年1月 第2O卷第1期 西安电子科技大学学报(社会科学版) Journal of Xidian University(Social Science Edition) Jan.2010 、,o1.2O No.1 _管理学 信用风险智能分析系统设计 赵静娴 (天津科技大学经管学院,天津300222) 摘要:信用评级系统是金融业信息化建设的重要系统之一。文章分析了信用评估系统的需求,结合评估 模型理论,开发设计了一套基于组合优化决策树的信用风险智能分析系统。应用结果表明,系统具有良好的风险 预测能力。 关键词:信用评估;决策树;系统设计 中图分类号:F252 文献标识码: A 文章编号:1008—472X(2010)01—0068—04 收稿日期:2009—1l—l0 基金项目:国家自然科学基金(70671074) 作者简介:赵静娴(1981一),女,天津人,博士,天津科技大学讲师,研究方向:金融工程与数据挖掘。 一、引言 在信用风险分析日益成为金融体系最重要环节,各种衍生金融工具风行的现代金融体系中,如何使 最新的理论成果迅速转化为有效的工具,最大限度的避免信用风险带来的危害正曰益成为紧迫和现实的 问题。尤其是2008年来,美国次贷危机导致的全球金融风暴和经济萧条,对全球经济造成的巨大影响和 损失,使各金融机构和研究部门重新将焦点集中到信用风险分析及其工具的开发上。 因此,本文在对信用风险评估模型研究的基础上,对集成式商业银行信用风险系统的风险评估指标 体系生成模块、决策树训练模块、贷款风险分类等模块的结构、功能和界面设计进行了深入研究,并在 中文Microsoh windows98的开发环境下,用Visual Basic和Matlab,设计和开发了基于组合优化和多层解 析决策树的商业银行信用风险智能分析系统。实证研究的结果表明,系统的风险识别能力强,且具有较 高的自动化、智能化水平。 二、信用评估模型 决策树是一种典型分类方法,其不仅保持了多元参数、非参数统计的优点,能充分利用先验信息处 理数据问非同质关系,而且区别于一般智能算法的“黑箱性”特点,分类结果易与专家意见相结合,表 达形式简单易懂 。 当然在信用风险评估的实际应用中,普通决策树也面临着一些急需解决的问题。例如信用评估中的 很多数据是连续取值的,如何构造一种高效的离散化方法对整个评估过程将起到重要的作用。本文采用 基于边界点属性值合并和不一致度检验的离散化方法(简称BMIC)L2j。此算法只对边界点属性值进行 合并,切点个数无需设定而是自动生成,且合并规则简单易行,大大减小了计算量,适用于处理大规模 高维数据库的离散化。 另外对信用风险评估来说,由于涉及的变量众多,因此在建树前进行变量筛选降维,不仅可以减少 后续环节的计算量,而且可以滤除冗余有害属性对决策树的影响。本文利用分离联系法基础上的输入输 出关联法对属性进行重要性排序【3J,即用样本值的变化而引起的输出变化的累加值作为衡量数据属性重 要性的标准,用公式表示为: IOC(k)=ff"lx(i, )一x(j, )l×sign[y(i)一),( ≠ (1) 其中lOt(k)为第k个属性的输入输出关联值, ( , ), (/, )分别为第i,i个样本的第k个条件属性 值。),(f),y(.,)分别为第i,J个样本的决策属性值。sign(x)为符号函数。当X大于0时返回1,当X 等于0时返回0。 综上所述,基于组合优化决策树的评估算法步骤为: (1)对连续属性运用BMIC算法离散化。 (2)计算各属性,Dc 值。 (3)将各属性按照IOC 值由大N4,aV序,选出IOC 值最大的若干属性作为基本属性集合, 其余为备选属性集合。 (4)在基本属性集合上以属性重要性为节点属性选择标准建立决策树。 (5)在错误率较高的分支从备选属性集合中选取该结点处IOC 值最大的属性续建决策树直到 满足精度要求。 信用评估系统设计 (一)系统需求分析 1.数据输入输出及管理功能:支持二分类及多分类数据的输入或调入两种载入方式;可对源数据进 行打包注释处理;操作者可直接监控阅读数据;与excel、word等常用windows软件无缝兼容;提供实时 自动存储,调用、更新、存储中间结果。 2.最优模型自动生成功能:根据不同问题的参数设定可以自动建立风险分析模型。同时,提供对最 优模型的搜索功能,并通过报表分析比较不同模型的特征。 3.模型动态更新功能:对动态数据库提供实时或定时模型更新功能。可查询更新历史记录。并提 供多种更新模式。 4.决策树显示功能:对决策规则可采用树型直观显示,并提供搜索,匹配等辅助对比分析功能。 5.报告输出功能:提供各主要功能模块结果的统计报告。可设置报告格式,默认格式符合信息量 和直接阅读要求。 6.Windows常用工具功能:支持打印,复制,粘贴等操作系统常用编辑功能。 7.在线帮助功能:可直接打开在线帮助图标,进行点击说明功能。版本更新,同时附带帮助更新。 (二)系统结构设计 系统共包括四个层次,分别为管理层、资源层、计算层和应用层。 1.管理层 主要实现对各种数据,资源和功能的有效而科学的调控和管理;以及数据流,报告报表,诊断及升 级的控制。具体包括: (1)数据管理 外部数据库连接,信息交流。内部数据的建立、维护、存储、检索、排序、统计、修改、删除、恢 复、备份等功能。 (2)模型管理 ①模型的建立、存储及修改的管理。主要内容有:模型构造格式管理、模型存储、模型检索、模型 更新、模型调用等。 ②模型的运行管理。包括:模型运算程序的编译、调试、诊断、自我更新控制。模型预留与相关性 分析等其它辅助分析的接口,可以组合其它方法综合分析。 ③模型参数设置和功能命令选择。系统给出命令集合和参数设置集合,在面对不同任务时可根据需 要组合命令和参数设置以便灵活满足客户需求。 (3)报告管理 系统分析的结果以报告形式进行输出,分析运算采用命令集组合的形式指示给系统。报告管理包括, 格式管理,内容管理,输出频率管理等内容。 2.资源层 各种资源主要包括数据、模型、报告等三大类。数据是建立模型和分析判断样例的基础;模型是支 持决策的基本依据;操作命令通过功能实现,报告是结果输出的主要形式。 3.计算层 模型的建立和对样例的判断依赖于根据程序进行的计算。计算层主要包括模型程序的调用,调试和 更新。 4.应用层 应用层是人机交互的窗口,使操作者方便、自由的参与到系统分析中来,充分发挥思维判断和机器 效率的优势是应用层的主要目标。应用层主要包括如下内容: (1)界面 在系统分析过程中用户通过界面参与、监控分析过程。人机接口最主要是通过贴近自然语言或采用 通用控制方案的菜单、设置、按钮等形式实现。 (2)数据流、报告流的输入输出 人机接口的另一个重要方面是通过数据和报告反映模型状况和分析结果。系统提供了丰富的报告功 能,为快速解读分析结果提供有力支持。 (3)规则的可读化生成及决策树的表示 规则的可读和树型显示是模型所采用算法的优势之一。同时,系统还提供自动检索、匹配、比较等 功能便于进一步分析结果。 (三)系统流程设计 系统流程设计集成了模型的思维逻辑、模块结构及功能设置等很多重要思想,具体流程图如图1所示: _'_…………一…未通过……………一 豳肉自肉 模型库 “模型 判别” 功能 模型选择 输出评级 结果 四、应用实例 采用本文设计的信用评估系统对德国某地区的个人信用数据进行实证分析。数据来源于 http//www.ics.uci.edu/-mleam1996年提供的German Credit数据库 。该数据库包含1000份客户信用资料, 其中“好”客户(Good Credit,不违约)样本700个,“坏”客户(Bad Credit,违约)样本300个,每 个样本有20个属性(信用信息指标)。 导入数据,选择“模型创建”功能并设置参数,如图2所示: 图2:系统运行界面图 70 系统自动生成决策树及测试样本预测结果。为客观的对系统进行评价,特选取了柳炳祥的实验结果 进行对比 。以上文章实验数据的选取与本文完全一致,在方法上分别采用了粗糙集和加权粗糙集两种 方法。 表1:模型测试结果汇总表 违约类 履约类 所用方法 正确率 正确率 总正确率 粗糙集 18.4296 81.5896 f 加权粗糙集 67.35% 32.66% i 本文方法 66.7% 78.1% 74.7% 虽然粗糙集和加权粗糙集的预测总正确率没有直接给出,但还是非常容易可以看出本系统的预测总 正确率最高。从违约类和履约类的判别正确率来看,本系统得出的结果都排在第二,分别次于加权粗糙 集方法和粗糙集方法,但是这两种方法的实验结果有一个共同的特点,就是一类准确率的提高是以另外 一类准确率的大幅度降低为代价的。虽然加权粗糙集违约类的预测准确率比本系统高了0.65个百分点, 但履约类的预测准确率却低了近46个百分点。可见本文设计的评估系统具有较高的预测精度和稳定性。 五、小结 文章在对信用风险评估模型研究的基础上,设计和开发了商业银行信用风险评估智能分析系统,并 进行了实证分析。综合多方面结果表明,系统的柔性较强,如具有多功能选择、属性设置、预选指标标 准设置等功能;系统识别精度较高,且具有较强的容错能力;评估模型的生成具有较高的自动化和智能 化水平;系统同时具有评价指标体系生成、风险评价功能,具有较高的集成化水平。 [注释] ①参看2001年IEEE国际会议文集中HAIXUN WANG和YU P S的“SSDT:A Scalable Subspace—splitting Classiifer for Biased Data” 、 ②参看MURTHY S和AHAD的“UCI Repository ofMachine Learning Databases”,来自:http://www.ics.uci.edu/-mleam。 [参考文献] 【11 TOM M Mitchel1.Machine learning[M].Asia:McGraw—Hill Education,2003:42—47. 【2】赵静娴,倪春鹏,詹原瑞,等.一种高效的连续属性离散化算法[J].系统工程与电子技术,2009(1):195—199. [3】赵静娴,倪春鹏,詹原瑞,等.一种大规模数据库的组合优化决策树算法【J1.系统工程与电子技术,2009(3):583-587. 【4】柳炳祥.基于数据挖掘的企业危机管理及其预警【D】.东南大学,2003 Intelligent System for Credit I sk Analysis ZHA0 JⅡ、『GXIAN (School ofEconomics and Management,llanjin University ofScience&Technology,万a in,300222,China) Abstract:Credit rating system iS one of the most important systems in finance industry.This paper analyzes the demand for the credit information system.and combining with evaluation mode1 theory,develops and designs an intelligent system to analyze credit risk based on combined optimization decision tree.The results show that the credit evaluation system has a remarkable risk forecast capability. Key words:Credit evaluation system;Functional model;Evaluation system 71 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top