提要随着信息技术的发展,企业如何在大量的信息中挖掘出有用的信息,对企业财务风险进行有效的分析和防范,成为企业迫切需要解决的问题。将数据挖掘运用到财务风险的分析中,就能在数据量庞大的财务数据中,对数据进行筛选,提取出有价值的数据,使企业提高财务活动的自觉性,减少盲目性。
一、数据挖掘
(一)数据挖掘的概念。数据挖掘(DM)是近年来随着人工智能和数据库发展而出现的一门新兴技术,它综合了统计学、模式识别、人工神经网络、遗传算法等先进技术。数据挖掘是数据库中知识发现(KDD)中的核心部分,KDD一词首次出现在1989年8月举行的第11届国际联合工人智能学术会上,从1989年至今,KDD的定义随着人们研究的不断深入也在不断完善。目前,比较公认的定义是Fayyad等给出的:KDD是从数据集中识别出有效的、新颖的、潜在的、有用的以及最终可理解模式的高级处理过程。KDD的过程一般包括数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示等。其中数据挖掘,指从数据库储存的大量数据中,提取隐含在其中的、以前未知的、具有潜在应用价值的模型或规则等有用知识的复杂过程,是一类深层次的数据分析方法。提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析,是实现数据上升到知识的必然过程。但在通常的应用中,并不区分KDD和DM的概念。
数据挖掘包含了一系列旨在从数据集中发现有用而尚未发现的模式的技术。数据挖掘的目的是为决策建模,即根据对过去活动的分析预测将来的行为。这也是数据挖掘最吸引人的地方,即它能建立预测型而不是回顾型的模型。
(二)数据挖掘的主要方法。数据挖掘是一种综合性技术,其所涉及的学科领域主要包括数学、计算机科学、管理科学和信息科学等,主要方法有:
1、决策树方法。决策树方法是数据挖掘中经常使用的方法,它可以用来进行数据分析,也可以用来做预测。决策树是一个类似流程图的树型结构,其中每个内部节点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶点代表类或类分布,树的最顶层节点是根节点。决策树建立的过程,即树的生长过程是不断地把数据进行切分的过程,每次切分对应一个问题,也对应着一个节点。对每个切分都要求分成的组之间的“差异”最大。
2、神经网络法。神经网络最早由心理学家和神经生物学家提出,旨在寻求开发和测试神经的计算模拟。由于神经网络在解决复杂问题时能够提供一种相对简单的方法,因此近年来越来越受到人们的关注。典型的神经网络模型主要分三大类:(1)以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;(2)以Hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;(3)以ART模型、Kohonen模型为代表的,用于聚类的自组织映射方法。
3、模糊数学法。客观事物往往具有某种不确定性。系统的复杂性越高,则其精确性越低,也就意味着模型性越强。在数据挖掘过程中,利用模糊数学方法对实际问题进行模糊评判、模糊决策、模糊识别和模糊聚类,往往能够取得更好的效果。
(三)数据挖掘流程
1、数据挖掘环境。数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的、可实用的信息,并使用这些信息做出决策或丰富知识。(图1)
2、数据挖掘过程
(1)确定业务对象,清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。
(2)数据准备。①数据的选择,搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。②数据的预处理,研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。③数据的转换,将数据转换成一个分析模型。这个分析模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。
(3)数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善选择合适的挖掘算法外,其余一切工作都能自动地完成。
(4)结果分析。解释并评估结果。其使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术。
(5)知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。
二、数据挖掘在财务风险分析中的运用
(一)财务风险概述。财务风险指企业由于负债融资导致的净资产收益率或每股收益的不确定性,也是企业到期不能还本付息的可能性。财务风险也称筹资风险,产生财务风险的根源在于,由于举债融资后,预期实现的资产报酬率是否大于债务利率的不确定性。财务风险防范、控制及化解的前置条件是对财务风险及其特点的充分认识。一般地,财务风险具有以下几个特征:
1、客观性。在市场经济条件下,财务风险是客观存在的,不以个人的意志为转移,任何经营活动都存在着两种可能的结果,即实现预期目标和无法实现预期目标,这就意味着无法实现预期目标的风险客观存在,要完全消除风险及其影响是不现实的。
2、不确定性。财务风险虽然是客观存在的,可以事前加以估计和控制,但由于影响财务活动结果的各种因素不断发生变化,因此事前并不能准确地确定财务风险的大小。
3、共存性。财务风险与收益并存且成正比关系,一般来说,财务活动的风险越大,收益也就越高。
(二)运用数据挖掘技术分析财务风险。采用数据挖掘算法建立企业财务风险预测模型,主要包括决策树法、神经网络法和模糊数学法等。
1、决策树法。决策树是建立在信息论基础之上,是数据挖掘中常用到的技术,主要用来找出能描述、区分数据类的模型,以便对类标记未知的对象类进行预测。一种展示类似于什么条件下得到什么值的对数据进行分类的一种方法,可由此预测风险的大小、市场动态变化等。
2、神经网络法。神经网络建立在自学习的数学模型基础之上,具有自组织和并行处理能力、很强的输入\输出非线性影射能力以及易于学习和训练等特点,它可以对大量复杂的数据进行分析,并可以完成对人脑或其他计算机来说极为复杂的模式抽取及趋势分析。
3、模糊数学法。财务风险具有某种不确定性。系统的复杂性越高,则其精确性越低,也就意味着模型性越强。在运用数据挖掘技术对财务风险进行分析的过程中,利用模糊数学方法对实际问题进行模糊评判、模糊决策、模糊识别和模糊聚类,往往能够取得更好的效果。
(三)运用数据挖掘进行财务风险分析的实施步骤
1、确定财务风险分析的对象。清晰的定义出财务风险分析的对象,认清数据挖掘的目的是数据挖掘的重要一步,挖掘的最后结果是不可预测的,但对要分析的问题应该是有计划的,盲目的数据挖掘是不会成功的。
2、准备财务风险分析数据。首先,获取原始的数据,该数据应是企业可用于分析的、逻辑清楚的、易获取的数据,并从中抽取一定数量的子集,建立数据挖掘库。其次,对数据的选择,对所有与财务风险有关的数据信息进行收集后,从逻辑数据中选择出适用于数据挖掘的数据,同时对所选择的数据进行预处理,研究数据的质量,为进一步分析做准备;最后,对数据进行转换,将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。
3、数据挖掘。对所得到的经过转换的数据进行挖掘,在对数据进行挖掘前,应选择合适的挖掘算法。
4、结果分析。对数据挖掘的结果进行评价,并检查构建模型的每个步骤,确认其是否真正实现了预定的目的,选择最优的模型,作出评价,运用于实际问题,并且要和专业知识结合对结果进行解释。
5、知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。运用数据挖掘技术进行财务风险分析。(图2)■
相关热词搜索: 数据挖掘 风险 财务 分析 技术