浅谈银行业中数据挖掘的应用

浅谈银行业中数据挖掘的应用

  一、引言 

数据挖掘(Data Mining)是一种新的商业信息处理技术,产生于20世纪80年代的美国,首先应用在金融、电信等领域,主要特点是对大量数据进行抽取、转换、分析和模型化处理,从中提取出有助于商业决策的关键性数据。银行信息化的迅速发展,产生了大量的业务数据。从海量数据中提取出有价值的信息,为银行的商业决策服务,是数据挖掘的重要应用领域。汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者。如今,数据挖掘已在银行业有了广泛深入的应用。

  二、数据挖掘在银行业应用的主要方面 

现阶段,数据挖掘在银行业中的应用,主要可分为以下几个方面。

(一)风险
数据挖掘在银行业的重要应用之一是风险管理,如信用风险评估。可通过构建信用评级模型,评估贷款人或信用卡申请人的风险。一个进行信用风险评估的解决方案,能对银行数据库中所有的账户指定信用评级标准,用若干数据库查询就可以得出信用风险的列表。这种对于高/低风险的评级或分类,是基于每个客户的账户特征,如尚未偿还的贷款、信用调降报告记录、账户类型、收入水平及其他信息等。
对于银行账户的信用评估,可采用直观量化的评分技术。将顾客的海量信息数据以某种权重加以衡量,针对各种目标给出量化的评分。以信用评分为例,通过由数据挖掘模型确定的权重,来给每项申请的各指标打分,加总得到该申请人的信用评分情况。银行根据信用评分来决定是否接受申请,确定信用额度。过去,信用评分的工作由银行信贷员完成,只考虑几个经过测试的变量,如就业情况、收入、年龄、资产、负债等。现在应用数据挖掘的方法,可以增加更多的变量,提高模型的精度,满足信用评价的需求。
通过数据挖掘,还可以异常的信用卡使用情况,确定极端客户的消费行为。根据历史数据,评定造成信贷风险客户的特征和背景,可能造成风险损失的客户。在对客户的资信和经营预测的基础上,运用系统的方法对信贷风险的类型和原因进行识别、估测,发现引起贷款风险的诱导因素,有效地控制和降低信贷风险的发生。通过建立信用欺诈模型,帮助银行发现具有潜在欺诈性的事件,开展欺诈侦查分析,预防和控制资金非法流失。

(二)客户管理
在银行客户管理生命周期的各个阶段,都会用到数据挖掘技术。
1.获取客户
发现和开拓新客户对任何一家银行来说都至关重要。通过探索性的数据挖掘方法,如自动探测聚类和购物篮分析,可以用来找出客户数据库中的特征,预测对于银行活动的响应率。那些被定为有利的特征可以与新的非客户群进行匹配,以增加营销活动的效果。
数据挖掘还可从银行数据库存储的客户信息中,可以根据事先设定的标准找到符合条件的客户群,也可以把客户进行聚类分析让其自然分群,通过对客户的服务收入、风险、等相关因素的分析、预测和优化,找到新的可赢利目标客户。
2.保留客户
通过数据挖掘,在发现流失客户的特征后,银行可以在具有相似特征的客户未流失之前,采取额外增值服务、特殊待遇和激励忠诚度等措施保留客户。比如,使用信用卡损耗模型,可以预测哪些客户将停止使用银行的信用卡,而转用竞争对手的卡,根据数据挖掘结果,银行可以采取措施来保持这些客户的信任。当得出可能流失的客户名单后,可对客户进行关怀访问,争取留住客户。
为留住老客户,防止客户流失,就必须了解客户的需求。数据挖掘,可以识别导致客户转移的关联因子,用模式找出当前客户中相似的可能转移者,通过孤立点分析法可以发现客户的异常行为,从而使银行避免不必要的客户流失。数据挖掘工具,还可以对大量的客户资料进行分析,建立数据模型,确定客户的交易习惯、交易额度和交易频率,分析客户对某个产品的忠诚程度、持久性等,从而为他们提供个性化定制服务,以提高客户忠诚度。
3.优化客户服务
银行业竞争日益激烈,客户服务的质量是关系到银行发展的重要因素。客户是一个可能根据年费、服务、优惠条件等因素而不断流动的团体,为客户提供优质和个性化的服务,是取得客户信任的重要手段。根据二八原则,银行业20%的客户创造了80%的价值,要对这20%的客户实施最优质的服务,前提是发现这20%的重点客户。重点客户的发现通常是由一系列的数据挖掘来实现的。如通过分析客户对产品的应用频率、持续性等指标来判别客户的忠诚度,通过交易数据的详细分析来鉴别哪些是银行希望保持的客户。找到重点客户后,银行就能为客户提供有针对性的服务。

  三、数据挖掘在银行业的具体应用 

数据挖掘技术在银行业中的应用,其中一个重要前提条件是,必须建立一个统一的*客户数据库,以提高客户信息的分析能力。分析开始时,从数据库中收集与客户有关的所有信息、交易记录,进行建模,对数据进行分析,对客户将来的行为进行预测。具体应用分为五个阶段:

(一)加载客户账号信息。这一阶段,主要是进行数据清理,消除现有业务系统中有关客户账户数据不一致的现象,将其整合到*客户信息库。银行各业务部门对客户有统一的视图,可以进行相关的客户分析,如客户人数,客户分类,基本需求等。

(二)加载客户交易信息阶段。这一阶段主要是把客户与银行分销渠道的所有交易数据,包括柜台,ATM,信用卡,汇款,转账等,加载到*市场客户信息库。这一阶段完成后,银行可以分析客户使用分销渠道的情况和分销渠道的容量,了解客户,渠道,服务三者之间的关系。

(三)模型评测。这是为客户的每一个账号建立利润评测模型,需要收入和的确定金额,因此需要加载系统的数据到*数据库。这一阶段完成后,银行可以从组织,用户和产品三个方面分析利润贡献度。如银行可以依客户的利润贡献度安排合适的分销渠道,模拟和预测新产品对银行的利润贡献度等。

(四)优化客户关系。银行应该掌握客户在生活、职业等方面的行为变化及外部的变化,抓住推销新产品和服务的时机。这需要将账号每天发生的交易明细数据,定时加载到*数据仓库,核对客户行为的变化。如有变化,银行则利用客户的购买倾向模型,渠道喜好模型,利润贡献模型,信用和风险评测模型等,主动与客户取得联系。

(五)风险评估。银行风险管理的对象主要是与资产和负债有关的风险,因此与资产负债有关的业务系统的交易数据要加载到*数据仓库;然后,银行应按照不同的期间,分析和计算利率敏感性资产和负债之间的缺口,知道银行在不同期间资本比率、资产负债结构、资金情况和净利息收入的变化。

  四、结语

目前,银行业已逐步走向个性化服务和科学决策阶段,数据挖掘具有强大的信息处理和分析能力,可以为银行提供科学的决策依据和技术支持。在全球化的今天,只有顺应知识经济时代的潮流,充分利用数据挖掘等现代科学技术,才能更好地促进银行业持续、健康的发展。


原文发布时间为:2013-09-16


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

上一篇:从0开始学习JNI开发(三)


下一篇:MSSQL - 最佳实践 - 如何打码隐私数据列