返回 登录
0

金融科技在互联网金融行业性风险防范领域的应用

业务背景介绍

2006年到2016年十年时间, 中国的普惠金融已经发展成为了中国金融体系的重要组成部分,随着行业监管细则不断落地,行业发展愈加有章可循。但与此同时,借款人的信用风险严重影响行业的健康发展,这里包括借款人多头负债和欺诈风险。这些风险如果得不到很好的防控,将很可能会演化成一个行业的系统性风险。在此背景下,如何做好风险管理与防范成为行业发展的重中之重。北京宜信致诚信用管理有限公司(以下简称”致诚信用”)作为专业从事信用信息征集与咨询、信用数据整合与分析、信用风险评估等企业信用风险管理及其它科技服务的第三方独立机构,基于成熟的信用风险管理经验及数据研发处理和建模能力,向行业持续提供专业、先进的信用产品及服务,为用户提供完善的风险管理解决方案。同时,致诚信用非常重视金融科技在风控前沿领域的探索与应用,致力于通过Fintech驱动金融本身的发展,为行业提供创新型、可持续性的风控保障服务。

互金行业在新金融环境下的挑战

随着互联网金融行业规模的不断扩大,借贷需求持续增加,行业整体的风控水平亟待提升,主要面临的挑战包涵以下三点。

首先,行业数据孤岛现象严重。互金机构每天都会接到大量借款申请,但由于缺乏数据共享机制,机构能够获知有关借款人的信用数据,特别是强金融属性数据的难度非常大。这一方面导致机构无法有效判断客户的风险等级,另一方面也导致多头负债现象频生。这就需要通过技术手段实现信用信息的互联互通,并从海量数据中挖掘有效信息用以识别信用风险。其次,行业恶意欺诈现象越来越严重,欺诈手段不断翻新,且趋于科技化、专业化、规模化,也更具有隐蔽性。这已经严重影响了互金行业的健康发展。第三,金融科技在风控领域渗透度低,行业机构的风控水平参差不齐,很多机构仍采用线下人工的传统信审方式,缺乏金融科技的应用与助力,在风控成本、风控质量、风控时效性上均无法满足实际的业务需求。

致诚阿福解决方案

为防范行业系统性风险的集中爆发,推动行业健康发展,致诚信用推出了致诚阿福风控平台,这是专为网贷机构、消费信贷、小额信贷、银行信用卡中心等提供身份识别、反欺诈、信用评估等服务的一站式智能风控云平台。阿福平台以共享为核心,基于宜信强金融属性数据及先进风控经验、自身大数据分析应用及评分建模能力,结合金融科技创新性应用,采用分布式服务化的系统架构,利用大数据技术,通过Restful API接口方式提供海量数据对接查询服务,帮助信贷机构防范在贷前调查、贷中授信和贷后管理中因信息不对称所带来的潜在风险。

除此之外,阿福平台还提供应用于信审风控的金融科技产品。阿福平台通过数据和技术革新,将知识图谱、大数据等金融科技应用于信审风控领域,以提升机构风险管理的效率和效果,让金融科技成为金融行业发展的动力。

阿福平台架构及架构解析

阿福平台采用分布式架构设计,系统主要包括展示层,服务层,消息层,缓存层,数据层,监控层这六部分。涵盖了从用户请求接收和分发,异构数据的接入和归一化处理,数据模型的构建,对外服务能力的输出,以及系统整体健康度的检测和预警等内容。系统整体架构如下图所示:

图片描述

展示层:

通过使用Shrio和分布式session管理技术,支持不同机构用户动态展示不同菜单功能项,优化了展示效果。同时也通过使用SSO技术,提供各子系统用户统一信息查询入口,包括通过UI界面直接查询和通过RESTful API批量查询,在确保用户体验的基础上,满足了用户多种查询模式的需求。

服务层:

阿福平台使用Dubbo作为分布式服务框架,使用Zookeeper提供的服务的自动注册与发现,使用Hystrix提供服务熔断机制,使用UAVStack提供服务限流和降级,自动化应用/服务画像,无侵入调用链跟踪,一站式线程分析,秒级大规模服务图谱绘制,浏览器访问跟踪,多维可视化看板等功能。

消息层:

使用Kafka和RocketMq提供消息服务, 其中kafka应用于日志信息同步,RocketMq应用于订单等要求高可用的使用场景。构建统一的MessageCenter,支持多种消息中间件,同时抽象出消息的发送和接收,消息限流,消息去重等功能。

缓存层:

使用Memcache,Redis,MongoDB,建立CacheManager,提供统一cache服务接口,分布式锁服务,同时针对对象存储提供透明的序列化反序列化服务,支持无缝扩展NoSQL数据源。

数据层:

采用Mysql+Hbase集群的方式,其中Mysql采用ShardingJdbc进行分库分表,同时为提高读取性能,采用了读写分离技术,一主多从。使用Dbus进行流式同步,解决不同业务系统的数据源的同步效率问题,使数据同步效率从原来的T+1提高到准实时。

监控层:

阿福平台建立多级监控体系,引入ELK+UAVMonitor ,能够对虚拟机,docker,物理机进行基础性能指标(cpu i/o network),jvm,线程状态,服务整体生命周期,服务调用栈,统一日志,数据库连接池等进行全面监控和预警。

以知识图谱为代表的Fintech技术在阿福平台的应用

作为智能风控云平台,致诚阿福除了支持海量数据查询外,也将金融科技融合到平台的整体架构中。以知识图谱为代表,阿福平台将金融科技应用在反欺诈领域,为传统风控带来极具竞争力的革新。目前阿福平台通过对接宜信11年来的海量数据,构建了一个包含企业1亿+实体,4000万+个人实体,50亿+关系量的知识图谱。

图片描述

知识图谱天然地对于数据的存储和组合有着巨大优势,但是不利于进行进一步的分析,在拥有知识图谱的基础之上,阿福平台又对知识图谱进行了优化,形成了一个更适用于金融场景的社交网络图谱。不同于微信、微博等一般社交网络,金融场景下的社交网络更为稀疏,且节点含有丰富的金融属性,状态变化频繁。社交网络的属性描述如下:

节点:基于贷前贷后数据进行用户画像,如进件次数、被拒次数、最近申请时间等;
边:把实体关系细分为own, contact,call等,并通过组合得到人之间的不同关系。

通过构建社交网络图谱,我们可以进行图特征提取,计算人脉信用得分,计算反欺诈得分,进行触黑关联查询等。

图片描述

整个社交网络分析服务模块中,分为三大步骤实现:数据采集,机器学习,数据输出。

数据采集来源于两大块数据,其一是SDK传递的用户设备数据,比如设备基本信息,IP信息,GPS信息等,其二是来源于历史用户授权信息。

针对不同的数据源,我们会采用不同的处理方式。对于实时数据,我们基于Spark Streaming开发了数据导入工具,对其进行数据清洗、格式转换、自然语言处理等相关操作,可以在秒级延迟内将数据导入系统。对于一些历史数据,我们使用Spark和MapReduce进行处理。另外,对于已经存储的社交网络数据,可以通过Restful API结果方式进行查询,也可以将数据导入到Hive中,供数据分析人员进行数据分析。

图片描述

问题难点

在开发与搭建阿福平台的过程中,也存在一些技术上的难点,主要有如下几个问题:

问题一:并发访问性能问题

阿福平台需要应对10亿级的被查记录数据量,千万级访问请求量,亿级的请求分发量,秒级的访问响应时间。上述指标对并发访问性能会有很高的要求,阿福平台主要是从优化缓存命中率和并发访问调度机制来解决如上问题。

解决方案1:提高缓存命中率的优化

建立多级缓存机制,包含内存级缓存和SSD级缓存,内存级缓存过期时间为24小时,SSD级缓存过期时间为7天(可配置),两级缓存的作用下,缓存命中率达到80%以上,缓存集群采用Redis cluster方式部署。缓存失效分为主动失效和被动失效,被动失效采用LRU算法,主动失效为确保查询的信息准确性,在系统容量充足且三方机构健康度指标达标的情况下,主动发起的信息更新行为。

解决方案2:优化并发访问调度机制

考虑到阿福请求分发模块作为一个IO密集型操作服务,采用NIO+连接池的方式提高并发访问性能,减少分布式锁的使用,同时通过多级压测获得单个服务节点的服务能力上限,做到线程数到最佳设置值,最大程度利用系统性能。

问题二: 三方机构的系统稳定性问题

解决方案:

由于第三方机构系统规范程度不同,提供服务的能力参差不齐,如果阿福平台千万级的访问量直接压到三方机构的系统上,绝大部分机构系统都难以承载。即使有缓存层作为防护,但还是会存在缓存穿透的可能性,导致大量请求涌入到三方机构,引发机构的服务雪崩。针对如上问题,我们一方面做好监控预警,另一方面也要充分挖掘三方机构的系统承载潜力。因此,阿福平台引入了一个三方机构系统”健康度”的概念。

健康度是根据三方机构历史吞吐量、响应时间、服务返回数据质量综合计算得出。阿福平台在分发请求时,会根据健康度智能决定查询数据的方式。如果健康度高,能够满足秒级响应,则实时反馈查询结果;如果健康度一般,则从缓存获取,随后异步请求机构,更新缓存内容,从而保证秒级响应;如果健康度差,则直接从缓存获取数据。同时,监控系统也会检测到机构的健康度问题,及时和三方机构进行沟通处理。

问题三:知识图谱的构建过程中异构数据处理问题

解决方案:

构建知识图谱的过程中,需要处理大量的不同数据源的异构数据,如果对每一个新增的数据源都编写对应的adapter,这会极大地影响开发效率,增加维护难度。因此,我们引入了MoonBox和Wormhole来解决异构数据的处理问题。

通过引入上述技术,可以实现支持自动适配不同数据源,包括Mysql,Oracle,HDFS,MongoDB等,透明化异构数据系统异构交互方式,实现跨异构数据系统混算。Wormhole还提供了可视化的操作界面,极简的配置流程,基于SQL的业务开发方式,并屏蔽了大数据处理底层技术细节,使得知识图谱项目开发和管理变得更加可控可靠。

成果总结

提供智能风控决策,大幅提升信审时效

阿福平台通过强大的信用数据分析与挖掘能力,推动数据在风控决策中的运用,帮助机构防范信用风险。作为金融科技与风控结合的创新型成果,阿福平台首先解决了行业数据割裂的瓶颈,在得到客户授权的前提下,以共享为基础,通过分布式架构设计及API接口调用技术,形成了一个行业机构间的共享生态系统,实现了互金行业数据的互联与互通,有效防范了行业多头负债的发生。截至今年10月,阿福平台已经为行业累计预警多头借贷总次数已达1733万次。其中,在2家及以上机构申请借款的总人数达443万人,在5家及以上机构申请借款的总人数达137.8万人,同一借款人最多向38家机构申请了借款。

其次,阿福帮助行业机构将传统线下审批模式升级为线上智能决策的模式,并成功解决了千万级并发访问性能问题,实现了查询结果秒级反馈,大大降低了风控成本、提升了信审效率。

知识图谱提升行业反欺诈能力

阿福平台最大化地将金融科技与业务融合,以知识图谱为底层架构建立反欺诈的风控体系,创新性地研发了福网。福网是一款强金融属性的反欺诈综合评估产品,以经过校验核实的千万级宜信多条业务线的风险数据、超过亿级的社交数据以及其他数据为基础进行整合,在提升数据纯度的基础上有效释放数据价值,通过自然语言处理、机器学习、聚类算法等方法构建模型,创建多维度数据画像。通过量化评分、风险分级,对风险实现最优排序性和区分度,准确识别用户欺诈可能性并为机构反馈精准且区隔度高的风险信息。福网对于欺诈客户的造假手段识别,以及通过构建客户知识图谱、社交关系网络,从更多维度识别隐蔽性欺诈、团体欺诈预警等方面,都取得了非常好的防范效果。截至2017年10月,阿福平台有效识别欺诈借款人31784人,拦截欺诈申请达109367次。

评论