以Nebula Graph为数据库的关联图谱在某国有银行反欺诈项目中的实践

Cyan
2022-06-24

Nebula Graph use case

背景介绍

邦盛科技是国内科技领域的头部服务商,凭借其出色的解决方案能力服务了众多大客户。邦盛科技是首批 “Nebula Graph 同路人” 计划成员之一。

本文来自于邦盛科技知识图谱业务专家孔庆鑫在 Nebula Graph 金融行业知识图谱解决方案专场上的分享的第二部分:知识图谱平台及应用案例介绍。

邦盛知识图谱平台介绍

概览:知识图谱平台大图

知识图谱平台大图

本期先介绍下邦盛的知识图谱平台。作为一个中央级的平台,首先要应对的是多业务线的需求,所以我们基于知识图谱的技术,构建了集企业底层的数据源接入、图谱数据管理,再到上层图谱平台化应用的一体化平台。

底层的数据层可以满足不同数据清洗、接入的需求,支持多种数据通过流式或批式接入,然后在图数据库中进行点边结构映射,继而在图谱平台中完成图构建、图分析、图挖掘、图决策等操作。这里还会集成可视化的操作组件以及各类算法,以适应顶层不同业务线的需求,如反欺诈、营销、运管、企业担保等。

我们用的是 Nebula Graph 图数据库,在业务过程中也进行了很多交流,再加上我们的专家经验,所以在点边结构挑选和精简方面经验是非常多的。

图谱平台功能1:图构建

图谱平台功能1:图构建

图谱平台在应用方面还有很多核心功能,第一个核心功能是图构建。我们有三种构建方式,包括可视化建图、可视化入数,离线批式与实时流式入数。作为一个中央级的平台,肯定不只一个业务部门在用,所以权限隔离和数据共享也是我们在很长一段时间里打磨的重点功能。入数方式上支持大概7种,包含批式、流式的方式,还有数据源,比如常规的关系型数据库入数,中间件 Kafka 入数等都是支持的。

图谱平台功能2:图分析

图谱平台功能2:图分析

第二个应用是图分析,包括交互式分析、智能化分析、还有性能优化。因为我们的平台集成了很多可视化的分析工具来提供简单易用的交流,比如时序分析。这里还会有很多即时算法,还有路径分析、环路查找、异常识别等等。我们在分析的基础上,还根据实际业务经验做了很多数据调优,尤其是对于演变结构的精简,因为知识图谱产生到最后还是要服务于决策,服务于业务,这才是最终目标。

图谱平台功能3:图指标

图谱平台功能3:图指标

图指标就是我们经过图分析后,直接提取的一些图谱网格特征,并形成的一种计算指标。这个计算指标会和专家规则的指标联动,对上层决策进行调优。

图指标比较简单的一个用法就是用相近的关联关系去触发黑名单,但更多的时候我们习惯把图指标和专家规则类的统计指标、模型特征放一起来做融合决策。需要特别说明的是,我们说的融合,是指在编译层就做了一些融合,最后跑出来的结果是同一批,也就是说融合决策在这个阶段我们就是做在一起的。

图指标主要应用有两个,刚才也说到,第一种是事中的决策,第二种是事后的分析,分别是实时和事后,也是目前在图指标上的两个典型的用法。

图谱平台功能4:图算法

图谱平台功能4:图算法

还有图算法。相比图指标来说,图算法其实就是对于关联动作进行更深的挖掘。像模式匹配,就是经过业务定义之后,去筛选资金链路闭环的一些风险模式,刚才也说了是一种一对多、多对一的模式,还有洗钱也会出现很多闭环的风险模式,在定义好之后都可以放在图谱的数据库中进行跑批,这是模式匹配。

另一个用法是社团发现,用 Louvain 算法进行社团分割,形成一个团给业务去核查分析。除此之外对担保圈还有一些风险传导的算法,这些都是我们根据金融反欺诈的特征模式总结抽象,最后融合到了系统功能中去。我们也支持一些自定义算法,比如业务员通过图语言写一些自定义算法,上传到图平台后给业务人员用,逐渐就形成一个通用化的做法。

图谱平台功能5:图服务

图谱平台功能5:图服务

再进一步就是在这个图的服务能力,我们提供了三种能力,包括图分享、图查询,还有图分析集成。第一种,图分享指的是分析得到的一个子图,给没有出入平台权限的人去看。第二种是图查询,像图中展示的这样,通过看核查单上 URL 的方式去发布图谱分析的一些结果,辅助风险的判别。第三种,是我们在业务系统中嵌入图分析还有图查询的一个全部能力,来构建图谱平台,还有各个业务系统,比如说交易反诈的系统,申请反诈系统或者信贷决策的系统,他们之间数据的全面打通,这就是说服务平台和其他业务需要先进行一些联动,比较简单的是 iFrame,如果需要集成的深度的话,就是全面的数据打通。

应用架构:整体视图介绍

应用架构:整体视图介绍

整个图谱的应用架构上,最左边的是给建模工程师使用的,然后右边是给业务人员用的,结合业务上的各个生产渠道,比如风控面反洗钱安全系统,再聚焦一些业务场景,比如说反欺诈、涉赌涉诈、团伙套现进行一些机器的分析,还有一些离线的分析。下面对应的是我们刚才介绍到的一些功能,然后建模工程师将左侧知识构建的数据源处理好后,定义好这个节点边属性关系,交给业务人员进行一些知识的挖掘知识的分析,这个过程中会用到我们事先定义好的一些功能算法,最后按照说图谱的能力对外进行发布。

关联图谱平台在某国有银行反欺诈的实践

项目背景

这部分来分享一个案例,看一个银行如何通过图谱,解决信用卡申请团伙欺诈的问题。案例背景是在普惠金融背景下,银行线上业务发展越来越快,信贷业务开始线上化迁移,那么风险敞口、以及客群质量都面临着难题。传统反欺诈主要依靠专家规则,但伪造这类的成本很低,对群体性、大批量的欺诈,尤其是团伙欺诈风险,并没有好的管控措施和监测方式,风险识别难度越来越大。

项目概述

这个项目实施的时候也是引入了图技术。首先,我们去给银行构建了一个可视化的分析平台,业务人员可以去看一些欺诈行为,开展分析调查工作。其次,利用图谱技术还有探索功能,可以开发了针对于团伙欺诈的图规则。再次,在整个分析过程中会产生很多的图特征,我们都融合到了机器学习模型中去,完成了原有机器模型的优化,大概是这三点事情。

项目过程

然后说这个项目实现过程。我们在这个项目中开发的,其实并不单单是一个图平台或者说一个系统平台,其实是想做出一个实际的业务效果。我们当时做了大体是四个阶段的事情,第一阶段是整体的数据探索,包括数据怎么筛选,欺诈的标签怎么定义。第二阶段是根据实际业务场景定义图谱的点边关系,我们都会根据实际业务场景进行一个设计。

第三阶段是从单维度的图规则到多维度的防伪规则,这里规则如何去设计,其实更多是由数据进行支撑的。前三个阶段所做的所有的工作、关系维度的特征我们会一同带到第四阶段——机器学习建模过程中去,同时初步发现的一些团伙也会给模型做样本学习,这样整体的反诈效果会更加精准。

如何实现

step 1:初步探索欺诈数据

这个项目中我们做了非常多金融反诈图谱的探索,以往大家总是想去定义图谱这个概念,但其实再先进的算法,都要融合业务逻辑进行一个定义。想要出实际业务效果,会涉及到一些问题。在整体数据探索中,尤其是对数据的筛选,欺诈标签的定义,这些都是我们首先要面对的过程。在这个过程中,对每个社团每个团伙的社会属性分析也非常重要。

step 2:设计关联关系

这个标准有了之后要在图谱设计出关联关系。我们会精细挑选什么样的节点可以入图,但这些节点不是越多越好。虽然图谱的数据库能力在不断增加,Nebula Graph 的数据库性能也是非常的强悍,但从邦盛科技在对银行的应用实践中发现,数据体量很大的情况下,如果增加节点,边和属性同步也会带来很大的增长,实际应用中展现过多点边以及过多的关系维度,会造成业务人员在图的可视化查询和落地方面使用不便,所以我们认为需要结合金融机构,尤其是银行的实际业务场景去定义图谱的点边关系。

step 3:建立单维度规则

这个过程中挑选其实非常考验经验的,在大量的单维度规则中,需要把团伙标签点边关系定义好。我们做了非常多的单维度图规则,主要从共性关联、重合度、集中度、资金流向等几个方面来思考。

step 4:建立多维度规则

做出单维图规则之后,我们更多要考虑的是如何建立多维度规则,并服务于我们的业务。这里面挑选合适的指标需要非常强的业务经验,才能做到。通过我们之前建立的单维度规则,结合特征重要性的程度,同时结合业务上的考量因素,我们会做交叉组合及后续的规则分析。

step 5:数据建模

与传统的反欺诈不同,传统反欺诈主要考虑统计类指标,如金额、时间等特征,我们通过引入关联图谱,增加了关系维度,这是传统反欺诈所很少考虑的因素,从效果上看,明显优于传统反欺诈效果。对银行而言,核查人员通过可视化的分析手段分析业务中的团伙欺诈手法,从而来总结出关键特征,不仅分析了最新的欺诈手法,还可以对一些专业规则做调优。

我们讲这些比较宽泛,但在银行实践过程中,我们还会使用很多模型和决策方式,这是我们整个项目做的一些事情。

项目效果

从这家银行最终的项目效果上来看,我们最终是帮助行方欺诈率显著降低,辅助业务有了创新发展,黑样本发现也在出现了几倍的效果提升。

通过这个项目我们也更多地去考量图谱怎么和专家经验结合开发图规则,继而丰富模型——这也是目前服务这个行业,考虑客户体验的同时,满足监管要求,达到行方欺诈风险监控的一种较好的办法。

邦盛公司简介

公司背景

最后简单介绍一下我们公司——邦盛是成立于 2010 年,将近 12 年间一直专注于做技术的研发和实践。当时在 2010 年到 2015 年时,国内自主研发的实时计算领域其实是一个空白,很多的银行、支付公司,包括一些大型的互联网金融公司,都会使用一种国外的风控系统。这时候我们也是通过底层的技术研发,走了一条自主创新的道路,然后像实时指标的计算引擎——流立方,也是获得过几个比较重磅的奖项,像中国电子学会的特等奖,还有教育部的科技进步一等奖;机器学习、关联图谱、智能决策平台,都是沿着这条道路展开的。

邦盛科技简介

其实邦盛这个名字也是取自于国邦昌盛,为自己国内的金融风控安全贡献力量的意思。目前服务的客户群体也不局限于银行或三方支付等金融机构,也涉及智慧交通、信息通讯,还有政府服务部门,比如公积金机构和一些铁路、政务等民生平台。

荣誉&客户

公司的荣誉和资质——包括 50 多项发明、100 多项软著,还有目前在 CMMI5 国际上最高等级的认证,在项目交付和方案研发这几个方面做到了最高的等级。 今天分享的主题是关联图谱,但其实我们在中央级反诈、大数据智能案防、涉赌涉诈账户防控等领域都有解决方案,每个解决方案会有产品技术和业务规则模型来组成,关联图谱平台作为一个很关键的组件,在各套解决方案中都扮演着一个很重要的角色。

邦盛智能风控产品运营体系

目前,包括 4 家国有行、12 家股份制银行中的 11 家,还有全国头部排名前 10 的城商行以及 70% 以上的三方支付风控市场都是我们的客户。一些政府机构也跟我们进行了深度合作,如中国移动、中国铁路 12306、各地公积金机构等都是我们服务的客群。

作为以技术起家的公司,目前我们各个核心组件也在不断迭代和更新,业务专家驻场过程中也会不断总结欺诈手法,迭代反欺诈策略——今天因为时间的关系就分享这么多,也欢迎各位老师跟我们进一步沟通交流。

最后再次感谢 Nebula Graph 的社区,我的分享就结束了,谢谢大家。

欢迎来到 Nebula Graph!有什么可以帮您的吗?