蚂蚁消费王喆:图技术可以将金融活动数据相互连接,发现欺诈行为平均时间减少10倍以上

蚂蚁消费王喆:图技术可以将金融活动数据相互连接,发现欺诈行为平均时间减少10倍以上
2023年12月25日 10:54 睿见Economy

股市瞬息万变,投资难以决策?来#A股参谋部#超话聊一聊,[点击进入]

专题:第11届数字金融大会

  2023年12月20-21日,由中关村金融科技产业发展联盟、中关村互联网金融研究院举办的“2023中关村论坛系列活动——第11届数字金融大会”在中关村展示中心举办。

  大会以“强化数字技术赋能 推动金融高质量发展”为主题,围绕数字金融发展趋势,聚焦数字技术在银行、保险等金融业中的新技术、新业态、新模式。以深化数字产业化和金融数字化为主线,打造一流数字金融生态圈,积极促进政产研学跨界合作,助力金融业高质量发展。

  蚂蚁消费金融事业群风控技术部负责人王喆12月21日出席并发表主题为“图技术在金融反欺诈中的应用”的演讲。

  王喆指出,随着数字金融服务的深入,反欺诈风险呈现出两大主要趋势:一是风险量级规模持续上升,从个体风险演变为群体性风险;二是欺诈手段不断升级,从简单的盗号、盗支付密码发展到复杂的洗黑钱、套现等行为。

  他强调,图计算技术通过构建关系网络,将金融活动数据相互连接,实现从已知风险推导未知风险,从而解决数据稀疏问题。此外,图技术还可以对二维数据进行升维,直观展示金融活动之间的关系,便于发现团伙犯罪。

  他对如何运用图论在实际案例中展开分析进行了经验分享。他表示,首先需要基于大量数据,提取其中的关系,生成一系列小图,亦即中介网络图,如商户关系图等。将这些图整合在一起,形成一个拥有万亿条边的巨型时序结构图。这张图能够揭示原先隐藏在数据之间的关联关系,并以图形形式有效地描绘出来,从而极大地提高数据应用和信息分析的收益,进而自动化风控能力提升了25%,发现欺诈行为平均时间减少10倍以上,有效防控了大规模风险的发生。

  此外,王喆还分享了如何通过三个阶段演进图技术在整个欺诈风险防控中的应用。首先尝试利用图技术对单点个体进行精准打击,并在取得一定成功经验后,进一步探索如何从点到面发现团伙性犯罪问题,以协助风控专家解决团伙犯罪问题。在此基础上,尝试利用自动化和规模化的方法建立图平台,以系统化、自动化的方式打击欺诈风险。

  以下为演讲实录:

  尊敬的各位领导,各位来宾,下午好!能参加此次大会,我感到十分荣幸。今日,唐行长及其他领导、黄教授及各位教授均就金融科技在普惠金融领域如何解决实际业务问题和风险管理问题发表了精彩演讲。我今天的演讲主题是图技术在金融反欺诈领域的应用。相较于前几位嘉宾从宏观和系统性的角度出发,我的分享更侧重于实际案例和具体技术应用过程中我们所积累的经验。

  今天我分四个部分来讲图技术在金融反欺诈中的应用,主要包括业务背景、实践,以及实践过程的演进,最后相关的展望和总结。

  第一、金融反欺诈业务的发展趋势。随着数字金融服务的深入,我们的服务客户不断增多,与此同时,反欺诈风险也呈现出两大主要趋势。一是风险量级规模持续上升,从个体风险演变为群体性风险。二是欺诈手段不断升级,从简单的盗号、盗支付密码发展到复杂的洗黑钱、套现等行为。这些变化为我们反欺诈业务带来巨大挑战。

  在此背景下,蚂蚁集团如何运用图技术应对这些问题呢?首先,欺诈风险的一个特点是黑样本较小,欺诈行为具有隐蔽性,且在大量金融活动中占比不高。这为我们传统的机器学习和模型训练带来困难。图计算技术通过构建关系网络,将金融活动数据相互连接,实现从已知风险推导未知风险,从而解决数据稀疏问题。

  其次,反欺诈具有较强的聚集性,多数为团伙犯罪。传统二维数据分析方法难以解决问题。图技术则可以对二维数据进行升维,直观展示金融活动之间的关系,便于发现团伙犯罪。

  最后,欺诈行为复杂多变,具有明显对抗性。传统依靠专家经验打击欺诈的方式往往滞后。利用图技术和金融活动行为刻画,为我们采用机器学习或图学习方式自动化打击黑产、欺诈行为奠定基础。

  第二、我们将探讨如何运用图论在实际案例中展开分析。首先,我们基于大量的数据,提取其中的关系,生成一系列小图,亦即中介网络图,如商户关系图等。最后,我们将这些图整合在一起,形成一个拥有万亿条边的巨型时序结构图。这张图的优势在于,它能够揭示原先隐藏在数据之间的关联关系,并以图形形式有效地描绘出来,从而极大地提高数据应用和信息分析的收益,并为后续自动化算法奠定基础。

  在此基础上,我们针对整个欺诈业务流程进行了标准化。在拥有图数据后,我们对大部分反欺诈业务的工作流程进行了调研,并希望借助图技术优化业务流程,将其标准化为四个阶段,从而实现规模化、自动化地打击黑产问题。首先,感知阶段,通过地下数据形成一个万亿条边的大图,基于此图运行一些机器学习算法和图学习算法,自动化地挖掘风险点。其次,在第二、第三阶段,我们根据风险点邀请专家进行研判。众所周知,欺诈风险的最大问题是缺乏明显数据来判断其是否为欺诈行为,因此需要结合专家经验进行评估。评估后,我们将根据专家意见实施人维度或交易维度的打击,以规范整个金融活动。

  第三、我们重点探讨如何通过三个阶段演进图技术在整个欺诈风险防控中的应用。首先,我们尝试利用图技术对单点个体进行精准打击,并在取得一定成功经验后,进一步探索如何从点到面发现团伙性犯罪问题,以协助风控专家解决团伙犯罪问题。在此基础上,我们尝试利用自动化和规模化的方法建立图平台,以系统化、自动化的方式打击欺诈风险。以下将按照三个阶段分享我们在这一过程中的经验。

  第一阶段为精准打击环节。此前,系统内积累了大量的欺诈类规则,这些规则通过离线大数据系统,采用离线二维表方式进行7+1的欺诈决策。引入图技术后,我们将离线二维表计算转化为图结构上的实时搜索计算。结合蚂蚁中台的图计算引擎,我们成功将原来7+1的处置时效缩短至秒级,为实时打击欺诈行为奠定了基础。

  在解决单点问题后,我们开始尝试利用图技术从点到面发现团伙性问题。欺诈风险具有强烈的聚集效应,高风险客户或行为附近往往存在其他高风险或可疑交易。基于这一认识,我们尝试通过高风险数据和样本推算未知风险节点。在大时序图上进行分析,将问题转化为图上的节点分类问题。

  为解决这一问题,我们提出了一套基于动态图学习的方法,有效克服了传统嵌入方法可解释性较差和信息损失较大的问题。通过抽取万亿条边的大时序图中的可疑交易周边结构和表达,形成以可疑交易为中心,其他节点为附加点的子图交易模式。基于这些子图,我们按时间维度进行切片,构建一系列时间序列维度的可疑交易指数结构。将这些结构输入大型GCN图学习神经网络,可充分利用时间维度和关联性维度信息,实现更好的业务效果。这套方案在原有基础上将欺诈识别率提升了50%以上。

  基于前两个部分的经验,我们开始构建一套自动化的、系统性的平台功能。我们希望建立一个风控图平台,实现规模化、自动化地打击欺诈风险。具体措施分为两个步骤。

  首先,解决核心能力问题。关键在于超大规模图的存储、检索和计算。这其中包含诸多技术细节,不再一一阐述。核心问题在于,整个大图数据庞大,无法单机存储,需将数据分片至各机器,并在读写更新场景中保持事务一致性。此外,针对大图实现5度至10度甚至跨时间窗口的大规模复杂计算,如何在毫秒级内进行优化。

  其次,围绕核心能力,我们推出了一整套从图特征挖掘、图模式匹配到图算法和图学习的工具箱。信贷风控专家可以利用这些开箱即用的工具,自动化地进行欺诈挖掘和识别。借助这套工具,欺诈挖掘和发现的效率提升了10倍以上。

  综上所述,图技术在金融反欺诈和金融风控领域具有显著优势。首先,图能够提升数据维度,使其更具表达力;其次,图结构有助于增强样本特征,提高识别准确性;最后,图能够直观地反映节点间关系,有助于揭示潜在风险。基于这些优势,图技术有效解决了金融欺诈和风险控制领域面临的核心难题,如强解释性需求、样本数量有限以及感知和风险分析能力不足等。

  因此,图技术已逐渐成为我国团队乃至蚂蚁集团风控领域的核心基础设施。我们致力于构建从模型到数据,从模型到策略的全链路欺诈防控和金融防控体系。在这一过程中,我们将严格遵循图结构原则,确保关系型数据和时序型数据在风险策略和模型中得到充分利用。

  第四、未来展望。如各位所见,我们之前所提及的一系列工具与方法,主要采用了黑样本或灰样本,以及有监督或半监督的方式进行欺诈识别。然而,我们现今正积极探索一种更加自动化、启发式的方法,该方法无需依赖样本,可实现无监督的训练与攻防模式。这种方法旨在提前识别潜在的未知风险。众所周知,欺诈风险具有多变性,虽然样本数量较少,但仅凭过去的数据难以预测未来的风险状况。因此,我们采用无监督和启发式的手段,以自动化方式挖掘未知防线,防患于未然,同时保护客户的权益。

  至此,以上就是我今天分享的内容,感谢大家的聆听。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:李昂

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 01-02 西典新能 603312 --
  • 01-02 雪祺电气 001387 --
  • 12-29 博隆技术 603325 --
  • 12-26 捷众科技 873690 9.34
  • 12-22 艾罗能源 688717 55.66
  • 新浪首页 语音播报 相关新闻 返回顶部