《重构中国银行业信贷风控体系》连载丨第五章:概率派(定量派)在实践中的演进及应用

2025年09月12日09:06    作者:嵇少峰  

  意见领袖丨嵇少峰

  五、概率派(定量派)在实践中的演进及应用

  (一)概率派(量化派)---定量分析从评分法向概率法、因果化贝叶斯网络的历史演进

  信贷风险定量分析方法的演进经历了从静态评分卡到概率化逻辑回归,再到因果化贝叶斯网络的三阶段跃迁。

  早期评分卡通过对借款人的信用相关指标、线性加权财务指标等给出离散风险评分,推导出借款人的还款能力和违约的可能性,虽然操作简便却困于“相关即因果”的误判,这种评分及权重的设置主观性太强,如将企业规模与风险强关联而忽视内在机制。逻辑回归的引入实现了风险度量的概率化输出,通过非线性建模提升了预测精度,通过庞大的样本统计来减少人为评分的主观性,但仍无法解决统计、概率的教条性和真实因果、逻辑推演之间的矛盾,例如混淆企业年龄对风险的双重影响、逻辑回归等量化模型在跨经济周期时的失能。直到贝叶斯网络思想与工具的出现。

  2011年图灵奖得主(计算机界诺贝尔奖),加州大学洛杉矶分校(UCLA)JudeaPearl教授通过开创贝叶斯网络的数学框架、建立的因果推断的现代理论,突破了统计学“相关不等于因果”的局限性,即统计模型、概率法也可以通过技术手段在一定程度上真实模拟、实现因果的可靠推演,即计算机有了人类的逻辑思维及因果推演能力(争论中)。

  Pearl的贡献在于将因果哲学转化为可执行代码,为信贷辩证实践提供“理论→落地”的关键桥梁。将模型概率论(量化学派)与因果推演论(专家策略派)从二元对立转向有机联接,使AI理论上具备了可以实现类似人脑逻辑推演因果的能力。贝叶斯网络是用因果关系箭头连接风险因素,并计算连锁反应概率的智能工具。其核心价值在于同时回答两个关键问题:“风险从哪来?”与“如果干预会怎样?”。

  (二)信贷风险定量分析方法的演进特点

  该演进过程的核心是从静态描述到动态预测,最终迈向因果解释的范式革命。其根本驱动力是为了解决前一阶段方法论的核心缺陷,如下图所示:

  1.第一阶段:静态评分卡——“经验量化”时代

  (1)方法论内核:基于专家经验的线性加权模型。将选定的信用相关指标(如财务比率、年龄、行业)赋予固定权重,通过加权求和得到一个信用分数,以此进行风险排序和决策。

  (2)技术特点:

  线性思维:假设风险因素与违约风险呈简单的线性关系。

  主观驱动:指标选择与权重设定严重依赖专家历史经验,虽有一定统计验证,但本质是“经验的量化”。

  结果输出:输出为一个离散的分数(如650分),而非概率,需要人为设定决策阈值(如600分通过)。

  (3)核心缺陷与局限:

  “相关即因果”误判:无法区分统计相关性与真实因果关系。例如,将“企业规模大”与“风险低”强关联,却忽视了其内在因果机制可能是“规模大→抗风险能力强→违约概率低”。若遇到大而不倒的企业突然崩溃(如雷曼兄弟),模型会完全失效。

  静态僵化:权重固定,无法动态响应宏观经济周期、行业政策突变等外部系统性变化。

  缺乏解释性:只能给出“得分低”的结果,无法回答“为什么得分低”以及“如何做才能提高分数”的因果问题。

  2.第二阶段:逻辑回归模型——“统计概率”时代

  (1)方法论内核:基于历史大数据的统计概率模型。通过非线性函数(Sigmoid)将线性组合映射到[0,1]区间,直接输出违约概率。

  (2)技术特点:

  概率化输出:革命性地将风险判断从“分数”升级为“概率”(如违约概率20%),实现了风险语言的统一和精细化。

  数据驱动:模型参数(权重)通过极大似然估计从数据中学习而来,大幅降低了主观随意性。

  统计显著性导向:变量筛选基于P值、IV值等统计指标,追求预测准确性。

  (3)核心缺陷与局限:

  统计教条主义:依然困于“相关不等于因果”的框架内。模型能发现“企业主年龄”与风险相关,但无法解释其双重影响:可能是“年轻→经验不足”(增风险)或“年长→思想僵化”(也增风险),缺乏因果逻辑的甄别能力。

  跨周期失能:严重依赖“历史重演”的假设。当经济环境发生结构性变化(如2008年金融危机、2020年疫情)时,基于过往数据训练的模型会迅速失效,因为其无法理解危机背后的因果机制。

  模型盲区:对于数据中未出现过的新模式或“黑天鹅”事件,模型毫无预见性。

  3.第三阶段:贝叶斯网络与因果推断——“因果概率”时代

  (1)方法论内核:概率图模型与因果科学的结合。用有向无环图(DAG)显式地编码变量间的因果关系,并在此基础上进行概率计算。

  (2)技术特点:

  融合因果与概率:既保留了概率论的量化能力,又引入了因果关系的逻辑框架。实现了“因果为骨,概率为肉”的统一。

  回答干预问题:其核心突破在于do-演算,能回答“如果干预某一变量(如要求企业追加抵押物),违约概率会如何变化”这类反事实问题。

  透明可解释:将模型决策过程转化为可视化的因果链,例如:“降息→企业财务成本下降→现金流改善→违约概率降低5%”。

  (3)核心革命性价值:

  破解“相关不等于因果”:通过因果图区分混杂因子、中介变量,识别出真正的风险驱动因素。例如,发现“低学历”与“高违约”的相关性是由“低收入”这个混杂因子造成的,从而避免对高收入低学历群体的信贷歧视。

  实现动态推演:允许将外部知识(如专家经验、即将出台的政策)作为先验概率输入模型,模拟外部冲击下的风险变化,极大提升了模型的适应性和鲁棒性。

  桥接人类智慧与机器计算:将专家的定性因果知识(如“过度投资是风险先兆”)转化为可计算的模型结构,使AI不再是黑箱,而是人机协同的因果推理平台。

  (4)贝叶斯网络技术与实践困境

  尽管贝叶斯网络技术是一项革命性的技术突破,但仍然存在技术的瓶颈和实践中的困难,主要表现为

  a因果图构建的主观性与争议性:模型的整个推理基础依赖于一个有向无环图(DAG)的准确构建。然而,确定变量之间因果关系的方向(谁因谁果)极度依赖专家先验知识。不同专家对同一业务问题可能给出截然不同的因果图。这引入了巨大的主观性,与数据驱动决策的初衷相悖,可能导致“垃圾进,垃圾出”,且验证一个因果图的正确性极其困难,缺乏黄金标准。

  b数据需求苛刻,反事实数据难以获取:现实中我们永远无法同时观测到一个主体“接受干预”和“未接受干预”的两种状态;模型依赖于寻找或构建“替代性反事实”(如通过匹配、工具变量等方法),这些方法本身假设很强,在复杂的信贷场景中很难满足。要得到可靠的因果估计,对数据的质量和数量要求远高于相关性模型。

  c计算复杂度高,工程化落地难:贝叶斯网络的推理和学习(特别是大规模网络)计算成本非常高。相较于逻辑回归、梯度提升树(XGBoost)等模型,贝叶斯网络的计算和训练速度慢,难以满足消费信贷毫秒级的实时审批要求。将其集成到现有的、基于传统机器学习的风控系统体系中,还需要巨大的工程改造和算力投入,投入产出比(ROI)是银行IT部门首要考虑的问题。

  第三阶段的贝叶斯网络与因果推断,在理论上为我的信贷辩证认识论提供了坚实的技术落脚点。它将概率量化(客观数据规律)与因果阐释(机制解释与社会建构)动态地统一在了一个可计算、可操作的框架内,使信贷分析从“预测”走向“解释与干预”,真正实现了从“知其然”到“知其所以然”的飞跃。

  (四)概率法演进图示

  (五)信贷实战案例

  下面我分别就消费信贷、经营性信贷为案例背景,介绍概率法三个发展阶段、三个代表性方法的特点与差异

  1.第一个案例(消费信贷)

  用户:张三,一名28岁的程序员,月收入1.5万元,申请一笔5万元的消费信用贷款。数据:央行征信记录良好(无逾期),负债率为55%。

  (1)评分卡方法案例:规则的、经验的、非黑即白

  方法核心:基于专家经验的线性加权打分。一套“if-then”的硬性规则。

  分析过程:银行系统调取张三的数据,与预设的规则库进行比对并打分

  年龄(28岁):+80分(规则:25-35岁为黄金年龄,加分)

  职业(程序员):+70分(规则:职业稳定,加分)

  月收入(1.5万):+75分(规则:>1万元,加分)

  负债率(55%):-60分(规则:>50%,扣分)

  征信逾期记录(无):+100分(规则:无逾期,满分)

  最终总分:265分(满分500分)

  决策特点:

  决策:银行规定“总分高于250分予以批准”。系统自动批准该笔贷款。

  特点:透明直观:拒贷原因明确(如“因负债率过高扣60分”);僵化教条:无法理解上下文。它不知道张三55%的负债是因为刚买了新房(良性负债),还是因为透支了多张信用卡(高风险负债)。它只机械地执行“大于50%就扣分”的规则。

  (2)逻辑回归模型案例:统计的、概率的、但盲目的

  方法核心:基于历史大数据的统计关联,预测违约概率。

  分析过程:银行将张三的特征向量(年龄、职业、收入、负债率等)输入一个由数百万用户数据训练而成的逻辑回归模型。模型发现,在历史数据中,具有“高收入、高负债、无逾期”特征的客群,其违约概率分布为15%~40%。

  模型输出:张三的违约概率为28%。

  决策特点:

  决策:银行风险策略规定“违约概率高于30%拒绝”。因此,系统建议批准。

  特点:概率化输出,比评分卡的“分数”更精细,直接给出了风险的量化估计(28%);数据驱动,结论源自历史数据规律,而非人为设定权重,更客观;“盲目”与局限,模型只知道相关性,不知道因果关系。它知道“高负债”和“高违约”经常一起出现,但无法解释为什么。它无法区分张三的负债是“好”是“坏”,也无法预见他下个月是否会被裁员。它的判断基于“历史会重演”的假设,在遭遇结构性变化(如经济危机、行业寒冬)时容易集体失灵。

  (3)贝叶斯网络案例:因果的、解释的、可干预的

  方法核心:模拟因果机制,进行概率推理与反事实分析。

  (4)总结:三者的本质差异

  这三个案例清晰地展示了消费信贷风控从“经验主义”到“统计主义”,最终迈向“因果主义”的演进路径。

  2.第二个案例(经营性信贷)

  “快洁餐饮有限公司”申请200万元流动资金贷款。基本情况:成立3年,主营外卖快餐,近一年销售额增长较快。核心数据:资产负债率65%,当前负债总额300万元,年销售收入800万元。

  (1)静态评分卡方法案例

  方法核心:线性加权,经验驱动

  分析过程:

  信贷员将“快洁公司”的各项指标代入银行预设的评分模型:

  企业成立年限(3年):扣10分(规则:不足5年扣分)

  资产负债率(65%):扣15分(规则:>60%即扣分)

  行业(餐饮):加5分(规则:民生行业加分)

  ...(其他指标)

  最终得分:72分(满分100分)

  决策与缺陷:

  决策:银行规定“70分以下拒绝”,因此该笔贷款勉强通过。

  缺陷:模型无法解释为何扣分,也无法回答:虽然负债率高,但如果其销售收入增长迅猛且现金流充足,风险是否依然很高?这是一种僵化且缺乏因果逻辑的判断。

  (2)逻辑回归模型案例

  方法核心:统计关联,概率预测

  分析过程:

  银行AI模型将“快洁公司”的数据输入基于数十万笔历史贷款训练的逻辑回归模型。模型发现,历史数据中“资产负债率>60%”且“成立年限<5年”的企业群体,其违约概率为28%。

  模型输出:该客户违约概率为25%。

  决策与缺陷:

  决策:银行风险政策规定“违约概率>30%则拒绝”,因此系统建议通过。

  缺陷:模型知其然,不知其所以然。它只知道历史统计关联,但无法解释“为什么”是这个概率。

  致命问题:如果该企业高负债是因为刚刚购入一台高效节能设备,未来可大幅降低运营成本,这一正面因果因素被模型完全忽略。

  反之,如果其销售增长是通过“烧钱补贴”换来,不可持续,这一负面因果因素模型也无法识别。它只是一个基于历史模式的概率望远镜,看不到未来的具体路径。

  (3)贝叶斯网络(因果推断)案例

  方法核心:因果推理,干预分析

  分析过程:

  系统构建并运行一个因果图模型,不仅输入数据,还嵌入了行业知识和因果关系:

  模型进行计算和推演后,输出结果:

  核心诊断:当前违约概率为22%(与逻辑回归结果差异不大)。

  关键因果路径:模型识别出“购入设备→成本下降→现金流改善”是压倒“负债率高”的核心积极因素。

  反事实模拟:信贷员提问:“如果”明年餐饮行业陷入价格战,其销售收入下降20%,会怎样?

  模型模拟后输出:违约概率将升至38%。

  决策与优势:

  决策:基于模型对因果机制的清晰阐释,银行批准贷款。但同时,根据干预模拟结果,在合同中增加条款:要求企业将未来现金流的30%优先用于偿还本笔贷款,以抵御潜在行业风险。

  优势:该方法不仅给出了概率,更回答了风险来源(负债率的成因被良性因素抵消)和如何进行风险缓释(增加现金流约束条款),实现了从被动预测到主动管理的飞跃。

  (4)总结对比

  这两个案例清晰地展示了信贷分析从经验总结到统计预测,最终走向因果理解与干预的演进之路。

  这个举例并不能精准地展现贝叶斯网络的精神,但基本接近。继贝叶斯网络之后,又出现了很多类似或在其基础上延展出来的思想与工具,都是为了解决模型和人工智能仿真人类的因果推演等能力。但受科学所限,距完全代替人类的因果推演能力还遥遥千里。

  (本文作者介绍:曾在人民银行、银监会系统工作十六年,后从事私募、融资担保、小额贷款、金融科技工作。小微信贷行业代表性人物,中国小微信贷机构业务创新合作联盟发起人,小微信贷实战专家,互联网金融知名评论者,财经专栏作家。著有《为什么说99%的P2P终将死亡》等一系列热点文章,多次准确预判小微信贷市场走向与监管趋势。)

责任编辑:张文

  新浪财经意见领袖专栏文章均为作者个人观点,不代表新浪财经的立场和观点。

  欢迎关注官方微信“意见领袖”,阅读更多精彩文章。点击微信界面右上角的+号,选择“添加朋友”,输入意见领袖的微信号“kopleader”即可,也可以扫描下方二维码添加关注。意见领袖将为您提供财经专业领域的专业分析。

意见领袖官方微信
分享到:
保存  |  打印  |  关闭
快讯:百度短线下挫跌超7% 文心一言正式发布 315晚会曝光假香米、非标水泥管等,多地连夜处置涉事企业 一图读懂丨“315晚会”都曝光了什么?点名了哪些企业? 刚刚!林毅,被查!2000亿白马跳水!上海突发!警方出手:刑拘! 女学员单飞歼11B向家人报喜笑得真甜 河南某县美术馆馆长群聊发不雅照 解释称手机中病毒 补壹刀:今天最大的国际笑话,但可能是一盘大棋! 视频|红色通缉犯郭文贵在美国被捕 奇葩的创维汽车:碰撞试验0分,专攻司机养生,创始人豪言“开车可续命” | 次世代车研所 “反华五人帮”曝光