• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    基于行业知识与知识图谱的会计案防智能平台

    时间:2022-12-02 08:00:04 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    陈 强,代仕娅

    (1.兴业银行 信息科技部,上海 201201;
    2.兴业数字金融服务股份有限公司,上海 201210)

    随着商业银行的业务范围不断拓展,经营环境日趋复杂,会计风险案件的发生也日益频繁,涵盖了资金诈骗、虚假交易、恶意刷单、非法集资等多种多样的作案方式。会计风险事件一方面风险案件涉及金额通常较大,一旦发生将给商业银行带来严重的资金损失并产生较负面的社会声誉影响;
    另一方面各类风险事件的作案方法越发复杂,内外部勾结、团伙合作等案件较难及时察觉,银行往往缺乏有效的识别手段。这些都对银行传统的风险管理模式提出更严峻的挑战,需要借助新技术、新方法来实现更有效的应对。

    近年来,金融科技蓬勃发展,驱动金融业务经营与管理模式的创新变革。央行《金融科技发展规划(2019-2021年)》明确指出,金融科技已成为防范化解金融风险的新利器,是新形势下金融风险管理的内在需求和重要选择。以大数据、人工智能、知识图谱等为代表的前沿技术能够对更多类型、更丰富的数据进行处理计算,从纷繁的信息中提炼、挖掘出潜在的风险特征,实现早识别、早预警、早管控,从而降低风险事件的损失,提升风险管理的时效性、前瞻性与精准性。

    该文将金融科技相关的思维、理念与技术融入会计案件防控业务中,提出一种将传统的会计案防业务规则与金融知识图谱相结合的会计案防智能化平台建设方案。该文将重点介绍平台的整体架构,阐述大数据、知识图谱等技术在平台不同层面的交互应用,以及在此支撑下形成的全流程、自动化运作体系。最后,基于真实的金融行业会计欺诈案件以及多维业务数据,展示该平台的智能化运行及对风险案件的识别效果。

    1.1 商业银行风控的智能化探索

    商业银行在防范会计欺诈案件时往往基于业务经验以人工方式进行排查,一是经验规则组合的覆盖范围有限,较难发现全局性、关联性的特征,对团伙这类复杂的欺诈模式识别力度不够;
    二是核查方式多偏向于事后检查,时效性较低,且需耗费大量的人力,难以对风险事件进行及时的管控,故需要充分借助信息科技手段来提升会计案件风险防范的智能化水平。姜增明等(2019)指出商业银行反欺诈的关键在于建立以大数据为支撑的风控体系,采用知识图谱、社交网络分析等技术以更有效地防范复杂模式下的欺诈风险;
    吴建光(2020)指出金融科技在会计非现场监控工作中的应用实现了对会计异常数据的自动监控、自动预警、自动通知,能有效提升会计监控的效率。

    1.2 行业应用平台的智能化创新

    大数据平台、人工智能平台等作为重要的新型技术基础设施,推动着各行业各领域的数字化、智能化转型。康波等(2019)提出了面向行业应用场景的大数据、人工智能等基础平台融合建设方案,实现数据的整合共享、高性能计算和统一数据建模,并基于平台推出了面向智能诊疗、智能辅助驾驶等多领域的应用。曹峰等(2018)指出金融等传统行业对人工智能应用的需求不断提升,相关计算平台和应用服务平台的统筹建设,是垂直行业智能化产品落地的重要基础,能有效推动社会经济智能化水平的提升。工商银行基于大数据、人工智能技术搭建了新一代反洗钱智能平台,对海量金融交易进行监测,在降低异常交易预警的同时,也极大地提高了欺诈交易的命中率。

    该文将传统会计案防领域的业务规则与大数据、知识图谱等技术相结合,构建了面向金融行业的会计案防智能化平台,将金融业务中实际发生过的15个代表性会计欺诈案件为设计蓝本,对行业规则进行指标化拆解与计算,并构建金融知识图谱以提取与挖掘关联风险特征。实验结果表明,所构建的智能化平台实现了全流程、自动化的会计案件防范规则配置,并能对会计风险事件进行有效的甄别、预警与监控。

    2.1 智能化平台整体架构

    会计案防智能化平台主要由数据处理层、智能分析层、业务应用层等部分组成,能对会计案件核查规则进行自动化配置,以实现风险的智能化核查、分析、预警等功能。平台的整体架构如图1所示。

    图1 会计案防智能化平台架构

    整个会计案防智能化平台最底层连接各业务领域的数据系统,采集账户、企业、个人等会计案件多维度信息,为风险识别提供基础数据来源。

    数据处理层集成了多种主流大数据相关功能组件,实现了从原始数据采集、转换、加工、各式处理及复杂业务计算的全过程。该平台主体采用Hadoop分布式系统架构,在MapReduce批量处理的基础上,通过Hbase和Phoenix解决统一查证准实时查询性能问题;
    基于Spark生态系统,借助Spark Streaming对会计案防业务中的账户交易等实时信息进行处理,依托采用Spark mllib满足案防场景中机器学习建模的需求,通过SparkSQL实现案防场景复杂规则计算和灵活的数据探索。同时,将会计案防相关主体和关系以节点、边的图数据模式存储在图数据库中,供进一步的图查询与图计算。

    智能分析层在数据存储及加工的基础上,对行业知识与金融知识图谱关联特征进行提炼、展示与配置。其中,指标体系是对金融行业知识充分归纳、沉淀的结果,将会计案防业务逻辑进行解析,形成基础指标库,是识别会计案件风险的重要基础知识。金融知识图谱平台依托各类图计算引擎,采用多种图分析方法,在关联图谱的基础上结合业务分析经验挖掘提取关联规则,能更充分地识别隐藏的深层语义联系。决策配置平台将基础指标与关联风险特征相结合,构建出完整的规则指标体系,并通过规则的组合、嵌套进行灵活调整配置,实现对风险案件进行动态、有效地查询、识别与监测。

    2.2 指标体系构建

    在商业银行会计案防工作中,基于长期业务经验积累形成的风险规则逻辑,是识别欺诈案件的重要行业知识。而会计案防业务中原始的规则逻辑大都以文本的形式描述,不利于更新迭代,需要先对规则文本进行进一步拆解,形成指标化的规则集。以一条大额定期存款账户交易的规则逻辑为例,原始的规则逻辑描述为“近一年在原存期内,本行对公定期存款账户发生借方出账金额达到单笔>=7 000万元,且交易对手为银行内部账户(原存期是指,在账户到期之前提前进行资金的支取)”,基于该文本描述的方式无法实现规则的线上自动化识别,需要对其进行分拆解耦。

    首先对这条规则进行拆解,提取出关键的识别因素,如“账户类型”、“借贷标志”、“资金提取类型”、“交易金额”、“对手账户类型”等,再基于数据处理平台的计算引擎对指标进行加工计算,得到具体的指标值。在业务应用中,对每一条规则设置相应的阈值以及组合逻辑,以形成指标化的规则策略。拆解方法如表1所示。

    表1 指标规则化拆解示例

    2.3 金融知识图谱子平台

    金融知识图谱主要是通过大规模语义网络,将金融领域中结构化、半结构化、非结构化等不同类型的数据进行整合,并以图连接的形式加以展现。知识图谱以实体或者概念作为节点,节点之间以关系为边相连接,通过知识推理、算法建模等技术挖掘实体之间的关联关系特征,探寻出业务现象背后隐藏的深层逻辑,使分析预测、搜索推荐、查询决策等金融服务更加智慧、精准,进而增强金融机构业务的智能化水平。

    2.3.1 金融知识图谱子平台的相关架构

    金融知识图谱相关子模块主要由图存储、图计算、图分析、图规则等部分构成,各个子模块和子平台之间相互独立,又在业务流程上有一定的连通,整体架构如图2所示。

    图2 金融知识图谱子平台相关技术架构

    来自各个业务系统的会计案防相关数据信息一方面被加工、计算成业务指标,即用于生成最终的指标体系;
    另一方面经预处理后以图结构的数据形式存储于neo4j、Janus Graph等分布式图数据库中以供后续的图计算与分析,同时预处理数据也通过构建索引的形式存储于ElasticSearch搜索分析引擎中,实现高灵活性、高准确性、低延时及大规模并行化的检索查询。基于构建并存储好的会计案防知识图谱,采用GraphX、Gremlin等图计算引擎进行全局的图分析与图推理,提取出图结构中的关联风险特征,并依托Spark mllib、python机器学习库以及TensorFlow深度学习框架构建图预测模型,能够更深入地挖掘出关键节点、团伙关联等隐藏特征,挖掘出群体作案风险。这些图分析、图模型结果最终融入传统的业务规则指标,共同构成完整的知识规则体系,实现了浅层经验知识与深层挖掘知识的结合,从而有助于提升会计案件防范的智能化效果。

    2.3.2 金融知识图谱的计算与分析

    在平台方案中,通过语义框架,确定图网络中的实体及实体间的关系;
    然后从多源异构数据中提取出实体、关系及属性,并识别语义进行关系与属性匹配,最终以“关系-实体-关系”三元组的形式存储在图数据库中,形成会计案防领域金融知识图谱。通过对知识图谱的网络结构的分析与挖掘,识别隐藏的关联风险特征,是更深入预判会计案件欺诈行为的有效手段。

    金融知识图谱的关系挖掘主要指采用知识推理、图算法等图技术,从交易路径、关联强弱、单个账户、团伙账户等多维度挖掘出账户交易关系中隐藏的高风险特征,大致如下:

    (1)面向账户关系挖掘的图计算。

    资金交易比重分析主要用来测算某一账户与各交易账户之间资金转移金额的占比情况,当某一账户出现异常交易行为时,能够迅速对资金交易份额较大的主要关联账户进行重点关注与核查,及时预防与管控风险。

    账户关联强度分析主要从路径排序、交易权重等方面探索两个账户之间关联交易的密切程度,尤其是对于两者之间无直接的资金交易,但经过一系列中间账户后形成资金往来的账户,通过关联强度的分析,可以挖掘出账户之间隐藏的交易联系。

    PageRank最初是通过网页的链接数量来判断某一网页的重要性,运用在知识图谱中,其思想的核心在于一个节点的影响力能通过与其相连节点的影响力来综合衡量,故可通过用知识图谱中每个节点的重要程度来计算,找到会计案件中的关键账户。

    聚类算法根据账户在各个维度的特点进行类别划分,将具有相同特征的账户归集为同一类别,有利于发现行为相似的账户群体。

    (2)面向账户关系挖掘的知识推理。

    账户分层模式识别主要通过图模式探索资金在各个账户之间转移的路径,通过对交易路径的追踪,找到资金最终的流向,特别适用于挖掘多层复杂场景下资金通过中间账户过渡转移的现象,有助于判断账户是否存在违规使用资金、进行高风险投资等行为。

    资金转移模式识别主要用来判断两种典型的可疑账户交易模式,一种是分散转入、集中转出,该模式常常蕴含非法集资的风险;
    另一种模式是集中转入、分散转出,与前一种模式正好相反,该模式通常存在较大程度的洗钱嫌疑,也可将交易模式图转换为交易波形图,以波形的相似程度来定量评估账户交易模式的相似程度。

    2.4 决策配置子平台

    决策配置平台将行业经验生成的规则指标以及从知识图谱中提炼的关联特征进行汇集,形成完整的指标体系,并根据风险特征对指标进行灵活的配置与应用,同时根据指标配置后的规则在业务中的实际运行效果,对指标进行再开发与调试,以不断适应业务的发展演变。其运行流程如图3所示。

    图3 决策配置子平台规则配置流程

    在实验中,以银行内部的账户、企业、个人、机构等多维度信息作为数据基础,构建账户知识图谱,提取出关联风险特征,并以实际金融活动中真实发生的15起会计风险案件作为欺诈样本,将风险案件特点与行业知识经验结合形成规则逻辑,依托智能平台,对规则逻辑拆解加工后形成基础指标规则,并与关联风险特征相结合,形成完整的会计案件欺诈识别规则体系。最后,以安徽同业、齐鲁银行等银行内外部的风险案件作为测试样本,实际验证会计案防智能化平台的功能运行及风险识别的有效性。

    3.1 金融知识图谱构建与业务关联特征提取

    智能化平台金融知识图谱用于对交易账户关联关系的分析,图网络结构所标识的实体主要包含两类,一类是账户实体,包含企业、个人开立的可发生资金交易行为的银行账户;
    另一类是非账户实体,如经营机构、操作设备等。对应的实体之间的关系也主要分为两类,一是账户与账户之间,主要是交易关系,由是否有资金往来确定,若发生过转账、支付等交易行为,则有交易关系;
    二是账户与非账户之间,具体关系需要根据非账户实体确定,如账户与经营机构之间是开户关系,账户与操作设备之间是使用关系。构成的知识图谱如图4所示,箭头表示资金的流向,箭头的粗细表示资金转移金额的大小。

    图4 账户交易关联关系知识图谱示例

    采用前述知识图谱挖掘方法,并结合关联图谱的基础网络关联关系,智能化平台更全面、深入地提取出了一些具有较高欺诈风险的关联特征,如表2所示。

    表2 知识图谱关联特征示例

    3.2 指标体系与规则配置

    通过对行业知识经验的拆解分析,构建了涵盖客户、账户、交易、员工、营业机构等不同维度的基础指标。由于在会计欺诈案件防范中,单个指标难以起到精准识别的效果,需要根据业务风险特点对指标设置合理的阈值并进行灵活的组合,以形成相应的业务规则。智能化平台将基础指标与基于知识图谱提取的关联风险特征相整合,并对各类指标进行灵活的多样化组合配置(如图5所示),在丰富规则体系的同时,能够根据会计案件风险特征的变化及时调整预警规则,提升案件识别的动态性、前瞻性。

    图5 规则组合配置示例

    3.3 平台测试结果

    3.3.1 风险识别精准性

    以安徽同业、齐鲁银行等金融诈骗事件以及银行内部违规操作案件作为代表性的测试样本,验证智能化平台对风险特征识别的精准性,测试表明这些案件均触发了多条规则组合,及时生成高风险预警提示,充分体现了智能化平台在防范会计案件风险上的有效性。

    以“资金流入高风险账户”这一高风险行为筛选为例,首先基于资金转移模式进行第一道过滤,找出归集账户(约800个);
    然后通过资金穿透模式进行第二道过滤,通过刻画资金流向,尤其是多层复杂场景下的资金转移路径,更精准地定位出归集账户及相关的风险账户(约100个),将其作为风险目标,如图6所示。

    图6 资金流向图模式

    可以看出归集账户吸收了诸多零散账户的资金,而这些归集的资金最终主要流向了股票、基金、房地产等高风险账户;
    最后对第二道过滤后的账户进行人工排查,发现85%为高度可疑账户,排查结果充分表明了图模式分析的精准性,大幅降低了人工核查的范围。

    3.3.2 规则运行效率

    经过对计算精度、业务效果、系统性能等多方面的测试和实际业务检验,会计案防智能化平台实现了从数据采集、指标生产、图谱构建、关联特征提取、规则配置到欺诈预警等全流程的自动化运行,极大提升了风险规则配置的效率,并最终在业务场景成功上线推出。

    以规则配置流程为例,传统的规则配置基于数据库进行,对于一条预警规则,需要根据业务描述通过SQL进行规则编写,然后再转换成Perl文件格式投入到生产环境,每当规则逻辑发生调整或产生新的规则时,都需要重新编写SQL并进行Perl文件的转换,规则配置的效率较低,一个案例通常耗时2-3个月,且不利于规则体系的灵活调整。基于自动化的规则配置平台,在指标体系建立后,只需要通过逻辑关系的组合和阈值的调整即可生成相对应的规则策略,同样的案例只需要2周左右时间,配置效率得到极大提高,有力促进了风险管控的及时性。

    3.3.3 平台运行效果

    平台上线后,在运行近一年的时间里,对近3 000万个个人活跃交易账户进行了监控排查,检测出疑似问题交易流水上万笔,挽回的损失金额达上百亿元,为内控合规建立了一道有效的智能化风险防线。

    针对商业银行会计风险事件日益频发且越趋复杂的现状,该文将会计案防领域的行业知识与大数据、知识图谱等技术相结合,提出了会计案防智能化平台的建设方案,以实现会计风险事件的自动化、高精度识别。平台采用Hadoop分布式架构,结合Spark生态系统进行高效的数据处理与指标计算,借助Neo4j等图数据库以图结构的形式存储数据并完成。

    金融知识图谱的构建及可视化展示,依托GraphX等图计算引擎实现对知识图谱中多维关联特征的分析提取。基于银行账户交易、企业、个人等多维数据,以及金融行业的真实欺诈案例信息,智能化平台最终构建了数百个基础指标与关联风险特征,形成了较完整、丰富的会计案件欺诈风险规则体系,实现了浅层经验知识与深层挖掘知识的结合。实验测试结果表明,智能化平台能实现全流程的自动线上运行,并有效识别与预警会计案件的欺诈风险。

    猜你喜欢 图谱关联账户 “植物界大熊猫”完整基因组图谱首次发布军事文摘(2022年16期)2022-08-24基于伪谱法的水下航行体快速操舵变深图谱研究舰船科学技术(2022年11期)2022-07-15如何切换Windows 10本地账户与微软账户电脑知识与技术·经验技巧(2020年9期)2020-01-16Windows10账户的删除、禁用与启用电脑爱好者(2019年7期)2019-10-30图表新城乡(2018年6期)2018-07-09奇趣搭配学苑创造·A版(2018年11期)2018-02-01拼一拼数学大王·低年级(2017年12期)2017-12-26智趣读者(2017年5期)2017-02-15上交所:将允许一人开设多个证券账户绿色中国·B(2015年4期)2015-06-16试论棋例裁决难点——无关联①棋艺(2014年7期)2014-09-09
    相关热词搜索: 知识 图谱 会计

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章