用户画像的生成方法、装置以及存储介质与流程
1.本技术涉及信息
技术领域:
:,特别是涉及一种用户画像的生成方法、装置以及存储介质。
背景技术:
::2.实体机构画像,可以帮助企业全方位的了解实体机构客户,准确的把握实体机构客特点,实现差异化、个性化的客户服务及精准营销,同时帮助企业识别并规避风险。基于属性标签分析实体机构的通常方法是在行业信息需求及影响因素基础上,构建面向行业信息的画像构成要素体系,基于企业画像的行业信息构建服务模型。利用大数据技术实现前瞻性的多维实体画像,构建技术架构、建立数据体系、研究数据属性标签和算法进而分析海量的金融监管数据,并通过相关的分析、甄别和预测方法能个性化服务、风险防范等工作提供支持。3.现有技术中,实体机构画像体系的搭建通常使用统计分析方法,预先定义所需的实体属性标签指标,对于属性标签的类别及相互关系,缺乏清晰的逻辑层级划分来支持动态更新,使得有较大的局限性,并且效率较低。4.针对上述的现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题,目前尚未提出有效的解决方案。技术实现要素:5.本技术的实施例提供了一种用户画像的生成方法、装置以及存储介质,以至少解决现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题。6.根据本技术实施例的一个方面,提供了一种用户画像的生成方法,包括:根据预先定义的业务规则获取第一基层指标;根据预先定义的编码体系,将第一基层指标生成分层标签数据;以及根据分层标签数据生成用户画像。7.根据本技术实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。8.根据本技术实施例的另一个方面,还提供了一种用户画像的生成装置,包括:第一获取模块,用于根据预先定义的业务规则获取第一基层指标;第一生成模块,用于根据预先定义的编码体系,将第一基层指标生成分层标签数据;以及第二生成模块,用于根据分层标签数据生成用户画像。9.根据本技术实施例的另一个方面,还提供了一种用户画像的生成装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:根据预先定义的业务规则获取第一基层指标;根据预先定义的编码体系,将第一基层指标生成分层标签数据;以及根据分层标签数据生成用户画像。10.在本技术实施例中,计算设备使用本属性标签分层的方式进行标签体系构建,不仅可以清晰地组织实体机构属性标签的类别、层次及标签勾稽关系;还可在底层基础信息的发生变化或者新增指标模型逻辑时,基于一种动态化方法,以低代码的方式更新指标模型并根据基础信息变化动态刷新属性标签及模型逻辑的结果,实现定义、基础属性标签、逻辑模型结果以及业务视角实体机构画像的全链路低代码更新。进而解决了现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题。附图说明11.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:12.图1是用于实现根据本技术实施例1所述的方法的计算设备的硬件结构框图;13.图2a是根据本技术实施例1所述的用户画像的生成系统的示意图;14.图2b是根据本技术实施例1所述的用户画像的生成系统的分层示意图;15.图3是根据本技术实施例1的第一个方面所述的用户画像的生成方法的流程示意图;16.图4是根据本技术实施例1的第一个方面所述的业务规则的示意图;17.图5是根据本技术实施例1的第一个方面所述的分层标签数据的示意图;18.图6是根据本技术实施例2所述的用户画像的生成装置的示意图;以及19.图7是根据本技术实施例3所述的用户画像的生成装置的示意图。具体实施方式20.为了使本
技术领域:
:的人员更好地理解本技术的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。21.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。22.实施例123.根据本实施例,提供了一种用户画像的生成方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。24.本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现用户画像的生成方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。25.应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。26.存储器可用于存储应用软件的软件程序以及模块,如本技术实施例中的用户画像的生成方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的用户画像的生成方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。27.传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(networkinterfacecontroller,nic),其可通过与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。28.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。29.此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。30.图2a是根据本实施例所述的用户画像的生成系统的示意图。参照图2a所示,该系统包括:hdfs文件系统、yarn资源调度系统、数据采集设备以及数据清洗设备。其中数据采集设备包括:kafka、spark以及oozie。数据清洗设备为hive。其中,hdfs文件系统用于存储采集的源数据,yarn资源调度系统用于确定采集源数据的时间。31.图2b是根据本实施例所述的用户画像的生成系统的分层示意图。参照图2b所示,该系统包括:接口层、明细层、轻度汇总层、数据集市层以及应用层。32.其中接口层用于存储源数据,并将源数据发送至明细层。明细层用于将源数据进行处理,得到第二基本指标,之后将第二基本指标发送至轻度汇总层。轻度汇总层用于存储第二基本指标,之后将第二基本指标发送至数据集市层。数据集市层用于汇总分层标签数据,之后将分层标签数据发送至应用层。应用层用于展示该分层标签数据。33.在上述运行环境下,根据本实施例的第一个方面,提供了一种用户画像的生成方法,该方法由图1中所示的计算实现。图3示出了该方法的流程示意图,参考图3所示,该方法包括:34.s302:根据预先定义的业务规则获取第一基层指标;35.s304:根据预先定义的编码体系,将第一基层指标生成分层标签数据;以及36.s306:根据分层标签数据生成用户画像。37.具体地,业务规则为待构建的用户画像的需求信息,当提出业务规则时,计算设备根据该业务规则从数据库中获取第一基层指标。参考图4所示,其中业务规则包括一级分类、二级分类以及标签。其中第一基层指标为从数据库中获取的源数据。38.进一步地,参考图5所示,计算设备将业务信息记录至分层标签数据表中,之后计算设备根据获取的第一基层指标填充该分层标签数据表,并确定分层标签数据表中的基层指标的标签类别。其中标签类别包括事实标签、模型标签以及推理标签(图中未示出)。39.进一步地,计算设备根据分层标签数据表中的分层标签数据,生成用户画像。其中用户画像还可根据基本标签的权重进行显示。例如用户画像中的所属行业的权重设置为60%,则可以将该用户画像的所属行业进行加粗或者字体放大等突出操作。40.正如
背景技术:
:中所述的,实体机构画像,可以帮助企业全方位的了解实体机构客户,准确的把握实体机构客特点,实现差异化、个性化的客户服务及精准营销,同时帮助企业识别并规避风险。基于属性标签分析实体机构的通常方法是在行业信息需求及影响因素基础上,构建面向行业信息的画像构成要素体系,基于企业画像的行业信息构建服务模型。利用大数据技术实现前瞻性的多维实体画像,构建技术架构、建立数据体系、研究数据属性标签和算法进而分析海量的金融监管数据,并通过相关的分析、甄别和预测方法能个性化服务、风险防范等工作提供支持。现有技术中,实体机构画像体系的搭建通常使用统计分析方法,预先定义所需的实体属性标签指标,对于属性标签的类别及相互关系,缺乏清晰的逻辑层级划分来支持动态更新,使得有较大的局限性,并且效率较低。41.针对以上所述的技术问题,通过本技术实施例的技术方案,计算设备使用本属性标签分层的方式进行标签体系构建,不仅可以清晰地组织实体机构属性标签的类别、层次及标签勾稽关系;还可在底层基础信息的发生变化或者新增指标模型逻辑时,基于一种动态化方法,以低代码的方式更新指标模型并根据基础信息变化动态刷新属性标签及模型逻辑的结果,实现定义、基础属性标签、逻辑模型结果以及业务视角实体机构画像的全链路低代码更新。进而解决了现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题。42.可选地,根据预先定义的业务规则获取第一基层指标的操作,包括:获取预先定义的业务规则,并根据业务规则获取对应的源数据;以及将源数据作为第一基层指标。43.具体地,计算设备获取用户制定的业务规则。之后根据业务规则从数据库中查相应的源数据。其中查到源数据后可根据源数据的存储位置,确定该源数据为内部数据还是外部数据。并且其中内部数据用于指示公司内部存储的不对外公开的数据,可以包括持仓数据以及交易数据。外部数据用于指示交易所对外公开的数据,可以包括工商数据、财务数据以及资讯舆情。之后计算设备将源数据作为第一基层指标。从而,本技术方案根据业务规则确定第一基层指标,可以依据用户需求准确查数据。44.可选地,根据预先定义的编码体系,将第一基层指标生成分层标签数据的操作,包括:根据第一基层指标确定第二基层指标;以及根据编码体系将第二基层指标生成分层标签数据。45.具体地,计算设备将第一基层指标数据进行数据清洗,从而从第一基层指标数据中确定第二基层指标数据。之后计算设备将一级分类进行编码,例如,工商信息的编码为010000,评级信息的编码为020000,并以此类推。之后计算设备将二级分类进行编码,例如企业描述的一级分类为010000,则企业描述的编码为010100。例如企业类型的一级分类为010000,则企业描述的编码为010200。第二指标类型例如所属行业的二级编码为010100,则所属行业的编码为010101。根据第二基层指标相应的编码,确定分词标签数据。从而本技术方案通过编码,快速确定分词标签数据。46.可选地,根据第一基层指标确定第二基层指标的操作,包括:将第一基层指标进行数据清洗,得到第二基层指标。47.具体地,计算设备从第一基层指标中获取与业务规则对应的第二基层指标,并将不符合业务规则的基层指标滤除。参考表1所示,计算设备根据计算类型,将相应的第一基层指标进行计算,得到第二基层指标。其中根据计算类型得到的第二基层指标,其标签分类为模型标签。从而本技术方案对第一基层指标进行数据清洗,可以准确到分层标签数据包中的第二基本指标。48.此外,本方案中提到的分层实体机构画像标签体系以及一套动态低代码的构建方法如下:49.1.以分层的方式搭建实体机构画像标签体系50.机构画像标签体系搭建,基于大数据底座对数据的流转进行分层处理,基础信息层:源数据,即基础信息来源层。51.基础信息明细层:来源源信息的落地副本52.画像属性、标签、逻辑指标服务层:逻辑处理和结果模型指标落地持久化53.画像应用层:基于最终应用系统的部署,对接最终的画像标签数据对接客户服务应用。54.分类分层部分实体机构属性标签内容见图5:55.在标签体系这一环,首先,机构客户本身数据较为丰富,需要结合专家辅助规则,选取有意义的、可以辅助业务做决策的指标作为标签,标签分为三层,参考表1所示:56.[0057][0058]表1[0059]第二,在确认各层级标签之后,梳理确认该类标签对应的基层指标是否存在、如何获取以及如何落地。第三,从基层指标到事实标签/模型标签,本方法建立了一套动态化配置的编码体系。[0060]2.一套动态化配置的编码体系[0061]基于机构客户相关数据如经营、舆情等会发生数据变化或者在价值挖掘的过程中,需要新增标签类别进来,在这种情况下,本方法以低代码动态配置方法将基层-》标签层的全链路数据做快速的处理更新。[0062]实现动态化配置以及自动更新,预先设置好两组标准化配置信息,基层指标明细配置信息以及标签指标模型逻辑配置信息,基于这两组配置信息,实现动态配置更新:[0063]基层指标明细配置信息:[0064]基层指标指的是将标签指标拆分到最小单元,不可再分的指标,要素表2:[0065]名称注释minterm_id小项指标idminterm_name小项指标名称f_table聚源表名称f_column聚源表字段[0066]表2如表3所示:[0067][0068][0069]表3[0070]标签指标模型逻辑配置信息:[0071]确定每一个标签指标模型逻辑后,形成一组模型逻辑生成信息,如表4所示:[0072][0073]表4如表5所示:[0074][0075][0076]表5[0077]按照模型逻辑类型,构建对应的标签数据链路生成逻辑,对应生成数据。这套全链路会配置可按照预定义的频次自动计算和刷新。[0078]源数据基础信息更新或标签指标模型逻辑口径变化时,需更新两组配置信息,新一批的基础信息会在最近一次自动计算任务中进行模型逻辑载入和结果刷新。[0079]模型逻辑扩展时,在两组配置信息扩展新的动态参数,并构建对应的标签数据链路生成逻辑即可快速实现画像模型的扩展。[0080]通过分层和低代码动态构建方式,可在实体机构基础信息更新和画像模型逻辑更新时,以高效的、低成本的方式的全链路自动计算和模型结果刷新。[0081]此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。[0082]从而根据本实施例,计算设备使用本属性标签分层的方式进行标签体系构建,不仅可以清晰地组织实体机构属性标签的类别、层次及标签勾稽关系;还可在底层基础信息的发生变化或者新增指标模型逻辑时,基于一种动态化方法,以低代码的方式更新指标模型并根据基础信息变化动态刷新属性标签及模型逻辑的结果,实现定义、基础属性标签、逻辑模型结果以及业务视角实体机构画像的全链路低代码更新。进而解决了现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题。[0083]需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。[0084]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。[0085]实施例2[0086]图6示出了根据本实施例的第一个方面所述的用户画像的生成装置600,该装置600与根据实施例1的第一个方面所述的方法相对应。参考图6所示,该装置600包括:第一获取模块610,用于根据预先定义的业务规则获取第一基层指标;第一生成模块620,用于根据预先定义的编码体系,将第一基层指标生成分层标签数据;以及第二生成模块630,用于根据分层标签数据生成用户画像。[0087]可选地,第一获取模块610,包括:数据获取子模块,用于获取预先定义的业务规则,并根据业务规则获取对应的源数据;以及第一确定子模块,用于将源数据作为第一基层指标。[0088]可选地,第一生成模块620,包括:第二确定子模块,用于根据第一基层指标确定第二基层指标;以及第一生成子模块,用于根据编码体系将第二基层指标生成分层标签数据。[0089]可选地,第二确定子模块,包括:生成单元,用于将第一基层指标进行数据清洗,得到第二基层指标。[0090]从而根据本实施例,计算设备使用本属性标签分层的方式进行标签体系构建,不仅可以清晰地组织实体机构属性标签的类别、层次及标签勾稽关系;还可在底层基础信息的发生变化或者新增指标模型逻辑时,基于一种动态化方法,以低代码的方式更新指标模型并根据基础信息变化动态刷新属性标签及模型逻辑的结果,实现定义、基础属性标签、逻辑模型结果以及业务视角实体机构画像的全链路低代码更新。进而解决了现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题。[0091]实施例3[0092]图7示出了根据本实施例的第一个方面所述的用户画像的生成装置700,该装置700与根据实施例1的第一个方面所述的方法相对应。参考图7所示,该装置700包括:处理器710;以及存储器720,与处理器710连接,用于为处理器710提供处理以下处理步骤的指令:根据预先定义的业务规则获取第一基层指标;根据预先定义的编码体系,将第一基层指标生成分层标签数据;以及根据分层标签数据生成用户画像。[0093]可选地,根据预先定义的业务规则获取第一基层指标的操作,包括:获取预先定义的业务规则,并根据业务规则获取对应的源数据;以及将源数据作为第一基层指标。[0094]可选地,根据预先定义的编码体系,将第一基层指标生成分层标签数据的操作,包括:根据第一基层指标确定第二基层指标;以及根据编码体系将第二基层指标生成分层标签数据。[0095]可选地,根据第一基层指标确定第二基层指标的操作,包括:将第一基层指标进行数据清洗,得到第二基层指标。[0096]从而根据本实施例,计算设备使用本属性标签分层的方式进行标签体系构建,不仅可以清晰地组织实体机构属性标签的类别、层次及标签勾稽关系;还可在底层基础信息的发生变化或者新增指标模型逻辑时,基于一种动态化方法,以低代码的方式更新指标模型并根据基础信息变化动态刷新属性标签及模型逻辑的结果,实现定义、基础属性标签、逻辑模型结果以及业务视角实体机构画像的全链路低代码更新。进而解决了现有技术中存在的搭建实体机构画像所造成的局限性大以及效率低的技术问题。[0097]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。[0098]在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。[0099]在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。[0100]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。[0101]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。[0102]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。[0103]以上所述仅是本发明的优选实施方式,应当指出,对于本
技术领域:
:的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页12当前第1页12