本文作者:kaifamei

一种数据批量处理方法、装置、设备及存储介质与流程

更新时间:2025-01-10 20:06:23 0条评论

一种数据批量处理方法、装置、设备及存储介质与流程



1.本发明涉及数据处理领域,尤其涉及一种数据批量处理方法、装置、设备及计算机可读存储介质。


背景技术:



2.数据批量处理是对数据进行批量的采集、存储、检索、加工、变换和传输,通过所述数据批量处理是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
3.目前,数据批量处理通常是采用定时执行数据库技术实现数据的批量处理,利用java编写执行程序,重复性执行相同操作,但是在实际业务场景中,往往会存在大量的待处理数据,且数据种类复杂多变,通过定时执行数据库技术需要的组件庞杂,硬件资源要求高,不具备支持数据日志追踪、页面手工调度/重试、动态配置调度任务、任务执行的过程管理等功能从而使得数据批量处理的效率较为低下。


技术实现要素:



4.本发明提供一种数据批量处理方法、装置、设备及存储介质,其主要目的在于提高数据批量处理的效率。
5.为实现上述目的,本发明提供的一种数据批量处理方法,包括:
6.获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点;
7.利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志;
8.基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志;
9.将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。
10.可选地,所述配置所述待处理数据的数据处理任务,包括:
11.分析所述待处理数据的业务场景;
12.根据所述业务场景,识别所述待处理数据的数据处理需求;
13.根据所述数据处理需求,构建所述处理任务。
14.可选地,所述根据所述数据处理任务,在所述数据运行环境中配置数据处理节点,包括:
15.分析所述数据处理任务的操作步骤,根据所述操作步骤,梳理出操作逻辑;
16.根据所述操作逻辑,在所述数据运行环境中配置数据处理节点。
17.可选地,所述利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志,包括:
18.利用所述任务调度工具分析所述数据处理任务的任务类型;
19.根据所述任务类型,确定所述任务调度工具的调度模式;
20.通过所述调度模式,利用所述任务调度工具将所述所述数据任务分配至所述数据处理节点,得到数据任务节点;
21.记录获取所述节点地址到得到所述数据任务节点的完整操作记录,得到所述分配日志。
22.可选地,所述基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,包括:
23.根据所述分配日志,查询所述数据处理节点中每个节点与所述数据处理任务中每个任务之间的映射关系;
24.基于所述映射关系,将所述数据处理任务中每个处理任务加载至所述数据处理节点中对应的运行节点中;
25.在所述运行节点中构建所述处理任务的处理逻辑,根据所述处理逻辑,通过所述运行节点运行所述处理任务。
26.可选地,所述将所述分配日志和所述运行日志进行整合,得到所述待处理数据的数据处理日志,包括:
27.对所述分配日志和所述运行日志的日志格式标准统一,得到标准分配日志和标准运行日志;
28.对所述标准分配日志及所述标准运行日志进行日志合并,得到统一日志;
29.对所述统一日志进行数据梳理,得到所述数据处理日志。
30.可选地,所述对所述统一日志进行数据梳理,得到所述数据处理日志,包括:
31.对所述统一日志进行数据违法数据删除,得到合法数据日志;
32.对所述合法数据日志进行无效数据删除,得到有效数据日志;
33.整理所述有效数据逻辑,得到所述数据处理日志。
34.为了解决上述问题,本发明还提供一种数据批量处理装置,所述装置包括:
35.节点配置模块,用于获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点;
36.任务分配模块,用于利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志;
37.日志记录模块,用于基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志;
38.日志整合模块,用于将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。
39.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
40.至少一个处理器;以及,
41.与所述至少一个处理器通信连接的存储器;其中,
42.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序
被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的数据批量处理方法。
43.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的数据批量处理方法。
44.本发明实施例通过获取待处理数据,并配置所述待处理数据的数据处理任务可以明确所述待处理数据的处理需求,提高所述待处理数据处理效率,本发明实施例通过利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志可以在所述数据处理任务分配过程中出现任何问题都通过所述分配日志及时追踪解决保证数据处理效率,其中,本发明实施例通过基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,得到数据处理结果可以通过所述数据处理节点自动处理所述数据处理任务,减少人工成本的同时提高了数据批量处理效率;此外,本发明实施例通过将所述分配日志和所述运行日志进行整合,得到所述待处理数据的数据处理日志可以通过数据日志追踪最大程度保障了待处理数据动态配置调度任务、任务执行的过程管理等功能从而提高数据批量处理效率。因此,本发明实施例提供的一种数据批量处理方法、装置、设备及存储介质,能够在于提高数据批量处理的效率。
附图说明
45.图1为本发明一实施例提供的数据批量处理方法的流程示意图;
46.图2为本发明一实施例提供的数据批量处理装置的功能模块图;
47.图3为本发明一实施例提供的实现所述数据批量处理方法的电子设备的结构示意图。
48.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
49.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
50.本技术实施例提供一种数据批量处理方法。本技术实施例中,所述数据批量处理方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述数据批量处理方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集、云端服务器或云端服务器集等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
51.参照图1所示,为本发明一实施例提供的数据批量处理方法的流程示意图。在本实施例中,所述数据批量处理方法包括步骤s1—s5:
52.s1、获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点。
53.本发明实施例通过获取待处理数据,并配置所述待处理数据的数据处理任务可以
明确所述待处理数据的处理需求,提高所述待处理数据处理效率,其中,所述待处理数据是指需要进行数据处理的数据。
54.所述处理任务是指需要对所述待处理数据进行哪里数据操作,例如所述待处理数据的删除、提交、修改等操作。
55.进一步地,作为本发明的一个实施例,所述配置所述待处理数据的数据处理任务,包括:分析所述待处理数据的业务场景;根据所述业务场景,识别所述待处理数据的数据处理需求;根据所述数据处理需求,构建所述处理任务。
56.其中,所述业务场景是指所述待处理数据处在的一个环境背景,例如,电商场景、支付场景、出行场景、医疗场景等场景;所述数据处理需求是指通过所述待处理数据提取出那些有用信息;
57.进一步地,本发明一可选实施例中,所述分析所述待处理数据的业务场景可以通过power bi数据分析可视化工具来进行数据分析。
58.进一步地,本发明一可选实施例中,所述根据所述业务场景,识别所述待处理数据的数据处理需求可以通过finereport应用数据分析工具实现。
59.进一步地,本发明一可选实施例中,所述根据所述数据处理需求,构建所述处理任务可以通过反向推导来实现。
60.本发明实施例通过创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点可以通过提前构建好批量处理所述待处理数据的运行环境和处理节点,进一步提高数据批量处理的效率;其中,所述数据运行环境是指在搭建用来处理所述待处理数据的操作系统,例如dotnet,directx等操作系统;所述数据处理节点是指对所述待处理数据进行数据处理的工具包。作为本发明的一个实施例,所述创建所述待处理数据的数据运行环境可以通过java语言来编写。
61.进一步地,作为本发明的一个实施例,所述根据所述数据处理任务,在所述数据运行环境中配置数据处理节点,包括:分析所述数据处理任务的操作步骤,根据所述操作步骤,梳理出操作逻辑;根据所述操作逻辑,在所述数据运行环境中配置数据处理节点。
62.其中,所述操作步骤是指实现所述数据处理任务所需要的操作流程,例如在出行场景下,需要进行叫车动作,所述操作流程可以是先选择目的地,在选择用车类型,最后点击搜索;所述操作逻辑是指所述操作流程每个步骤实现逻辑的合集。
63.s2、利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志。
64.本发明实施例通过利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志可以在所述数据处理任务分配过程中出现任何问题都通过所述分配日志及时追踪解决保证数据处理效率;其中所述预设的任务调度工具是指用来进行所述数据任务分配调度的工具,如quartz工具;所述分配日志是指通过所述任务调度工具将所述数据处理任务分配至数据处理节点中整个过程的操作记录。
65.作为本发明的一个实施例,所述利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志,包括:利用所述任务调度工具分析所述数据处理任务的任务类型;根据所述任务类型,确定所述任务调度工具的调度模式;通过所述调度模式,利用所述任务调度工具将所述所述数据任务分配至所述数据处理节点,得
到数据任务节点;记录获取所述节点地址到得到所述数据任务节点的完整操作记录,得到所述分配日志。
66.其中,所述任务类型是指所述数据处理任务根据不同的处理方式划分任务的不同类型,例如统计类、筛选类等类型;所述调度模式是指所述任务调度工具将所述数据处理任务分配至数据处理节点中采用的调度方式,例如将所述数据处理任务按月份进行调度,2022年每天下午14:00到下午14:55、下午18:00到下午18:55时间段内每隔5分钟执行任务;所述数据任务节点是指已经获取到所述数据处理任务的所述数据处理节点。
67.进一步地,本发明一可选实施例中,所述建立所述数据任务与所述数据处理节点的数据传送通道可以通过webrtc组件来完成。
68.进一步地,本发明一可选实施例中,所述利用所述任务调度工具将所述数据任务分配至所述数据处理节点,得到数据任务节点,包括:利用所述任务调度工具的地址层获取所述数据处理节点的节点地址;根据所述节点地址利用所述任务调度工具的的通道层建立所述任务调度工具和所述数据处理节点的数据传输通道;根据所述数据传输通道,利用所述任务调度工具的传输层将所述数据任务传输至所述数据处理节点中。
69.s3、基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志。
70.本发明实施例通过基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,得到数据处理结果可以通过所述数据处理节点自动处理所述数据处理任务,减少人工成本的同时提高了数据批量处理效率。
71.作为本发明的一个实施例,所述基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,包括:根据所述分配日志,查询所述数据处理节点中每个节点与所述数据处理任务中每个任务之间的映射关系,基于所述映射关系,将所述数据处理任务中每个处理任务加载至所述数据处理节点中对应的运行节点中,并在所述运行节点中构建所述处理任务的处理逻辑,根据所述处理逻辑,通过所述运行节点运行所述处理任务。
72.其中,所述映射关系是指用于表征所述数据处理节点中每个处理节点与所述数据处理任务中每个处理任务的对应关系,所述处理逻辑用于明确后续处理节点在运行处理任务时所采用的处理规则,例如创建一个新的transformation,保存到本地路径,例如保存到d:/etltest下,保存文件名为etltesttrans,kettle默认transformation文件保存后后缀名为ktr;创建一个新的job,保存到本地路径,例如保存到d:/etltest下,保存文件名为etltestjob,kettle默认job文件保存后后缀名为kjb;识别常用转换环节名称,对transformation进行转换等规则。
73.进一步地,本发明一可选实施例中,所述所述数据处理节点中每个节点与所述数据处理任务中每个任务之间的映射关系可以通过查询语句进行查询,如sql查询语句,所述处理任务的处理逻辑可以通过程序语言进行构建,如java语言,所述处理任务的运行可以通过线程池的方式实现。
74.进一步地,本发明实施例通过记记录所述数据处理任务在运行过程中的运行日志,可以保证所述数据处理任务在处理过程中遇到问题可以通过所述运行日志来进行追踪解决;所述运行日志是指通过所述数据处理节点运行所述数据处理任务得到所述数据处理结果整个过程的运行记录。可选的,所述记录所述数据处理任务在运行过程中的运行日志
通过搭建nxlog运行环境,并在数据库中安装fluentd curl-l,修改nxlog的配置文件后重启服务实现。
75.s4、将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。
76.本发明实施例通过将所述分配日志和所述运行日志进行整合,得到所述待处理数据的数据处理日志可以通过数据日志追踪最大程度保障了待处理数据动态配置调度任务、任务执行的过程管理等功能从而提高数据批量处理效率。
77.作为本发明的一个实施例,所述将所述分配日志和所述运行日志进行整合,得到所述待处理数据的数据处理日志,包括:对所述分配日志和所述运行日志的日志格式标准统一,得到标准分配日志和标准运行日志;对所述标准分配日志及所述标准运行日志进行日志合并,得到统一日志;对所述统一日志进行数据梳理,得到所述数据处理日志。
78.其中,所述标准分配日志及所述标准运行日志是指通过统一格式后的所述分配日志和所述运行日志;所述统一日志是指将所述所述标准分配日志及所述标准运行日志进行日志合并后形成的新的日志。
79.进一步地,本发明一可选实施例中,所述对所述分配日志和所述运行日志的日志格式标准统一,得到标准分配日志和标准运行日志可以在数据库中通过logback工具来修改日志配置文件后重启服务器来完成。
80.进一步地,本发明一可选实施例中,所述对所述统一日志进行数据梳理,得到所述数据处理日志,包括;对所述统一日志进行数据违法数据删除,得到合法数据日志;对所述合法数据日志进行无效数据删除,得到有效数据日志;整理所述有效数据逻辑,得到所述数据处理日志。
81.进一步地,本发明实施例通过将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图,实现所述待处理数据的处理过程可视化展示,帮助用户可以更加清晰的了解到所述待处理数据的数据处理过程,其中,所述网页端可以了解为用于向用户提供视图展示的载体,常见的如浏览器,可选的所述处理日志的加载可以通过加载工具实现,所述加载工具可以通过js语言进行编译。
82.本发明实施例通过获取待处理数据,并配置所述待处理数据的数据处理任务可以明确所述待处理数据的处理需求,提高所述待处理数据处理效率,本发明实施例通过利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志可以在所述数据处理任务分配过程中出现任何问题都通过所述分配日志及时追踪解决保证数据处理效率,其中,本发明实施例通过基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,得到数据处理结果可以通过所述数据处理节点自动处理所述数据处理任务,减少人工成本的同时提高了数据批量处理效率;此外,本发明实施例通过将所述分配日志和所述运行日志进行整合,得到所述待处理数据的数据处理日志可以通过数据日志追踪最大程度保障了待处理数据动态配置调度任务、任务执行的过程管理等功能从而提高数据批量处理效率。因此,本发明实施例提供的一种数据批量处理方法,能够在于提高数据批量处理的效率。
83.如图2所示,是本发明一实施例提供的数据批量处理装置的功能模块图。
84.本发明所述数据批量处理装置100可以安装于电子设备中。根据实现的功能,所述
interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
96.所述通信接口13用于上述电子设备1与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
97.图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
98.例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
99.应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
100.所述电子设备1中的所述存储器11存储的数据批量处理方法程序是多个指令的组合,在所述处理器10中运行时,可以实现:
101.获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点;
102.利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志;
103.基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志;
104.将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。
105.具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
106.进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
107.本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,
所述计算机程序在被电子设备的处理器所执行时,可以实现:
108.获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点;
109.利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志;
110.基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志;
111.将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。
112.在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
113.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
114.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
115.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
116.因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
117.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
118.此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
119.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:


1.一种数据批量处理方法,其特征在于,所述方法包括:获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点;利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志;基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志;将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。2.如权利要求1所述的数据批量处理方法,其特征在于,所述配置所述待处理数据的数据处理任务,包括:分析所述待处理数据的业务场景;根据所述业务场景,识别所述待处理数据的数据处理需求;根据所述数据处理需求,构建所述数据处理任务。3.如权利要求2所述的数据批量处理方法,其特征在于,所述根据所述数据处理任务,在所述数据运行环境中配置数据处理节点,包括:分析所述数据处理任务的操作步骤,根据所述操作步骤,梳理出操作逻辑;根据所述操作逻辑,在所述数据运行环境中配置数据处理节点。4.如权利要求1所述的数据批量处理方法,其特征在于,所述利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志,包括:利用所述任务调度工具分析所述数据处理任务的任务类型;根据所述任务类型,确定所述任务调度工具的调度模式;通过所述调度模式,利用所述任务调度工具将所述所述数据任务分配至所述数据处理节点,得到数据任务节点;记录获取所述节点地址到得到所述数据任务节点的完整操作记录,得到所述分配日志。5.如权利要求1所述的数据批量处理方法,其特征在于,所述基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,包括:根据所述分配日志,查询所述数据处理节点中每个节点与所述数据处理任务中每个任务之间的映射关系;基于所述映射关系,将所述数据处理任务中每个处理任务加载至所述数据处理节点中对应的运行节点中;在所述运行节点中构建所述处理任务的处理逻辑,根据所述处理逻辑,通过所述运行节点运行所述处理任务。6.如权利要求1所述的数据批量处理方法,其特征在于,所述将所述分配日志和所述运行日志进行整合,得到所述待处理数据的数据处理日志,包括:对所述分配日志和所述运行日志的日志格式标准统一,得到标准分配日志和标准运行日志;对所述标准分配日志及所述标准运行日志进行日志合并,得到统一日志;
对所述统一日志进行数据梳理,得到所述数据处理日志。7.如权利要求1所述的数据批量处理方法,其特征在于,所述对所述统一日志进行数据梳理,得到所述数据处理日志,包括:对所述统一日志进行数据违法数据删除,得到合法数据日志;对所述合法数据日志进行无效数据删除,得到有效数据日志;整理所述有效数据逻辑,得到所述数据处理日志。8.一种数据批量处理装置,其特征在于,所述装置包括:节点配置模块,用于获取待处理数据,并配置所述待处理数据的数据处理任务,创建所述待处理数据的数据运行环境,根据所述数据处理任务,在所述数据运行环境中配置数据处理节点;任务分配模块,用于利用预设的任务调度工具将所述数据处理任务分配至数据处理节点中,得到所述数据任务的分配日志;日志记录模块,用于基于所述分配日志,通过所述数据处理节点运行所述数据处理任务,以记录所述数据处理任务在运行过程中的运行日志;日志整合模块,用于将所述分配日志和所述运行日志进行整合,得到所述待处理数据的处理日志,并将所述处理日志加载至网页端中,以获取所述待处理数据的可视化处理视图。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的数据批量处理方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的数据批量处理方法。

技术总结


本发明涉及数据处理技术,揭露了一种数据批量处理方法,包括:获取待处理数据,并配置待处理数据的数据处理任务,创建待处理数据的数据运行环境,根据数据处理任务,在数据运行环境中配置数据处理节点;利用预设的任务调度工具将数据处理任务分配至数据处理节点中,得到数据任务的分配日志;基于分配日志,通过数据处理节点运行数据处理任务,以记录数据处理任务在运行过程中的运行日志;将分配日志和运行日志进行整合,得到待处理数据的处理日志,并将处理日志加载至网页端中,以获取待处理数据的可视化处理视图。本发明可以提高数据批量处理的效率。理的效率。理的效率。


技术研发人员:

熊志国 熊一龙 姜科

受保护的技术使用者:

招商局金融科技有限公司

技术研发日:

2022.09.30

技术公布日:

2022/12/16


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-1-52646-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2022-12-20 21:50:20

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论