关键节点的确定方法、装置、电子设备及存储介质与流程
1.本技术涉及大数据技术领域,尤其涉及一种关键节点的确定方法、装置、电子设备及存储介质。
背景技术:
2.在大规模节点关系网络中,如何评估节点的重要性是一个重要且复杂的问题。例如在产业链图网络中,评估产业链中的重要企业节点,能够帮助企业监管部门发现在该产业链中某企业对该产业链的影响程度,从而为企业监管部门提供决策基础。又如在金融交易网络中,评估交易节点在交易网络中的重要性,能够帮助金融监管部门发现交易中的重要交易节点,防止发生金融风险。
技术实现要素:
3.本技术实施例提供一种关键节点的确定方法、装置、电子设备及存储介质,以实现在节点关系网络中进行节点重要性的评估。
4.第一方面,本技术实施例提供了一种关键节点的确定方法,包括:
5.获取节点关系网络,其中,节点关系网络中包括多个待选节点,待选节点与待选节点的相邻节点之间的连接边表征待选节点与相邻节点之间的流量数据;
6.根据待选节点与相邻节点之间的流量数据,确定相邻节点对待选节点的第一依赖系数,其中,第一依赖系数用于表征相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度;
7.基于相邻节点对待选节点的第一依赖系数,确定待选节点对节点关系网络的网络流量影响值;
8.利用多个待选节点的网络流量影响值,从多个待选节点中确定出节点关系网络的关键节点。
9.第二方面,本技术实施例提供了一种关键节点的确定装置,包括:
10.节点关系网络获取模块,用于获取节点关系网络,其中,节点关系网络中包括多个待选节点,待选节点与待选节点的相邻节点之间的连接边表征待选节点与相邻节点之间的流量数据;
11.第一依赖系数确定模块,用于根据待选节点与相邻节点之间的流量数据,确定相邻节点对待选节点的第一依赖系数,其中,第一依赖系数用于表征相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度;
12.网络流量影响值确定模块,用于基于相邻节点对待选节点的第一依赖系数,确定待选节点对节点关系网络的网络流量影响值;
13.关键节点确定模块,用于利用多个待选节点的网络流量影响值,从多个待选节点中确定出节点关系网络的关键节点。
14.第三方面,本技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器
上的计算机程序,处理器在执行计算机程序时实现本技术任一实施例提供的方法。
15.第四方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本技术任一实施例提供的方法。
16.与现有技术相比,本技术具有如下优点:
17.本技术实施例提供的技术方案,基于相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度,得到相邻节点对待选节点的第一依赖系数(即完全依赖系数),进而确定待选节点对整个节点关系网络的网络流量影响值;进一步利用多个待选节点的网络流量影响来确定出关键节点。由于直接依赖关系和间接依赖关系可以准确评估一个节点对整个网络的流量影响程度,因此基于该方案确定出的关键节点更能准确表达其在节点关系网络中的重要性,从而为决策者提供更准确的决策基础。
18.上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本技术进一步的方面、实施方式和特征将会是容易明白的。
附图说明
19.在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本技术公开的一些实施方式,而不应将其视为是对本技术范围的限制。
20.图1为本技术实施例提供的关键节点的确定方法的应用场景的示意图;
21.图2为本技术实施例提供的关键节点的确定方法的流程图;
22.图3为本技术实施例提供的节点关系网络的示例图;
23.图4为本技术实施例提供的关键节点的确定方法的流程图;
24.图5本技术实施例提供的关键节点的确定装置的示意图;
25.图6为用来实现本技术实施例的电子设备的框图。
具体实施方式
26.在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
27.为便于理解本技术实施例的技术方案,以下对本技术实施例的相关技术进行说明,以下相关技术作为可选方案与本技术实施例的技术方案可以进行任意结合,其均属于本技术实施例的保护范围。
28.从一个节点关系网络中评估出关键节点,可以得到该节点关系网络中的重要节点。相关技术中,可以采用度中心性的评估方法,即计算节点的度来判断重要性,度越大节点越重要;或者,可以采用介数中心性的评估方法,即计算所有节点对的最短路径中经过该节点的数量越多,该节点越重要;又或者,可以采用接近中心性的评估方法,即计算节点与网络中其他节点的平均距离,距离越小节点越重要。度中心性、介数中心性、接近中心性这三种方法不能直接恰当的表示节点的重要程度,只是通过节点的在图上的某些属性大致表示节点的某种特质。例如在产业链网络中,某企业的度数大并不能代表该企业重要,也可能
是因为该企业是经销商类型企业。进一步地,介数中心性和接近中心性计算复杂,耗时较长。
29.相关技术中,可通过网页排名(page rank)算法计算节点的重要性,即一个节点的重要性既取决于邻居节点的数量,也取决于邻居节点的重要性。但是这种方式是基于网页中的点击行为来对网页的点击量进行排名,并不能完全代表该节点在整个节点关系网络中的重要程度。
30.相关技术中,还可以通过删除节点计算连通性的方法来评估节点的重要性,即删除一个节点,对网络的联通性破坏越大,说明该节点越重要。但是,这种方法的计算复杂度非常高,耗时也很长。
31.图1为本技术实施例提供的关键节点的确定方法的应用场景的示意图。如图1所示,节点1、节点2、节点3
……
可以是针对流转对象的流转节点,即节点之间可能存在针对流转对象的流转关系。某一节点产出的流量数据可以流转到下一节点,则这两个节点为相邻的节点。相邻的两个节点之间的流量数据可以是流转对象的数量。例如:在产业链网络中,节点可以是企业对应的节点,企业节点之间的流转对象为产品或产品交易金额,企业节点之间的流量数据可以是产品数量或产品交易金额值。又如:在金融网络中,节点可以是金融交易对应的节点,金融交易节点之间的流转对象为金融交易金额,金融交易节点之间的流量数据可以是金融交易金额值;再如:在社交网络中,节点可以是社交用户对应的节点,社交用户节点之间的流转对象为社交数据,如文本、图像、语音等,社交用户节点之间的流量数据即为社交数据数量,如文本数量、语音数量等。
32.在节点关系网络中,相邻两个节点之间的连接边表征这两个相邻节点之间的流量数据。关键节点的确定装置将任意一个节点作为待选节点,通过计算其相邻节点产出的流量数据需要直接依赖和间接依赖该待选节点产出的流量数据的程度,即计算相邻节点对待选节点的第一依赖系数(即完全依赖系数),进而确定待选节点对整个节点关系网络的网络流量影响值;然后,利用节点关系网络中的多个待选节点的网络流量影响值,从多个待选节点中确定出关键节点。
33.进一步地,确定出的关键节点可以为决策者提供决策基础。例如确定出产业链节点关系网络中的关键企业节点,能够帮助企业监管部门发现在该产业链中某企业对该产业链的影响程度,从而为企业监管部门提供决策基础,如企业监管部门可根据不同环节企业的重要程度来规划产业链上相关企业的发展。又如在金融交易网络中,确定出交易网络中的关键交易节点,能够帮助金融监管部门发现交易中的重要交易节点,防止发生金融风险。再如确定出社交网络中的关键用户,能够帮助社交网络管理者准确判断社交网络中的重要用户或核心用户,方便社交网络管理者进行网络安全监管。
34.相比于度中心性、介数中心性、接近中心性、网页排名、删除节点计算连通性的方法,本技术实施例的关键节点的确定方法,对节点的重要性提出了明确的定义,即通过计算节点对网络流量的影响来衡量节点的重要性。由于节点对网络流量的影响可以直接、准确地反映出节点的重要程度,因此,基于此所确定出的关键节点更能准确表达其在节点关系网络中的重要性,从而为决策者提供更准确的决策基础。
35.需要说明的是,关键节点的确定装置可以部署在包括独立主机的物理服务器上,也可以部署在主机集承载的虚拟服务器(如云服务器)上,还可以部署在客户端或其他处
理设备中,本技术实施例对此不进行限制。其中,客户端可以是硬件,如手机、个人电脑、平板电脑、可穿戴设备等电子设备,客户端也可以是安装在上述电子设备中的应用程序(application,app)。
36.图2为本技术实施例提供的关键节点的确定方法的流程图,该方法可以应用于关键节点的确定装置。如图2所示,该方法包括:
37.步骤s201,获取节点关系网络,其中,节点关系网络中包括多个待选节点,待选节点与其相邻节点之间的连接边表征待选节点与该相邻节点之间的流量数据。
38.节点关系网络可以是图数据的形式展现。图3为节点关系网络的一个示例图。节点关系网络中包括多个节点,如节点1、节点2
……
节点o、节点x、节点y、节点z
……
,每个节点均可以作为待选节点。待选节点与其相邻节点之间的连接边表征该待选节点与该相邻节点之间的流量数据。例如节点o和节点x为相邻的节点,节点o和节点x之间的连接边表征了节点o和节点x之间的流量数据。
39.如上所述,各待选节点均可以是流转节点,即待选节点用于将流转对象传输给相邻节点。待选节点与相邻节点之间的流量数据为待选节点传输给相邻节点的流转对象的数量。其中,在节点关系网络中,传输也可以理解为流转。
40.例如:在产业链网络中,待选节点和相邻节点可以是企业对应的节点,节点之间的流转对象为产品或产品交易金额,节点之间的流量数据可以是产品数量或产品交易金额值。又如:在金融网络中,待选节点和相邻节点可以是金融交易对应的节点,节点之间的流转对象为金融交易金额,节点之间的流量数据可以是金融交易金额值。再如:在社交网络中,待选节点和相邻节点可以是社交用户对应的节点,节点之间的流转对象为社交数据,如文本、图像、语音等,节点之间的流量数据即为社交数据量,如文本数量、语音数量等。
41.本实施例中,关键节点的确定装置通过获取各待选节点和相邻节点之间的流量数据,进而生成节点关系网络,关键节点的确定装置也可以是通过大数据库直接获取到节点关系网络,本实施例对此不作限定。
42.示例性地,节点关系网络用g=(v,e,w)表示。其中,待选节点集合v={v1,v2,...,vn}代表共有n个待选节点。连接边的集合表示为e=[e
ij
]∈v
×
v,i,j∈{1,2,...,n}且i≠j。如果节点i和节点j之间有连接边,则e
ij
为1;如果节点i和节点j之间没有连接边,则e
ij
为0。如果节点关系网络为无流转方向图,即节点之间的连接边没有箭头,则e
ij
=e
ji
。连接边的权重集合(即流量数据矩阵)表示为w=[w
ij
]∈v
×
v,i,j∈{1,2,...,n},w
ij
表示了待选节点i与相邻节点j之间的流量数据。
[0043]
步骤s202,根据待选节点与相邻节点之间的流量数据,确定相邻节点对待选节点的第一依赖系数,其中,第一依赖系数用于表征相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度。
[0044]
下面以待选节点i与相邻节点j示例。待选节点i与相邻节点j之间的连接边也可以叫做直接路径,即相邻节点j产出的流量数据需要直接依赖待选节点i产出的流量数据。相邻节点j产出的流量数据需要直接依赖待选节点i产出的流量数据的程度即为相邻节点j对待选节点i的第二依赖系数,也可以叫做直接依赖系数,因此,直接依赖系数与直接路径相对应。
[0045]
示例性地,第二依赖系数表示为a
ij
,a
ij
=w
ij
/wj,其中,w
ij
表示相邻
节点j和待选节点i之间的流量数据,wj通过计算相邻节点j与其所有相邻节点之间的流量数据之和而得到。第二依赖系数a
ij
越大,表示在整个节点关系网络g中,相邻节点j对待选节点i的直接依赖程度越高。如果待选节点i与相邻节点j之间没有连接边,那么a
ij
=0,即相邻节点j产出的流量数据不需要直接依赖待选节点i产出的流量数据。
[0046]
进一步地,待选节点i和相邻节点j之间存在以一个或多个节点作为中转节点的间接路径,即相邻节点j产出的流量数据需要经过一个或多个中转节点间接依赖待选节点i产出的流量数据。待选节点i和相邻节点j之间经过n个中转节点,即待选节点i和相邻节点j之间经过n阶中转节点,待选节点i和相邻节点j之间的间接路径为n阶间接路径,n为大于等于1的整数。其中,每一条间接路径所对应的间接依赖系数,可以用来表征在该间接路径下,相邻节点j产出的流量数据需要间接依赖待选节点i产出的流量数据的程度。
[0047]
示例性地,待选节点i和相邻节点j之间经过一阶中转节点,对应的间接路径为一阶间接路径。以一阶中转节点为节点k为例,相邻节点j产出的流量数据需要直接依赖中转节点k,中转节点k产出的流量数据需要直接依赖待选节点i。其中,a
ikakj
表示待选节点i和相邻节点j之间经过一条一阶间接路径情况下,相邻节点j产出的流量数据需要间接依赖待选节点i的程度,因此,表示待选节点i和相邻节点j之间经过全部一阶间接路径情况下,相邻节点j产出的流量数据需要间接依赖待选节点i的程度,即相邻节点j对待选节点i的一阶间接依赖系数。其中,k遍历待选节点i和相邻节点j之间的一阶中转节点。
[0048]
示例性地,待选节点i和相邻节点j之间经过二阶中转节点,对应的间接路径为二阶间接路径。以二阶中转节点为节点s和节点k为例,待选节点i产出的流量数据流转至节点s,节点s产出的流量数据流转至节点k,节点k产出的流量数据流转至相邻节点j。其中,a
isaskakj
表示待选节点i和相邻节点j之间经过一条二阶间接路径情况下,相邻节点j产出的流量数据需要间接依赖待选节点i的程度,因此,表示待选节点i和相邻节点j之间经过全部二阶间接路径情况下,相邻节点j产出的流量数据需要间接依赖待选节点i的程度,即相邻节点j对待选节点i的二阶间接依赖系数。其中,s和k遍历待选节点i和相邻节点j之间的二阶中转节点。
[0049]
示例性地,当待选节点i和相邻节点j之间的间接路径经过三阶中转节点,对应的间接路径为三阶间接路径。以三阶中转节点为节点t、节点s和节点k,待选节点i产出的流量数据流转至节点t,节点t产出的流量数据流转至节点s,节点s产出的流量数据流转至节点k,节点k产出的流量数据流转至相邻节点j。其中,a
itatsaskakj
表示待选节点i和相邻节点j之间经过一条三阶间接路径情况下,相邻节点j产出的流量数据需要间接依赖待选节点i的程度,因此,表示待选节点i和相邻节点j之间经过全部三阶间接路径情况下,相邻节点j产出的流量数据需要间接依赖待选节点i的程度,即相邻节点j对待选节点i的三阶间接依赖系数。其中,t、s和k遍历待选节点i和相邻节点j之间的三阶中转节点。
[0050]
通过遍历待选节点i和相邻节点j之间的每一条间接路径所对应的间接依赖系数,并计算各间接路径所对应的间接依赖系数之和,可以确定相邻节点j对待选节点i的间接依赖系数。也就是说,相邻节点j对待选节点i的间接依赖系数等于相邻节点j对待选节点i的各阶间接依赖系数之和,即相邻节点j对待选节点i的间接依赖系数可以通过以下公式计
算:
[0051][0052]
进一步地,相邻节点j产出的流量数据需要直接依赖和间接依赖待选节点i产出的流量数据的程度即为第一依赖系数,也可以叫做完全依赖系数。第一依赖系数表示为b
ij
,从而b
ij
可通过以下公式计算:
[0053][0054]
因此,第一依赖系数(即完全依赖系数)b
ij
表示相邻节点j对待选节点i的第二依赖系数(即直接依赖系数)和间接依赖系数之和。
[0055]
步骤s203,基于相邻节点对待选节点的第一依赖系数,确定待选节点对节点关系网络的网络流量影响值。
[0056]
以待选节点i和相邻节点j为示例,待选节点i产出的流量数据对相邻节点j产出的流量数据的影响表示为节点流量影响值f
ij
,节点流量影响值f
ij
可通过以下公式计算:
[0057][0058]
其中,w
ij
表示待选节点i对相邻节点j的直接流量影响值,即待选节点i和相邻节点j之间的流量数据。
[0059]
表示待选节点i对相邻节点j的一阶间接流量影响值,即待选节点i经过全部一阶间接路径对相邻节点j的流量影响值。其中,a
ikwkj
即为一阶中转节点k对待选节点i的直接依赖系数乘以一阶中转节点k与相邻节点j之间的流量数据,k遍历待选节点i和相邻节点j之间的一阶中转节点。
[0060]
表示待选节点i对相邻节点j的二阶间接流量影响值,即待选节点i经过全部二阶间接路径对相邻节点j的流量影响值。其中,即为中转节点k对待选节点i的一阶间接依赖系数,w
kj
即为中转节点k与相邻节点j之间的流量数据,k遍历待选节点i和相邻节点j之间的一阶中转节点。
[0061]
表示待选节点i对相邻节点j的三阶间接流量影响值,即待选节点i经过全部三阶间接路径对相邻节点j的流量影响值。其中,即为一阶中转节点k对待选节点i的二阶间接依赖系数,w
kj
即为一阶中转节点k与相邻节点j之间的流量数据,k遍历待选节点i和相邻节点j之间的一阶中转
节点。
[0062]
因此,待选节点i对相邻节点j的节点流量影响值f
ij
即为待选节点i对相邻节点j的直接流量影响值与各阶间接流量影响值之和。
[0063]
进一步地,通过计算待选节点i对各个相邻节点的节点流量影响值之和,可以得到待选节点i对整个节点关系网络g的流量影响值,即网络流量影响值fi可以表示为:
[0064][0065]
步骤s204,利用多个待选节点的网络流量影响值,从多个待选节点中确定出节点关系网络的关键节点。
[0066]
基于步骤s201~步骤s203,可以得到节点关系网络g中每个待选节点对整个节点关系网络g的网络流量影响值;进而根据每个待选节点的网络流量影响值,确定出节点关系网络g的关键节点。
[0067]
示例性地,可以对多个待选节点的网络流量影响值进行排序;进而根据排序结果确定关键节点。例如:将网络流量影响值按照从大到小的顺序排序,排在第一位或前几位的待选节点作为关键节点。关键节点的网络流量影响值最大,即关键节点对整个节点关系网络的流量影响最大,也即关键节点在整个节点关系网络中的重要程度最高。
[0068]
本技术实施例提供的关键节点的确定方法中,对节点的重要性提出了明确的定义,即通过计算节点对节点关系网络的流量影响来衡量节点的重要性,节点对网络流量的影响可以直接、准确地反映出节点的重要程度。另外,基于相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度,得到相邻节点对待选节点的第一依赖系数(即完全依赖系数),进而确定待选节点对整个节点关系网络的网络流量影响值;进一步利用多个待选节点的网络流量影响来确定出关键节点。由于直接依赖关系和间接依赖关系可以准确评估一个节点对整个网络的流量影响程度,因此基于该方案确定出的关键节点更能准确表达其在节点关系网络中的重要性,从而为决策者提供更准确的决策基础。
[0069]
在一种实施方式中,如图4所示,在步骤s204中可以包括:
[0070]
步骤s401,获取节点关系网络中的流量数据总值;
[0071]
步骤s402,确定待选节点的网络流量影响值与流量总值的比值;
[0072]
步骤s403,利用多个待选节点的比值,确定关键节点。
[0073]
示例性地,对流量数据矩阵w=[w
ij
]∈v
×
v,i,j∈{1,2,...,n}进行求和,得到流量数据总值;计算每个待选节点的网络流量影响值与流量总值的比值,即得到每个待选节点对整个节点关系网络的影响比例;利用多个待选节点的比值(即影响比例),选择影响比例最大的待选节点作为关键节点。基于节点的影响比例可以更直观地看出一个节点在节点关系网络中的重要性,便于决策者直观地发现节点关系网络中的重要节点。
[0074]
在一种实施方式中,在步骤s202中包括:根据待选节点与相邻节点之间的流量数据,生成第二依赖系数矩阵,其中,第二依赖系数矩阵中包括每个待选节点的各个相邻节点对待选节点的第二依赖系数,第二依赖系数用于表征相邻节点产出的流量数据需要直接依赖待选节点产出的流量数据的程度;利用第二依赖系数矩阵,生成第一依赖系数矩阵,其中,第一依赖系数矩阵中包括每个待选节点的各个相邻节点对待选节点的第一依赖系数。
[0075]
如上所述,第二依赖系数即直接依赖系数a
ij
,其中,a
ij
=w
ij
/wj,第
二依赖系数矩阵a=[a
ij
]∈v
×
v,i,j∈{1,2,...,n}。
[0076]
第一依赖系数(即完全依赖系数)b
ij
可通过以下公式计算:可通过以下公式计算:
[0077]
第一依赖系数矩阵计作b,b=[b
ij
]∈v
×
v,i,j∈{1,2,...,n},从而可以得到:
[0078]
b=a+a2+a3+a4+
…
=(i-a)-1-i
[0079]
也就是说,利用第二依赖系数矩阵,可以直接生成第一依赖系数矩阵。进而通过矩阵计算可以大大降低计算复杂度和计算耗时。
[0080]
进一步地,在步骤s203中可以包括:利用流量数据矩阵和第一依赖系数矩阵,生成节点流量影响值矩阵,其中,流量数据矩阵中包括待选节点与相邻节点之间的流量数据,节点流量影响值矩阵中包括待选节点对相邻节点的节点流量影响值;基于节点流量影响值矩阵,确定待选节点对待选节点的多个相邻节点的节点流量影响值之和,作为待选节点的网络流量影响值。
[0081]
对待选节点i对相邻节点j的节点流量影响值f
ij
的公式进行如下推导:
[0082][0083]
即进一步地,流量数据矩阵w=[w
ij
]∈v
×
v,i,j∈{1,2,...,n},从而可以得到节点流量影响值矩阵f=w+bw。也就是说,利用流量数据矩阵w和第一依赖系数矩阵b,可以直接生成节点流量影响值矩阵f。
[0084]
进一步地,基于节点流量影响值矩阵f,可以确定待选节点i对待选节点的多个相邻节点的节点流量影响值之和,即得到待选节点i的网络流量影响值fi,即
[0085]
根据本技术实施例的关键节点的确定方法,基于第二依赖系数矩阵、第一依赖系数矩阵、节点流量影响值矩阵之间的计算,便可以确定出影响节点关系网络流量的关键节点(重要节点),从而大大降低计算复杂度和计算耗时。
[0086]
与本技术实施例提供的方法的应用场景以及方法相对应地,本技术实施例还提供一种关键节点的确定装置。如图5所示,该关键节点的确定装置可以包括:
[0087]
节点关系网络获取模块501,用于获取节点关系网络,其中,节点关系网络中包括多个待选节点,待选节点与其相邻节点之间的连接边表征待选节点与该相邻节点之间的流量数据;
[0088]
第一依赖系数确定模块502,用于根据待选节点与相邻节点之间的流量数据,确定相邻节点对待选节点的第一依赖系数,其中,第一依赖系数用于表征相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度;
[0089]
网络流量影响值确定模块503,用于基于相邻节点对待选节点的第一依赖系数,确
定待选节点对节点关系网络的网络流量影响值;
[0090]
关键节点确定模块504,用于利用多个待选节点的网络流量影响值,从多个待选节点中确定出节点关系网络的关键节点。
[0091]
在一种实施方式中,关键节点确定模块504包括:
[0092]
流量数据总值获取单元,用于获取节点关系网络中的流量数据总值;
[0093]
比值确定单元,用于确定待选节点的网络流量影响值与流量数据总值的比值;
[0094]
第一关键节点确定单元,用于利用多个待选节点的比值,确定关键节点。
[0095]
在一种实施方式中,关键节点确定模块504包括:
[0096]
排序单元,用于对多个待选节点的网络流量影响值进行排序;
[0097]
第二关键节点确定单元,用于根据排序结果确定关键节点。
[0098]
在一种实施方式中,第一依赖系数确定模块502包括:
[0099]
第二依赖系数矩阵生成单元,用于根据待选节点与相邻节点之间的流量数据,生成第二依赖系数矩阵,其中,第二依赖系数矩阵中包括相邻节点对待选节点的第二依赖系数,第二依赖系数用于表征相邻节点产出的流量数据需要直接依赖待选节点产出的流量数据的程度;
[0100]
第一依赖系数矩阵生成单元,用于利用第二依赖系数矩阵,生成第一依赖系数矩阵,其中,第一依赖系数矩阵中包括相邻节点对待选节点的第一依赖系数。
[0101]
在一种实施方式中,网络流量影响值确定模块503包括:
[0102]
节点流量影响值矩阵生成单元,用于利用流量数据矩阵和第一依赖系数矩阵,生成节点流量影响值矩阵,其中,流量数据矩阵中包括待选节点与相邻节点之间的流量数据,节点流量影响值矩阵中包括待选节点对相邻节点的节点流量影响值;
[0103]
网络流量影响值确定单元,用于基于节点流量影响值矩阵,确定待选节点对待选节点的多个相邻节点的节点流量影响值之和,作为待选节点的网络流量影响值。
[0104]
在一种实施方式中,待选节点和相邻节点包括针对流转对象的流转节点,流量数据包括流转对象的数量。
[0105]
在一种实施方式中,待选节点和相邻节点包括企业,流量数据包括产品数量或产品交易金额值;或者,待选节点和相邻节点包括金融交易节点,流量数据包括金融交易金额值;或者,待选节点和相邻节点包括社交用户,流量数据包括社交数据数量。
[0106]
本技术实施例各装置中的各模块的功能可以参见上述方法中的对应描述,并具备相应的有益效果,在此不再赘述。
[0107]
需要说明的是,本技术各实施例中的各种信息和数据的获取、存储和应用等,均得到了相关授权或符合相关法律法规的规定,且不违背公序良俗。
[0108]
图6为用来实现本技术实施例的电子设备的框图。如图6所示,该电子设备包括:存储器601和处理器602,存储器601内存储有可在处理器602上运行的计算机程序。处理器602执行该计算机程序时实现上述实施例中的方法。存储器601和处理器602的数量可以为一个或多个。
[0109]
该电子设备还包括:
[0110]
通信接口603,用于与外界设备进行通信,进行数据交互传输。
[0111]
如果存储器601、处理器602和通信接口603独立实现,则存储器601、处理器602和
通信接口603可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(industry standard architecture,isa)总线、外部设备互连(peripheral component interconnect,pci)总线或扩展工业标准体系结构(extended industry standard architecture,eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0112]
可选地,在具体实现上,如果存储器601、处理器602及通信接口603集成在一块芯片上,则存储器601、处理器602及通信接口603可以通过内部接口完成相互间的通信。
[0113]
本技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本技术实施例中提供的方法。
[0114]
本技术实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本技术实施例提供的方法。
[0115]
本技术实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
[0116]
应理解的是,上述处理器可以是中央处理器(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced risc machines,arm)架构的处理器。
[0117]
可选地,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以包括随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用。例如:静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic random access memory,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(sync link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。
[0118]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本技术的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
[0119]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示
例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本技术的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0120]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0121]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
[0122]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如:可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
[0123]
应理解的是,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0124]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
[0125]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种关键节点的确定方法,包括:获取节点关系网络,其中,所述节点关系网络中包括多个待选节点,所述待选节点与所述待选节点的相邻节点之间的连接边表征所述待选节点与所述相邻节点之间的流量数据;根据所述待选节点与所述相邻节点之间的流量数据,确定所述相邻节点对所述待选节点的第一依赖系数,其中,所述第一依赖系数用于表征所述相邻节点产出的流量数据需要直接依赖和间接依赖所述待选节点产出的流量数据的程度;基于所述相邻节点对所述待选节点的第一依赖系数,确定所述待选节点对所述节点关系网络的网络流量影响值;利用所述多个待选节点的网络流量影响值,从所述多个待选节点中确定出所述节点关系网络的关键节点。2.根据权利要求1所述的方法,其中,利用所述多个待选节点的网络流量影响值,从所述多个待选节点中确定出所述节点关系网络的关键节点,包括:获取所述节点关系网络中的流量数据总值;确定所述待选节点的网络流量影响值与所述流量数据总值的比值;利用所述多个待选节点的比值,确定所述关键节点。3.根据权利要求1所述的方法,其中,利用所述多个待选节点的网络流量影响值,从所述多个待选节点中确定出所述节点关系网络的关键节点,包括:对所述多个待选节点的网络流量影响值进行排序;根据排序结果确定所述关键节点。4.根据权利要求1-3任一项所述的方法,其中,根据所述待选节点与所述相邻节点之间的流量数据,确定所述相邻节点对所述待选节点的第一依赖系数,包括:根据所述待选节点与所述相邻节点之间的流量数据,生成第二依赖系数矩阵,其中,所述第二依赖系数矩阵中包括每个待选节点的各个相邻节点对所述待选节点的第二依赖系数,所述第二依赖系数用于表征所述相邻节点产出的流量数据需要直接依赖所述待选节点产出的流量数据的程度;利用所述第二依赖系数矩阵,生成第一依赖系数矩阵,其中,所述第一依赖系数矩阵中包括每个待选节点的各个相邻节点对所述待选节点的第一依赖系数。5.根据权利要求4所述的方法,其中,基于所述相邻节点对所述待选节点的第一依赖系数,确定所述待选节点对所述节点关系网络的网络流量影响值,包括:利用流量数据矩阵和所述第一依赖系数矩阵,生成节点流量影响值矩阵,其中,所述流量数据矩阵中包括每个待选节点与所述待选节点的各个相邻节点之间的流量数据,所述节点流量影响值矩阵中包括每个待选节点对待选节点的各个所述相邻节点的节点流量影响值;基于所述节点流量影响值矩阵,确定所述待选节点对所述待选节点的各个相邻节点的节点流量影响值之和,作为所述待选节点的网络流量影响值。6.根据权利要求1-3任一项所述的方法,其中,所述待选节点用于将流转对象传输给所述相邻节点;其中,所述待选节点与所述相邻节点之间的流量数据为所述待选节点传输给所述相邻节点的流转对象的数量。7.根据权利要求1-3任一项所述的方法,其中,所述待选节点和所述相邻节点为企业对
应的节点,所述流量数据为产品数量或产品交易金额值;或者,所述待选节点和所述相邻节点为金融交易对应的节点,所述流量数据为金融交易金额值;或者,所述待选节点和所述相邻节点为社交用户对应的节点,所述流量数据为社交数据量。8.一种关键节点的确定装置,包括:节点关系网络获取模块,用于获取节点关系网络,其中,所述节点关系网络中包括多个待选节点,所述待选节点与所述待选节点的相邻节点之间的连接边表征所述待选节点与所述相邻节点之间的流量数据;第一依赖系数确定模块,用于根据所述待选节点与所述相邻节点之间的流量数据,确定所述相邻节点对所述待选节点的第一依赖系数,其中,所述第一依赖系数用于表征所述相邻节点产出的流量数据需要直接依赖和间接依赖所述待选节点产出的流量数据的程度;网络流量影响值确定模块,用于基于所述相邻节点对所述待选节点的第一依赖系数,确定所述待选节点对所述节点关系网络的网络流量影响值;关键节点确定模块,用于利用所述多个待选节点的网络流量影响值,从所述多个待选节点中确定出所述节点关系网络的关键节点。9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。
技术总结
本申请提供了关键节点的确定方法、装置、电子设备及存储介质,涉及大数据技术领域。方法包括:获取节点关系网络,待选节点与待选节点的相邻节点之间的连接边表征待选节点与相邻节点之间的流量数据;根据待选节点与相邻节点之间的流量数据,确定相邻节点对待选节点的第一依赖系数,第一依赖系数用于表征相邻节点产出的流量数据需要直接依赖和间接依赖待选节点产出的流量数据的程度;基于相邻节点对待选节点的第一依赖系数,确定待选节点对节点关系网络的网络流量影响值;利用多个待选节点的网络流量影响值,确定出关键节点。本申请技术方案通过计算节点对网络流量的影响来衡量节点的重要性,可以准确地确定出节点关系网络中的关键节点。的关键节点。的关键节点。