聚类系数计算——GCCLCC
聚类系数计算
在图论中,集聚系数是图中的点倾向于集聚在⼀起的程度的⼀种度量。证据显⽰:在多数实际⽹络以及特殊的社会⽹络中,结点有形成团的强烈倾向,这⼀倾向的特征是有⼀个相对紧密的连接(Holland and Leinhardt, 1971[1]; Watts and Strogatz, 1998[2],后者是提出了⼩世界⽹络模型)。在实际⽹络中,这种可能性⽐随机⽣成的均匀⽹络的两个结点间连接的可能性⼤(Holland andLeinhardt, 1971; Watts and Strogatz, 1998)。
这⼀度量有两种版本的⽅法:全局的和局部的。全局的⽅法旨在度量整个⽹络的集聚(性),⽽局部的(⽅法)给出了单个结点的嵌⼊性的度量。
Global clustering coefficient(全局集聚系数)
全局集聚系数是基于结点三元组的。⼀个三元组是其中有两条(开三元组)或三条(闭三元组)⽆向边连接的三个结点。⼀个三⾓由三个封闭的三元组构成,(三⾓)集中在每⼀个结点上。全局集聚系数是所有三元组(包括开和闭的)中封闭三元组的数⽬。定义如下:
身体是革命的本钱
Local clustering coefficient(局部集聚系数)
图中⼀个结点的局部集聚系数表⽰了它的相邻结点形成⼀个团(完全图)的紧密程度。Duncan J. Watts和Steven Strogatz在1998年引⼊了度量⼀个图是否是⼩世界⽹络的⽅法。
医学理论
定义
双子座男人 G = (V, E) : 图G包含⼀系列结点V和连接它们的边E.
闵子骞的故事 eij : 连接结点i与结点j的边.
Ni = {vj : eij∈E ∩ eji∈E} : vi的第i个相邻结点.
ki : vi相邻结点的数量.
结点vi的局部集聚系数Ci是它的相邻结点之间的连接数与它们所有可能存在连接的数量的⽐值。对于⼀个有向图,eij 与 eji是不同的,因⽽对于每个邻结点 Ni在邻结点之间可能存在有 ki(ki − 1)条边(ki 是结点的出⼊度之和)。
因此,有向图的局部集聚系数为:
屁股诱惑⽆向图的为:
定义λG(v), (集聚系数)为⽆向图G中三⾓形的数量。λG(v)是G的有三条边和三个结点的⼦图的数量,其中⼀个就是v。定义好受成双
τG(v)为中三元组的数量。也就是说,τG(v)是有两条边和三个结点的⼦图(并不要求是⼊射)的数量,其中⼀个是v,这样有v两条⼊射边。那么我们可以定义集聚系数为:
很容易证明以上两种定义是等价的,因为
责的成语
Network average clustering coefficient(⽹络的平均集聚系数)
整个⽹络的集聚系数由Watts和Strogatz定义为所有结点n的局部集聚系数的均值:
如果⼀个图的平均集聚系数显著⾼于相同结点集⽣成的随机图,⽽且平均最短距离与相应随机⽣成的随机图相近,那么这个图被认为是⼩世界的。戏说脸谱
有更⾼平均集聚系数的⽹络被发现有着模块结构,同时在不同结点中还有更⼩的平均距离。