科学⽹—⼈类⾏为动⼒学中常见的标度律
指数分布
过 去,当通信运营商需要估计移动通信中占线的电话数量并优化资源配置、交通部门想要模拟交通流量的模式或事故发⽣频率、以及⽹络和街区零售业意欲改进仓储和 服务设置时,⼈们往往⽤齐次泊松过程来描述这些问题。即⼈类⾏为发⽣的时间间隔服从负指数分布,事件发⽣的数量服从泊松分布。所以指数分布是⼤家都熟悉的 ⼀种分布,在不同坐标下的图形如下所
⽰:
幂律分布
幂律分布实际上很早就被发现了,但是直到Barabasi 在Nature 上 发了那篇开⼭之作后这种默默⽆闻的分布律⼀下⼦就⽕了起来,在随后的两三年中,现实⽣活中⼤量的幂律分布集中涌现,仿佛不说幂律就没⼈重视,⽂章就发不出 来。幂律分布在双对数坐标下表现为直线形式,暗⽰事件发⽣的概率极不均匀,⼩观测值的事件⼤量发⽣⽽⼤观测值的事件虽然数量众多但是发⽣的概率却都⾮常的 ⼩,表现在时间间隔的分布上即长时间的静默和短时间的爆发交织共存。下图即引⾃Barabasi
的那篇⽂献,幂律分布与指数分布下事件发⽣模式的区别可见⼀斑。
指数截断的幂律分布实际上很多现实的分布规律都难以⽤单⼀的分布函数来拟合或者预测,⽽是者混合的,⼀种常见的混合分布即带有指数截断的幂律分布。这种分布我们在博客发布和商业订单中均有发现。如下图所⽰,两个分布分别可由包含⼀个幂律和两个幂律部分的函数式表⽰。
漂移幂率分布
漂移幂率(shifted power-law)也是⼀种综合了幂律与指数特征的分布形式,其中参数可以控制分布在幂律()与指数()之间⾃由转换。⽰例如下:
References:
1.Chang Hui, Su Beibei, Zhou Yueping, et al. Assortativity and act degree distribution of
some collaboration networks[J]. Physica A, 2007, 383: 687-702.
2.Wang Yongli, Zhou Tao, Shi Jianjun, et al. Empirical analysis of dependence between
stations in Chine railway network[J]. Physica A, 2009, 388:2949-2955.
3.Wang Peng, Zhou Tao, Han Xiao-Pu, Wang Bing-Hong. Modeling correlated human
dynamics. arXiv:1007.4440v3.
除了混合形式的分布还有分段形式的分布被观测到,如:
单峰分布
如图所⽰,作者在考察物流运输的各个环节后发现,时间间隔分布表现为⼀种特殊的单峰形态特征:左半部分具有较⼩波峰且含有极⼤值,右半部分具有明显的重尾特征并可⽤幂律函数近似拟合。
Wang Qing, Guo Jin-Li. Human dynamics scaling characteristics for aerial inbound logistics operation. Physica A, 2010, 389:2127-2133.
双峰分布
如上图,作者统计了⼿机⽤户互发短消息的时间间隔后发现该分布表现为以上形式,幂律分布后跟着⼀个指数分布,作者称之为为双峰分布,因为该指数分布位于幂律拟合直线的上⽅,⽽不是指数截断那样在拟合直线的下⽅。个⼈认为这种说法并不准确,因为指数部分并没有峰值,所以谈不上“双峰”——除⾮把坐标系逆时针旋转让拟合直线成为横坐标才会出现两个峰
值点。
communication. PNAS, 1013140107.