符合学术规范的学术服务

大数据背景下一类社会网统计性质的初步研究

分类:计算机职称论文 时间:2020-03-04

  摘 要:在大数据背景下,文章实证地研究了一类合作竞争网络的集群系数对顶点度的依赖关系,结果显示两者的依赖关系函数c(k)形式是多样的,有指数形式、泊松形式和幂律形式。通过广义合作网络模型,在项目大小分布分别是指数分布、泊松分布和幂律分布的三种情况下,数值模拟了集群系数对顶点度的依赖关系。得到的结果与实证统计的结果相同,即c(k)有指数形式、泊松形式、幂律形式及SPL等多种形式,并得出随机选择旧节点连接的概率p越大,所得网络的集群系数对顶点度的依赖关系越远离幂律形式,越接近均匀情况即指数形式或者泊松形式。

大数据背景下一类社会网统计性质的初步研究

  关键词:集群系数;顶点度;实证统计;数值模拟;随机概率

  0 引言

  复杂网络,一个引起几乎一切基础学科和应用学科注意的热门研究领域,开始于1998年。它的研究和发展以图论作为重要基础,图论的大量知识在网络研究过程中得到了广泛的应用。之后,许多物理学家把统计物理学引入到复杂网络的研究中,大家才知道,许多实际网络的一些性质:例如集群系数(clustering coefficient)、度(degree)分 布 、平 均 距 离(averaged distance)等。

  顶点度(degree of a vertex),用k表示,是复杂网络研究中的一个重要的统计性质。一般地,假设网络中的一个节点i有ki条边将它和其他节点相连,那么这 ki个节点就是节点 i 的邻点。某一节点 i 的顶点度 ki,就定义为与该节点相连接的领点的总数,即节点的度表示为该节点的邻点个数的总和。直观上看,度越大的节点意味着它在某种意义上显得越“重要”。

  集群系数(clustering coefficient),用 c 表示,是复杂网络研究中的另一重要统计性质和概念。它表示网络中某一节点的邻点之间联系的紧密程度。例如,在你的朋友关系网络中,你的两个朋友彼此间也是朋友的可能性大小。假设网络中的一个节点i有ki条边将它和其他节点相连,显然,在这ki个节点之间最多可能有ki(ki-1)/2条边,实际存在的边数记为Ei。

  Erzsébet Ravasz 和 Albert-László Barabási 曾研究过复杂网络的层次结构与该网络集群系数对顶点度的依赖关系密切相关[1] 。他们提出,如果集群系数对顶点度的依赖关系函数c(k)是幂函数关系,即 c(k)~k-1,则表明该网络具有层次结构。反之若c(k)不满足幂函数关系,则该网络无明显的层次结构。通过实证调研,我们也发现很多实际网络的c(k)并不是很好的幂函数关系,甚至有些实际网络的集群系数与顶点度是无相关的[2-5] 。

  本文研究目的在于讨论复杂网络中集群系数与顶点度的依赖关系。接下来将极其简要地介绍我们所研究的一些实际系统,以及这些实际系统的网络构成,重要的是给出我们所研究的这些实际网络的集群系数对顶点度的依赖关系。之后将给出我们广义合作网络模型的数值模拟结果,并对结果进行了粗浅的分析。最后将给出本文的一些简单的结论,期望对复杂网络的研究具有一定的价值。

  1 实证统计结果

  统计调研了10个实际系统。表1为这10个实际网络的具体描述。图1至图10为10个实际网络的集群系数与顶点度的依赖关系。

  2 模型数值模拟

  2.1 广义合作网络模型

  下面是我们在广义合作网络模型[8] 的基础上,对模型作了一定的修改,然后通过数值模拟得到了数值结果。设初始t=0时有m0个顶点,已经联接成若干个完全图项目,它们的项目度hi0之和为h0。每步时间演化过程增加一个新顶点,然后,以一定的概率 p 随机连接、以其余的概率(1-p)优选连接,选取T-1个旧顶点,把这T-1个旧顶点和这个新顶点(共T个顶点)中两两之间尚未连接的边都连上,构成一个新的完全图项目。共演化得到 5000 个项目,5000 个节点。我们对项目大小(T)分别为泊松分布、指数分布和幂律分布时的三种情况进行了数值模拟,结果将在后文详细报道。

  2.2 数值结果分析

  下面是我们通过数值模拟得到的数值结果,图11、图 12、图 13 分别为项目大小(T)为泊松分布、指数分布和幂律分布时,当网络演化过程中新节点连接旧节点的选择概率p取不同值时的情况得到的数值模拟结果。

  3 结束语

  本文对十个实际系统进行了实证统计调研,主要研究了这十个系统的集群系数对顶点度的依赖关系,通过我们的研究发现,这些系统的c(k)关系函数形式是多样的,有指数函数、泊松函数等,甚至还有线性函数。为了能找出这些实证结果的合理解释,我们通过广义合作网络模型进行了数值模拟。通过对模型数值模拟结果的分析比较,发现在网络演化过程中,新节点选择旧节点的随机概率p越大,按照节点的项目度优选的概率(1-p)越小,演化所得网络的c(k)关系越远离幂律分布,越接近相对均匀的分布,即我们此处所述指数分布或泊松分布,而与网络本身的项目大小分布是什么情况无关。

  相关期刊推荐:《计算机时代》(月刊)创刊于1983年,由浙江省计算技术研究所和浙江省计算机学会主办,是《中国期刊网》、《中国学术期刊(光盘版)》和《中国核心期刊(遴选)数据库》收录期刊,全国发行,丰富的内容使您能够自由的遨游在信息的海洋里,了解新技术,掌握新技术,享受精彩纷呈的数字生活。目前,设有:学术论坛、技术广角、网络天地、应用实践、经验技巧、信息安全、考试团地、市场纵览栏目。

全学科期刊推荐 中英文发表指导

* 稍后学术顾问联系您

学术顾问回访> 详细沟通需求> 确定服务项目> 支付服务金> 完成服务内容

SCI期刊

国际英文期刊

核心期刊

国外书号出书

国内纸质出书

2023最新分区查询