社交网络中信息、病毒、行为等传播过程在不同程度上依赖于网络的拓扑结构。Johan Ugander等人提出了在社交网络结构对用户行为影响方面的研究成果1。这里考虑用户在Facebook上的两种行为:注册过程(recruitment)和参与过程(engagement)。注册过程是指用户收到某个Facebook用户的邀请邮件从而注册Facebook的过程。参与过程是指用户注册Facebook之后参与具体的活动的过程。虽然这两个过程都在Facebook上进行,但是他们的具体过程存在很大差异,Johan Ugander等人主要考虑用户节点的结构多样性对用户产生这两种行为的影响。所谓用户节点的结构多样性,是指用户节点在社交网络中的邻居节点所属的连通分量的个数。
假设一个用户A不是Facebook的用户,那么把A的电子邮件地址输入Facebook的用户就是A可能认识的所有Facebook用户。这里定义拥有A的电子邮件地址的Facebook用户为A在Facebook的接触邻居用户。这些接触邻居用户是A未来潜在朋友的子集。事实上A可能认识更多的人,但是由于其中一部分用户没有注册,我们无法用他们作为样本来预测一个用户是否注册Facebook(即注册过程)。Johan Ugander等人通过分析了包含五千四百万封邀请邮件的数据来研究一个基本问题:用户注册Facebook的概率和他的接触邻居结构之间的关系是什么?传统的假设是这个概率随着接触邻居的个数单调递增。而Johan Ugander等人给出的结果是用户注册Facebook的概率只和接触邻居组成的连通分量的个数有关;只有一个接触邻居时,Facebook用户转化率和接触邻居之间的连接边密度之间的关系,结果显示两者之间无明显关系;接触邻居组成的连通分量个数固定时,接触邻居的个数越多意味着Facebook用户转化率越低。
考虑结构多样性对Facebook用户登录频率的影响。具体地说,就是考虑2010年注册Facebook的用户在注册后一个星期时的结构多样性能否预测注册三个月后这些用户是否频繁登陆Facebook。用户频繁登陆的标准是每周至少6天登陆Facebook。Facebook用户的朋友规模要比电子邮件规模大很多,2010年注册的用户数量大约一千万,一周后他们的朋友数目从10到50不等,并且由于用户的朋友组成的连通分量中有很大比例是单个用户(节点),因此用户的朋友组成的连通分量的个数并不能准确反映社会环境多样性。为了更准确的反映社会环境的多样性,给出了三类诱导连通分量个数。第一类诱导连通分量个数是节点数量为k的连通分量个数。第二类诱导连通分量个数是邻居节点的k-core结构的连通分量个数。第三类诱导连通分量个数是邻居节点的k-brace结构的连通分量个数。其中一条边的嵌入度定义为边的两个节点的共同邻居节点数目,一幅图的k-brace结构定义为重复删除嵌入度小于k的边和孤立节点所剩余的子图。当用户在注册一周时的以上三类诱导连通分量个数越多,3个月后用户登录频率越高,因此诱导连通分量个数能很好地反映用户所在的社会环境的多样性并能有效地预测用户登录频率。当用户登录频率随连边密度增加先增大后减小,即在(0,1)区间内存在一个峰值。存在峰值的一种可能解释是如果邻居节点连边密度太小意味着缺少社会环境,而连边密度太高意味着社会环境缺少多样性。