社会科学研究的一个核心问题是虚拟社区是如何随时间的演化以及虚拟社区的规模为什么会增长。在数字化信息领域,由于随着虚拟社区规模的不断增加,MySpace、LiveJournal等在线社交网络逐渐成为信息网络交流的主流平台,然而搜集和分析虚拟社区演化过程的大规模数据成为一个非常困难的问题。因此为了了解虚拟社区的增长过程,主要从以下两个关键问题寻找突破口:影响某个用户是否加入某个虚拟社区的因素是什么? Lars Backstrom等人所采用的数据集有两个:LiveJournal上的朋友关系和虚拟社区的数据,DBLP上的合作者和会议论文数据。为了讨论一个用户加入一个虚拟社区的影响因素,他们把虚拟社区中至少有一个朋友但自己不在虚拟社区中的用户定义为fringe。Lars Backstrom1等人首先考虑一个fringe加入虚拟社区的概率和他在虚拟社区中朋友的数目的关系,也就是说,fringe加入虚拟社区的可能性是否存在累积效应。通过实验发现对于LiveJournal和DBLP决策树顶层的内容对于多次实验都非常稳定。其中用户在虚拟社区内部朋友之间的连接情况对预测起着重要的作用。下一步要讨论的问题就是fringe在虚拟社区内部朋友之间的连接稠密程度和fringe加入社区的概率的关系是什么。实验表明用户在虚拟社区内朋友之间的连接强度越大,用户加入虚拟社区的概率越高。