版权归原作者所有,如有侵权,请联系我们

[科普中国]-社交网络信息表示模型

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

社交网络信息表示模型是用于得到社交网络信息表示的模型。

定义社交网络信息表示模型是用于得到社交网络信息表示的模型。

社交网络信息表示模型社交网络信息表示问题因为社交网络含有可用的图结构信息,因此很多时候用到图形嵌入表示的方法,如MDS1,IsoMap2,LLE3和拉普拉斯特征图4。这些方法通常首先使用数据点的特征向量构建一个全局图,然后将一个图形嵌入到低维空间中5。然而,这些算法通常依赖于求解最优矩阵的前导特征向量,其复杂度至少与节点数相等,使得它们不能处理大规模网络。

真实的社交网络具有较大的规模,因此针对社交网络的信息表示问题又出现了一些表现更好的算法,如DeepWalk6,LINE7和IONE8等。尽管DeepWalk在实验效果上很有潜力,但并没有提供明确的目标来阐明网络中被保留的属性是什么9。因此,LINE和IONE等算法在此基础上进一步确定了具体的目标函数,使社交网络信息表示问题可以通过对目标函数进行优化来完成。

下面介绍一下算法LINE。该算法定义了节点的两种相似性,分别为一阶相似性和二阶相似性。一阶相似性可以看作局部的信息,是两点之间的相似性,即社交网络中两个用户节点之间是否存在好友关系。二阶相似性可以看作两点邻域网络的相似性,即社交网络中两个用户节点各自的好友关系网络的相似性。

对于一阶相似性有,其中为点的低维向量表示。

对于二阶相似性有

目标函数定义为,其中的分布与其经验值的分布的相似性度量,利用KL散度值进行计算。同理。最终利用梯度下降方法最小化目标函数O,进而得到社交网络的信息表示。

LINE是在社交网络信息表示领域较有代表性的算法,很多算法受到了它的启发,利用了更多的结构信息,也就是改变了算法的目标函数,但求解仍是通过最小化目标函数来完成的。

本词条内容贡献者为:

吴晨涛 - 副研究员 - 上海交通大学