CS224W摘要04.Graph as Matrix:PageRank, Random Walks and Embeddings

文章目录


CS224W: Machine Learning with Graphs
公式输入请参考: 在线Latex公式
从矩阵的角度来理解图,从而可以:
Determine node importance via random walk (PageRank)
Obtain node embeddings via matrix factorization (MF)
View other node embeddings (e.g. Node2Vec) as MF

PageRank

网页看做图结构这个没问题,需要注意的是,现在的互联网除了超链接方式进行连接之外,还有提交post,评论,点赞,购买等关系。
在网页构成的有向图中,不是每个页面都是同样重要。
有三种方法来分析网页的重要性:
PageRank
Personalized PageRank (PPR)
Random Walk with Restarts

Links as votes

把链接数量看做重要性的衡量标准,相当于把度当做重要性标准,由于网页图是有向图,那么
第一个问题就是用出度还是入度作为衡量标准?用入度,因为出度比较容易作假
第二个问题既然链接重要性不一样,那么不同链接应该有不同的权重,重要的链接应该占有更大比重,这样使得问题变成了递归计算。
用以下公式表示节点 j j j的重要度“rank”:
r j = ∑ i → j r i d i r_j=\sum_{i\rightarrow j}\cfrac{r_i}{d_i} rj​=i→j∑​di​ri​​
重要性和出度有关,出度越大,分到的重要度越小。
CS224W摘要04.Graph as Matrix:PageRank, Random Walks and Embeddings
上图中: r j = r i / 3 + r k / 4 r_j=r_i/3+r_k/4 rj​=ri​/3+rk​/4

Matrix Formulation

Stochastic adjacency matrix

上一篇:拆分表中sheet


下一篇:设置列可编辑