文章目录
- PageRank
- How to solve PageRank?
- Random Walk with restarts and Personalized PageRank
- Matrix Factorization and Node Embeddings
- Limitations of node embeddings via matrix factorization and random walks
CS224W: Machine Learning with Graphs
公式输入请参考: 在线Latex公式
从矩阵的角度来理解图,从而可以:
Determine node importance via random walk (PageRank)
Obtain node embeddings via matrix factorization (MF)
View other node embeddings (e.g. Node2Vec) as MF
PageRank
网页看做图结构这个没问题,需要注意的是,现在的互联网除了超链接方式进行连接之外,还有提交post,评论,点赞,购买等关系。
在网页构成的有向图中,不是每个页面都是同样重要。
有三种方法来分析网页的重要性:
PageRank
Personalized PageRank (PPR)
Random Walk with Restarts
Links as votes
把链接数量看做重要性的衡量标准,相当于把度当做重要性标准,由于网页图是有向图,那么
第一个问题就是用出度还是入度作为衡量标准?用入度,因为出度比较容易作假
第二个问题既然链接重要性不一样,那么不同链接应该有不同的权重,重要的链接应该占有更大比重,这样使得问题变成了递归计算。
用以下公式表示节点
j
j
j的重要度“rank”:
r
j
=
∑
i
→
j
r
i
d
i
r_j=\sum_{i\rightarrow j}\cfrac{r_i}{d_i}
rj=i→j∑diri
重要性和出度有关,出度越大,分到的重要度越小。
上图中:
r
j
=
r
i
/
3
+
r
k
/
4
r_j=r_i/3+r_k/4
rj=ri/3+rk/4
Matrix Formulation
Stochastic adjacency matrix