图传播算法(上):
不断更新函数
PageRank
被更多网页链接到的网页更重要;有更少外链的网页将会传递更高的权重
图传播算法(下)
HITS
- Authority:可理解为权威页面,一般包含高质量内容。
- hub:可理解为导航页面,指向很多Authority页面。
其经验假设为:
- 被越多的hub页面所指向的页面,内容质量越高。
- 一个hub页面会尽可能地指向更高质量的内容页面。
Weisfeiler-Lehman
解决图的相似性问题,虽然算法要解决的问题聚焦在Graph层面上,但是其立足点还是在节点上,如果我们能够找到一种衡量节点独立性(unique)的方法,那么我们就可以将图视作一个包含这些独立性节点的集合,两张图的相似性可以转化为两个集合的Jaccard相似度。
- Jaccard系数:相同的 除以 总共的,https://baike.baidu.com/item/Jaccard系数/6784913?fr=aladdin
在节点邻居信息的基础上,加上哈希函数。
RVE2
解决恶意评分场景下问题。
给定一个有向的,带有权重的二部图Bipartite Graph G=(U,R,P)。其中,U代表用户集合,P代表商品集合,R表示所有边的集合,边(μ,p)表示用户μ对商品p的一次评分操作,设评分为score(μ,p),score(μ,p)∈[-1,1]。
分别对用户、商品、评分设计了衡量指标。
刻画了上述三个指标之后,可以总结出下面5条经验假设:
- 质量好的商品得到更高的评分
- 质量好的商品得到更多可靠的正面评分
- 可靠的评分在数值上更接近商品的质量
- 可靠的评分来自公正用户
- 给出越可靠评分的用户公正度越高
更新公式会趋向于忽略低可靠度的评分,而加大高可靠度评分的权重。也可证明,更新公式全部符合上述五条经验假设。
图卷积神经网络
卷积神经网络很好,但是它研究的对象还是限制在Euclidean domains的数据。什么是Euclidean data? Euclidean data最显著的特征就是有规则的空间结构,比如图片是规则的正方形栅格,比如语音是规则的一维序列。而这些数据结构能够用一维、二维的矩阵表示,卷积神经网络处理起来很高效。
但是,我们的现实生活中有很多数据并不具备规则的空间结构,称为Non Euclidean data。比如推荐系统、电子交易、计算几何、脑信号、分子结构等抽象出的图谱。这些图谱结构每个节点连接都不尽相同,有的节点有三个连接,有的节点有两个连接,是不规则的数据结构。
图卷积算子:发射消息、接收消息、变换
局部参数共享,感受域正比于层数