graph-learning

图传播算法(上):

https://mp.weixin.qq.com/s?__biz=MzI2MDE5MTQxNg==&mid=2649687693&idx=1&sn=1dc186d11b7c802ef518b32785c78e4a&chksm=f276c35ac5014a4cfb7d8fa6eb636ba011c99f519f6079512370fbfcc2cd5a37a739de72a7f2&scene=21#wechat_redirect

不断更新函数

PageRank

被更多网页链接到的网页更重要;有更少外链的网页将会传递更高的权重

图传播算法(下)

https://mp.weixin.qq.com/s?src=11&timestamp=1585742506&ver=2252&signature=-p016dG11Ls4lF6y2CFtc9MoFBxPNWIRivL9mZqPEgo32c3r4u20xW8EBfK1EmKiaQ4bfR77kUYz3X0Z5CabGJ*L9B1MntleaAGGAwrsTyHtQ7eVhXydbGpHCi1wvfit&new=1

HITS

  • Authority:可理解为权威页面,一般包含高质量内容。
  • hub:可理解为导航页面,指向很多Authority页面。

其经验假设为:

  • 被越多的hub页面所指向的页面,内容质量越高。
  • 一个hub页面会尽可能地指向更高质量的内容页面。

Weisfeiler-Lehman

解决图的相似性问题,虽然算法要解决的问题聚焦在Graph层面上,但是其立足点还是在节点上,如果我们能够找到一种衡量节点独立性(unique)的方法,那么我们就可以将图视作一个包含这些独立性节点的集合,两张图的相似性可以转化为两个集合的Jaccard相似度。

在节点邻居信息的基础上,加上哈希函数。

RVE2

解决恶意评分场景下问题。

给定一个有向的,带有权重的二部图Bipartite Graph G=(U,R,P)。其中,U代表用户集合,P代表商品集合,R表示所有边的集合,边(μ,p)表示用户μ对商品p的一次评分操作,设评分为score(μ,p),score(μ,p)∈[-1,1]。

分别对用户、商品、评分设计了衡量指标。

刻画了上述三个指标之后,可以总结出下面5条经验假设:

  • 质量好的商品得到更高的评分
  • 质量好的商品得到更多可靠的正面评分
  • 可靠的评分在数值上更接近商品的质量
  • 可靠的评分来自公正用户
  • 给出越可靠评分的用户公正度越高

更新公式会趋向于忽略低可靠度的评分,而加大高可靠度评分的权重。也可证明,更新公式全部符合上述五条经验假设。

图卷积神经网络

https://mp.weixin.qq.com/s?__biz=MzI2MDE5MTQxNg==&mid=2649687812&idx=2&sn=c287f48f04b4755577da8ce46c487582&chksm=f276c2d3c5014bc57aaa25c7c50d87ba6d46762d79e1aa5761325bed25955be578253811ff60&scene=21#wechat_redirect

卷积神经网络很好,但是它研究的对象还是限制在Euclidean domains的数据。什么是Euclidean data? Euclidean data最显著的特征就是有规则的空间结构,比如图片是规则的正方形栅格,比如语音是规则的一维序列。而这些数据结构能够用一维、二维的矩阵表示,卷积神经网络处理起来很高效。

但是,我们的现实生活中有很多数据并不具备规则的空间结构,称为Non Euclidean data。比如推荐系统、电子交易、计算几何、脑信号、分子结构等抽象出的图谱。这些图谱结构每个节点连接都不尽相同,有的节点有三个连接,有的节点有两个连接,是不规则的数据结构。

图卷积算子:发射消息、接收消息、变换

局部参数共享,感受域正比于层数