Classification in biological networks withhypergraphlet kernels笔记
图学习:一般可以看作是监督的或非监督的。在监督设置下,对典型任务进行分类;即。,全图[55]标签的赋值,顶点或边分类;或link prediction中,集预测图中边的存在性。
摘要
超图是图的一种概括,它提供了一种框架来减少信息损失,并统一不同的基于图的方法。在本文中,我们提出了一种基于超图的建模物理系统的方法,并将超图上的顶点分类、边缘分类和链接预测问题表示为半监督设置中(扩展的、对偶的)超图上的顶点分类的实例。本文介绍了一种新的顶点和边标记超图的核方法,用于分析和学习。该方法基于小的简单超图的精确和不精确(通过超图编辑距离)枚举,称为hypergraphlets,用感兴趣的一个顶点作为根。图核经常开发与传统向量空间方法类似的想法。
图分类可以使用概率图模型,如马氏随机域[30]和相关的标签传播[66]或基于流的[40]方法。
图分类问题定义
- 节点分类
半监督学习,知道一些点的label 去预测一些点的label ,(比如cora引用数据集问题,蛋白质功能预测[,疾病基因优先化)。 - 边分类问题
对超边进行分类,也是半监督,由图中已知的边label预测无标签,例子:预测各种大分子的相互作用,如阳性和阴性调节 - 连接预测
这里表示失去了一些超边的超图
目标是学习一个目标函数:U→{−1,+1},并推断所有缺失的超边的存在性。例如预测蛋白-蛋白相互作用,预测药物-靶标相互作用等
超图二元性
从顶点定义 或者从 边定义
方法
从 Hypergraphlets 出发(hypergraph是从graphlets中类比过来的),我们定义超图是微小的、简单的、连通的、有根的超图。如下面是同构或者非同构的超图。
Hypergraphlet kernels
核函数内积
编辑距离Edit-distance hypergraphlet kernels
计算hypergraphlet核的编辑距离
实验
protein-protein interaction (PPI)
drug-target interaction (DTI)