Classification in biological networks withhypergraphlet kernels笔记

Classification in biological networks withhypergraphlet kernels笔记图学习:一般可以看作是监督的或非监督的。在监督设置下,对典型任务进行分类;即。,全图[55]标签的赋值,顶点或边分类;或link prediction中,集预测图中边的存在性。

摘要

超图是图的一种概括,它提供了一种框架来减少信息损失,并统一不同的基于图的方法。在本文中,我们提出了一种基于超图的建模物理系统的方法,并将超图上的顶点分类、边缘分类和链接预测问题表示为半监督设置中(扩展的、对偶的)超图上的顶点分类的实例。本文介绍了一种新的顶点和边标记超图的核方法,用于分析和学习。该方法基于小的简单超图的精确和不精确(通过超图编辑距离)枚举,称为hypergraphlets,用感兴趣的一个顶点作为根。图核经常开发与传统向量空间方法类似的想法。
图分类可以使用概率图模型,如马氏随机域[30]和相关的标签传播[66]或基于流的[40]方法。

图分类问题定义

  • 节点分类
    半监督学习,知道一些点的label 去预测一些点的label ,(比如cora引用数据集问题,蛋白质功能预测[,疾病基因优先化)。
  • 边分类问题
    对超边进行分类,也是半监督,由图中已知的边label预测无标签,例子:预测各种大分子的相互作用,如阳性和阴性调节
  • 连接预测
    这里G+(V,E)G+(V,E)表示失去了一些超边的超图
    目标是学习一个目标函数:U→{−1,+1},并推断所有缺失的超边的存在性。例如预测蛋白-蛋白相互作用,预测药物-靶标相互作用等

超图二元性

从顶点定义 或者从 边定义

Classification in biological networks withhypergraphlet kernels笔记

方法

从 Hypergraphlets 出发(hypergraph是从graphlets中类比过来的),我们定义超图是微小的、简单的、连通的、有根的超图。如下面是同构或者非同构的超图。
Classification in biological networks withhypergraphlet kernels笔记

Hypergraphlet kernels

核函数
Classification in biological networks withhypergraphlet kernels笔记内积
Classification in biological networks withhypergraphlet kernels笔记Classification in biological networks withhypergraphlet kernels笔记

编辑距离Edit-distance hypergraphlet kernels

计算hypergraphlet核的编辑距离
Classification in biological networks withhypergraphlet kernels笔记Classification in biological networks withhypergraphlet kernels笔记Classification in biological networks withhypergraphlet kernels笔记

实验

Classification in biological networks withhypergraphlet kernels笔记protein-protein interaction (PPI)
drug-target interaction (DTI)