A brief abstract about the paper Rumor Source Detection under Probabilistic Sampling

个人阅读整理

由于课程需要,要读一些有关网络信息(谣言),方便起见,也为了自己以后忘了,故对自己读完以后的想法做一些整理,欢迎交流和指正。


文章概括

这篇文章叫 Rumor Source Detection under Probabilistic Sampling

文章的应用模型为SI(Susceptible-Infection) model。相比之下还有个SIR(Susceptible-Infection-Recover)model。设定节点受到感染以后就不再可以恢复。另一个SIR model 认为是可恢复的(更接近实际情况吧)。

这篇文章的作者在看了一些其他人以前所做的工作(文章中有简要概括),提出在某个时间节点上所观察到的网络结构图是不完整的,即存在信息的缺失。文章讨论,在每个受感染节点以概率 p0p1)选择是否向观察者提供自己是否受感染信息的情况下,我们在利用 rumor centrality estimator 做出的对信息源的判断的准确度与p=1(即知道全部受感染节点)进行对比,在不同的树结构下的准确度情况。

在d-regular(d3)trees下,文章得出结论, 在概率 p 满足一定阈值条件下的,估计器的准确度可以非常接近无信息缺失(p=1)的估计准确度。

A brief abstract about the paper Rumor Source Detection under Probabilistic Sampling

在irregular trees 下,估计准确率与全信息下的准确率一样。
A brief abstract about the paper Rumor Source Detection under Probabilistic Sampling

然后附了一大段看不懂的数学公式证明。

那些trees的概念其实有点难以理解,百度谷歌搜了半天没找到有关这些树的介绍, 发现其实是图的特殊情况,想了解这些irregular and regular trees可以把trees 换成graph搜哦!没有深入了解(时间给的少,没空了解了。。。)。为啥选择这些奇奇怪怪的树进行实验,可能某些特性更符合实际?or 更容易操作?


想法

t 貌似实际并不可行,原来想我只要知道某一时刻的图不就可以知道下个时刻网络结构会怎样了吗,后来一想,如果某时刻知道的消息不全,但又很少,就会影响最终的结果,那么只要时间足够长,在最后得到的不全的消息会足够多,足以让我进行判断,现实中信息传播的速度足够快,等到需要追溯源头的时候可能时间已经足够长了,大概这并不算一个很影响结果的因素。