网站如何从rss提要中检索“新”项目?

问题描述:

假设我想分析Sherdog新闻提要。是通过解析公共XML文件来检索它们的唯一方法吗?网站是否没有将服务内容“推送”到服务器上?网站如何从rss提要中检索“新”项目?

我在这个印象之下,做这件事的常见方法是设置一个cron作业,说每10分钟打一个页面(如this),并且将项目插入数据库(如果它们不在那里)。

这是这种情况?如果没有,有人可以教育我吗?

是的,轮询RSS馈送是事实上的标准。 RSS阅读器和服务器应该支持缓存机制(最重要的是HTTP条件GET)来提高效率。

摆脱投票的新兴方法是PubSubHubub,它确实将通知推送给订阅者。

+0

得到任何链接轮询RSS源的最佳做法? – Martin 2010-11-01 04:25:01

+0

PubSubHubbub将节省您的带宽...和您的CPU周期:)另外,请检查http://superfeedr.com,因为它们可以将_any_提要转换为PubSubHubbub,因此您不必轮询任何提要。 – 2010-11-01 08:28:00

+0

@Julien Genestoux - 您是否认为PubSubHubub现在可以使用,这要归功于superfeedr?你自己用它吗? – 2010-11-01 15:38:10