网站如何从rss提要中检索“新”项目?
问题描述:
假设我想分析Sherdog新闻提要。是通过解析公共XML文件来检索它们的唯一方法吗?网站是否没有将服务内容“推送”到服务器上?网站如何从rss提要中检索“新”项目?
我在这个印象之下,做这件事的常见方法是设置一个cron作业,说每10分钟打一个页面(如this),并且将项目插入数据库(如果它们不在那里)。
这是这种情况?如果没有,有人可以教育我吗?
假设我想分析Sherdog新闻提要。是通过解析公共XML文件来检索它们的唯一方法吗?网站是否没有将服务内容“推送”到服务器上?网站如何从rss提要中检索“新”项目?
我在这个印象之下,做这件事的常见方法是设置一个cron作业,说每10分钟打一个页面(如this),并且将项目插入数据库(如果它们不在那里)。
这是这种情况?如果没有,有人可以教育我吗?
得到任何链接轮询RSS源的最佳做法? – Martin 2010-11-01 04:25:01
PubSubHubbub将节省您的带宽...和您的CPU周期:)另外,请检查http://superfeedr.com,因为它们可以将_any_提要转换为PubSubHubbub,因此您不必轮询任何提要。 – 2010-11-01 08:28:00
@Julien Genestoux - 您是否认为PubSubHubub现在可以使用,这要归功于superfeedr?你自己用它吗? – 2010-11-01 15:38:10