如何获得RSS源以使用PHP进行处理?

问题描述:

我在找的是如何解析目前为止的内容。解析内容对我来说不是问题,我只是不清楚如何获取内容!如果我有一堆坐在文件夹中的XML文件,我可以轻松筛选并处理它们,我只是不知道如何将它们放在文件夹中。如何获得RSS源以使用PHP进行处理?

我也可以抓取文件的位置并以这种方式抓取它们,但是我发现的所有提要似乎都只是新闻故事的链接,而不是其中的任何一个,它们都不仅仅是XML。

我不想使用任何第三方CMS如Drupal或Wordpress。对不起,如果这是一个愚蠢的问题。预先感谢任何帮助!

编辑:我昨晚做了搜索,现在我只是再次搜索,并在五秒钟内在新闻网站上发现了一个纯XML XML feed,我正在寻找哪里找不到一个昨晚。而不是提供可下载的文件,这一切RSS馈送通常将作为?可浏览文件/页面?

编辑2:是的,看起来就是这样。对不起大家!那么,希望那些有类似问题的人会得到帮助。编辑3:好吧,既然我现在创建线程,任何人都可以告诉我,如果SimpleXML或解析(比如Magpie)会更快,处理明智吗?我的假设是SimpleXML是要走的路。

+0

xml与cdata部分(例如携带html)实际上*只是* xml。 rss实际上不是*只是* xml,而是一个xml应用程序。 – 2013-03-07 04:41:11

+0

你指的是哪种文件?堆栈溢出的[feed for this question](http://*.com/feeds/question/15263177)是XML。 – 2013-03-07 04:44:13

+0

我想我会觉得很愚蠢,这取决于我编辑的答案。对不起,如果我在这里浪费大家的时间。我以为实际上会给我的文件下载到我的服务器上,而不是简单地浏览到给定的位置并以这种方式抓取文本。 – 2013-03-07 04:47:08

有很多选项可供阅读,但我喜欢用TTP://magpierss.sourceforge.net/

我不能完全肯定这是你想要的,但是,将这项工作的吗?

wget -q -O- "http://www.tuxradar.com/rss" 

我在PC上的Cygwin上做了这个,但它可以在Linux或Mac终端上工作。你也可以将输出重定向到文件,如果你想:

wget -q -O- "http://www.tuxradar.com/rss" > tux.xml 
+0

在这里抓取RSS不是问题,他想知道如何阅读 – Vineet1982 2013-03-07 04:55:34