使用PHP,如何使用MediaWiki API获取*文章的第一段?

问题描述:

如何使用PHP通过其MediaWiki API获取*任何文章的第一段?使用PHP,如何使用MediaWiki API获取*文章的第一段?

我接受所有建议。最有可能的CURLXML将派上用场。

+0

是什么让你觉得这是平凡的可能?据我所知,API中没有任何关于第一段的内容...... – lonesomeday 2012-02-21 16:31:05

+0

您拥有的问题不是*的问题,而是与您找回的结果一起工作。您应该使用示例页面文本/数据创建一个新问题,询问如何解析第一段。 – Brad 2012-02-21 16:40:24

我会用file_get_contents('http://wikipedia.com/'.$rest_of_url)

那么就使用字符串分析来选择一切形式

http://php.net/manual/en/function.substr.php

+0

它逃脱了:使用字符串解析来选择第一个“

”和“

”之间的所有内容,使用'substr' – cyrusv 2012-02-21 17:29:38
+0

http://wiki.dbpedia.org – jaguarhaus 2012-02-21 17:30:37

您可以使用API​​像这样:

http://en.wikipedia.org/w/api.php?action=parse&page=Stack_overflow&format=xml&prop=text&section=0 

这将返回的XML文件带结构:

<?xml version="1.0"?> 
<api> 
    <parse title="Article Title"> 
    <text xml:space="preserve">Text you wanted goes here</text> 
    </parse> 
</api> 

注意变量:page=Article_Title_Goes_Hereformat=xmlprop=text

+0

有没有一种方法可以跳过所有额外的内容,只是得到第一个页面的简介部分。我似乎在拍摄图像和右侧表格细节等 – 2014-07-01 19:30:36