使用PHP，如何使用MediaWiki API获取*文章的第一段？

问题描述：

如何使用PHP通过其MediaWiki API获取*任何文章的第一段？使用PHP，如何使用MediaWiki API获取*文章的第一段？

我接受所有建议。最有可能的CURL或XML将派上用场。

是什么让你觉得这是平凡的可能？据我所知，API中没有任何关于第一段的内容...... – lonesomeday 2012-02-21 16:31:05

您拥有的问题不是*的问题，而是与您找回的结果一起工作。您应该使用示例页面文本/数据创建一个新问题，询问如何解析第一段。 – Brad 2012-02-21 16:40:24

答

我会用file_get_contents('http://wikipedia.com/'.$rest_of_url)

那么就使用字符串分析来选择一切形式

到

http://php.net/manual/en/function.substr.php

它逃脱了：使用字符串解析来选择第一个“

”和“

”之间的所有内容，使用'substr' – cyrusv 2012-02-21 17:29:38

http://wiki.dbpedia.org – jaguarhaus 2012-02-21 17:30:37

答

您可以使用API像这样：

http://en.wikipedia.org/w/api.php?action=parse&page=Stack_overflow&format=xml&prop=text&section=0

这将返回的XML文件带结构：

<?xml version="1.0"?> 
<api> 
    <parse title="Article Title"> 
    <text xml:space="preserve">Text you wanted goes here</text> 
    </parse> 
</api>

注意变量：page=Article_Title_Goes_Hereformat=xmlprop=text

有没有一种方法可以跳过所有额外的内容，只是得到第一个页面的简介部分。我似乎在拍摄图像和右侧表格细节等 – 2014-07-01 19:30:36

使用PHP，如何使用MediaWiki API获取*文章的第一段？

相关推荐