获得“参见”一节中

获得“参见”一节中

问题描述:

*页面

我希望得到一个*的文章,在“又见”一节中的所有链接,但蟒蛇维基API(Wikipedia documentation)不提供这些信息。即使我使用“页面”功能获得一个网页的全部内容以“另见”部分中提取,这部分通常是空的! (如果你使用浏览器浏览该网页,它不会是空的!)。获得“参见”一节中

​​

The "See also" section is not empty! 所以,我认为,对于获取这些信息的唯一方法是解析HTML页面。任何意见,帮助我提取这些信息,而不解析HTML页面,是值得赞赏的。

+0

这是荒谬的!没有收到任何评论,两个人只给了我负面的评价! – woody

似乎是一个合理的问题给我。无论如何,你可能还是要解析HTML,但RESTBase API提供了“移动部分”端点组由部分的标题输出HTML。该API端点看起来是这样的:

https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Facebook

Documentation provided here

的API响应包含的对象与 '部分' 财产这样

"remaining": { 
    "sections": [ 
     { 
     "id": 39, 
     "text": ..., 
     "toclevel": 1, 
     "line": "See also", 
     "anchor": "See_also" 
     }, 
    ... 
    ] 
} 

有了这种反应,你可以选择HTML从其line属性字符串“又见”相匹配的部分。