python中feedparser用法(rss订阅获取正在上映的电影信息)
feedparser
是一个Python的Feed解析库(Feed可理解接收信息来源更新的接口),使用它我们可从任何 RSS 或 Atom 订阅源得到标题、链接和文章的条目了。
RSS(Really Simple Syndication,简易信息聚合)是一种描述和同步网站内容的格式你可以认为是一种定制个性化推送信息的服务。它能够解决你漫无目的的浏览网页的问题。它不会过时,信息越是过剩,它的意义也越加彰显。网络中充斥着大量的信息垃圾,每天摄入了太多自己根本不关心的信息。让自己关注的信息主动来找自己,且这些信息都是用户自己所需要的,这就是RSS的意义。
RSS的订阅源见如下链接:
如下链接对RSS订阅源解读的比较全
https://www.runningcheese.com/rss-subscriptions
Feedparser中最核心的为Parser()函数,如下获取微博实时热搜榜
import feedparser
url = 'https://rsshub.app/weibo/search/hot'
data=feedparser.parse(url)
返回的结果有
标题:data.feed.title
一组文章条目:data..entries
每篇文章的摘要:data.entries[i].summary
等等...........................
如下实例展示获取当前上映的电影
1.先获取数据
import feedparser
url = 'https://rsshub.app/douban/movie/playing'
data=feedparser.parse(url) # data为字典
2.打印标题,链接,子标题之类的,随便看看
#标题
print(data['feed'].title)
print(data.feed.title)
#rss源链接
print(data.feed.link)
#子标题
print(data.feed.subtitle)
结果为
3.可查看entries内容,且格式为list
print(type(data['entries'])) #list
print(data['entries'])
4.获取entries条目中每条信息,打印出标题(title)和摘要(summary)
for one in data['entries']:
#print(one)
print(one['title'])
print(one['summary']) # 摘要
#print(one['links'][0]['href'])
结果如下:
参考链接: