我正在尝试使用feedparser从reuters.com获取RSS源.我访问了链接http://in.reuters.com/tools/rss以获取RSS订阅源链接,例如http://feeds.reuters.com/reuters/INtopNews.当我使用feedparser在python中实现代码时,我只得到10个帖子,如下所示:
import feedparser
feeds = feedparser.parse('http://feeds.reuters.com/Reuters/worldNews')
for feed in feeds['entries']:
print(feed['title'])
但是,如果我在www.feedreader.com上可视化相同的链接,当我附加链接并向下滚动时,我可以找到更多帖子.如何在python中的feedparser中获取所有这些RSS帖子?
解决方法:
您只从路透社的Feed中获得10个项目的原因是因为所有Feed都包含.大多数RSS源仅包含最新的项目,而不是所有项目都会及时返回. feedparser库读取Feed中当前的内容.
您的代码示例中的Reuters提要包含10个项目.
当诸如Feedreader之类的RSS阅读器显示的项目多于向下滚动时的项目时,这是因为阅读器会保存不再在Feed中的旧项目.基于Web的RSS阅读器通常以这种方式存档项目.