如何通过python中的feedparser收集所有feed？

2024-03-20 13:44:28

我正在尝试使用feedparser从reuters.com获取RSS源.我访问了链接http://in.reuters.com/tools/rss以获取RSS订阅源链接,例如http://feeds.reuters.com/reuters/INtopNews.当我使用feedparser在python中实现代码时,我只得到10个帖子,如下所示：

import feedparser

feeds = feedparser.parse('http://feeds.reuters.com/Reuters/worldNews')

for feed in feeds['entries']:
    print(feed['title'])

但是,如果我在www.feedreader.com上可视化相同的链接,当我附加链接并向下滚动时,我可以找到更多帖子.如何在python中的feedparser中获取所有这些RSS帖子？

解决方法:

您只从路透社的Feed中获得10个项目的原因是因为所有Feed都包含.大多数RSS源仅包含最新的项目,而不是所有项目都会及时返回. feedparser库读取Feed中当前的内容.

您的代码示例中的Reuters提要包含10个项目.

当诸如Feedreader之类的RSS阅读器显示的项目多于向下滚动时的项目时,这是因为阅读器会保存不再在Feed中的旧项目.基于Web的RSS阅读器通常以这种方式存档项目.

码农公寓

相关文章