使用feedparser或其他一些Python库来下载和解析RSS提要;如何可靠地检测新物品和修改过的物品?
到目前为止,我已经看到Feed中的新项目,其发布日期早于最新项目.此外,我看到饲料阅读器显示相同的项目发布时内容略有不同作为单独的项目.我没有实现提要阅读器应用程序,我只想要一个合理的策略来存档提要数据.
解决方法:
这取决于您对饲料来源的信任程度. feedparser为feed项提供.id属性 – 对于RSS和ATOM源,此属性应该是唯一的.例如,请参阅例如feedparser的ATOM docs.尽管.id将涵盖大多数情况,但可以想象源可能会发布具有相同ID的多个项目.在这种情况下,您没有太多选择,只能散列项目的内容.