这是我头两周的编码;为一个基本问题道歉.
我设法解析了“ WorldNews” subreddit json,确定了各个子项(在我撰写本文时,其中有24个子项)并获取了每个新闻项的标题.我现在正尝试根据这些新闻标题创建一个数组.下面的代码确实每2-3次尝试将第五个标题([4])打印到命令行(否则提供下面的错误).它一次也不会打印多个标题(例如,如果我尝试[2,3,4],我将不断出现相同的错误).
我收到的错误无法编译:
in <module> Children = theJSON["data"]["children"] KeyError: 'data'
我的剧本:
import requests
import json
r = requests.get('https://www.reddit.com/r/worldnews/.json')
theJSON = json.loads(r.text)
Children = theJSON["data"]["children"]
News_list = []
for post in Children:
News_list.append (post["data"]["title"])
print News_list [4]
解决方法:
我设法在Eric的帮助下找到了一个解决方案.实际上,这里的问题与dict或数组的键,解析或表示无关.当从reddit请求一个URL并尝试打印json字符串输出时,我们会遇到HTTP错误429.解决此问题很简单.答案在this redditdev线程上找到.
解决方案:通过为请求Url的设备添加一个标识符(标头中的“ User-agent”),它可以平稳运行并每次都能正常工作.
import requests
import json
r = requests.get('https://www.reddit.com/r/worldnews.json', headers = {'User-agent': 'Chrome'})
theJSON = json.loads(r.text)
print theJSON