参见英文答案 > Nested defaultdict of defaultdict 4个
有一个python列表
[('schema1', 'table1', 'column_name1'), ('schema1', 'table1', 'column_name2'), ('schema1', 'table2', 'column_name3'), ('schema2', 'table3', 'column_name4')]
我需要将它转换为具有以下结构的python dict
schema1:
table1:
(column_name1,
column_name2)
table2:
(column_name3)
schema2:
table3:
(column_name4)
有没有有效的转换方式?
解决方法:
我用defaultdict
生成这个,它生成defaultdict(list)实例作为默认值.
演示
>>> from collections import defaultdict
>>>
>>> d = defaultdict(lambda: defaultdict(list))
>>> data = [('schema1', 'table1', 'column_name1'), ('schema1', 'table1', 'column_name2'), ('schema1', 'table2', 'column_name3'), ('schema2', 'table3', 'column_name4')]
>>>
>>> for k1, k2, v in data:
...: d[k1][k2].append(v)
...:
>>> d
>>>
defaultdict(<function __main__.<lambda>()>,
{'schema1': defaultdict(list,
{'table1': ['column_name1', 'column_name2'],
'table2': ['column_name3']}),
'schema2': defaultdict(list, {'table3': ['column_name4']})})
为了准确匹配您想要的输出(虽然我没有太多理由),从d构建一个带有元组值的常规字典.
>>> d = {k1:{k2:tuple(v2) for k2, v2 in v1.items()} for k1, v1 in d.items()}
>>> d
>>>
{'schema1': {'table1': ('column_name1', 'column_name2'),
'table2': ('column_name3',)},
'schema2': {'table3': ('column_name4',)}}
说明
defaultdict初始值设定项接受可调用(在此示例中使用匿名lambda函数).只要缺少某个键,就会调用该callable,并将返回值用作回退值.
这条线
d = defaultdict(lambda: defaultdict(list))
正在创建一个defaultdict,当缺少一个键时会创建另一个defaultdict.第二个defaultdict在缺少密钥时创建一个列表.
>>> d = defaultdict(lambda: defaultdict(list))
>>> d['bogus']
>>> defaultdict(list, {})
>>> d['hokus']['pokus']
>>> []