使用 yield 压平多层字典列表混合嵌套数据

在上一篇文章里面,我们讲到了如何使用Python的yield关键字简化代码,压平多层嵌套字典的。

那么如果我们的数据不仅仅有字典,还有列表,是一个字典列表多层嵌套的数据怎么办呢?例如:

1
2
3
4
5
6
7
8
9
10
11
12
nest_dict = {
'a': 1,
'b': {
'c': 2,
'd': 3,
'e': {'f': 4}
},
'g': {'h': 5},
'i': 6,
'j': {'k': {'l': {'m': 8}}},
'n': [1, {'o': 1, 'p': [1, 2, 3], 'q': {'r': {'s': 100}}}, 3, [1, 2, 3], 5]
}

现在,请停下来,敲一敲代码,想想如何把处理列表的逻辑添加进去。

首先,我们来看一下最终被压平以后的数据长什么样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
{'a': 1,
'b_c': 2,
'b_d': 3,
'b_e_f': 4,
'g_h': 5,
'i': 6,
'j_k_l_m': 8,
'n_0': 1,
'n_1_o': 1,
'n_1_p_0': 1,
'n_1_p_1': 2,
'n_1_p_2': 3,
'n_1_q_r_s': 100,
'n_2': 3,
'n_3_0': 1,
'n_3_1': 2,
'n_3_2': 3,
'n_4': 5}

对于'n': ['a', 'b', 'c']这种形式的数据,我们把它转换为: {'n_0': 'a', 'n_1': 'b', 'n_2': 'c'}

我们原来的核心代码是这样的:

1
2
3
4
5
6
7
8
def flat(x):
for key, value in x.items():
if isinstance(value, dict):
for k, v in flat(value):
k = f'{key}_{k}'
yield (k, v)
else:
yield (key, value)

你的第一反应,是不是这样修改代码:

1
2
3
4
5
6
7
8
9
10
def flat(x):
for key, value in x.items():
if isinstance(value, dict):
for k, v in flat(value):
k = f'{key}_{k}'
yield (k, v)
elif isinstance(value, list):
"一大堆处理列表的代码"
else:
yield (key, value)

如果你使用return和递归,你可能确实需要这样写。

但如果你使用yield关键字,那么,你虽然也要修改代码,可是修改的地方却不是这里。我们要修改的地方在for key, value in x.items()

因为.items()这个方法是字典的方法,列表没有这个方法。所以我们需要写一个通用的迭代生成器,支持字典和列表,所以我们增加一个函数:iter_x:

1
2
3
4
5
6
7
def iter_x(x):
if isinstance(x, dict):
for key, value in x.items():
yield (key, value)
elif isinstance(x, list):
for index, value in enumerate(x):
yield (index, value)

现在,我们在原来的代码中调用这段个新的生成器函数:

1
2
3
4
5
6
7
8
def flat(x):
for key, value in iter_x(x):
if isinstance(value, (dict, list)):
for k, v in flat(value):
k = f'{key}_{k}'
yield (k, v)
else:
yield (key, value)

其中,isinstance(value, (dict, list)),相当于isinstance(value, dict) or isinstance(value, list)

我们来看一下运行效果:

掌握yield关键字,你的编程思路和想问题的方式会发生一个重大的转变。