我根本没有使用Python中的线程,并且认为这个问题是一个完全陌生的问题.
我想知道defaultdict
是否是线程安全的.让我来解释一下:
我有
d = defaultdict(list)
默认情况下会创建缺失键列表.假设我有多个线程同时开始执行此操作:
d['key'].append('value')
最后,我应该以[‘value’,’value’]结束.但是,如果defaultdict不是线程安全的,如果线程1在检查dict中的’key’之后和d [‘key’] = default_factory()之前产生线程2,它将导致交错,而另一个线程将在d [‘key’]中创建列表并附加’value’.
然后当线程1再次执行时,它将从d [‘key’] = default_factory()继续,这将破坏现有的列表和值,我们将以[‘key’]结束.
我看了CPython source code for defaultdict.但是,我找不到任何锁或互斥锁.我想只要记录在案,它就不是线程安全的.
有些人昨晚在IRC上表示Python上有GIL,所以它在概念上是线程安全的.有人说线程不应该在Python中完成.我很困惑.想法?
解决方法:
在这种特定情况下,它是线程安全的.
要知道在Python切换线程时理解为什么很重要. CPython只允许在Python字节码步骤之间切换线程.这就是GIL的用武之地;每N字节代码指令释放一次锁,并且可以进行线程切换.
d [‘key’]代码由一个字节码(BINARY_SUBSCR)处理,该字节码触发在字典上调用的.__ getitem __()方法.
一个defaultdict,配置了list作为默认值工厂,并使用字符串值作为键,完全在C中处理dict .__ getitem __()方法,并且GIL永远不会被解锁,使得dict [key]查找线程安全.
注意那里的资格;如果你使用不同的默认值工厂创建一个defaultdict实例,一个使用Python代码(例如lambda:[1,2,3]),所有的注意都被关闭,因为这意味着C代码回调到Python代码和在执行lambda函数的字节码时,可以再次释放GIL.这同样适用于键,当使用在Python代码中实现__hash__或__eq__的对象时,可以在那里进行线程切换.接下来,如果工厂是用明确释放GIL的C代码编写的,则可以进行线程切换,并且线程安全性不在窗口内.