微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在python中将字典传递给具有可修改元素的进程

如何解决在python中将字典传递给具有可修改元素的进程

我正在尝试使用多处理库的 Process 模块线程化我的代码以获得更好的性能

代码的骨架是为它们工作的每个线程创建字典,完成后,将字典汇总并保存到文件中。 资源的创建方式如下:

histos = {}
for int i in range(number_of_threads):
    histos[i] = {}
    histos[i]['all'] =      ROOT.TH1F objects
    histos[i]['kinds_of'] = ROOT.TH1F objects
    histos[i]['keys'] =     ROOT.TH1F objects

然后在进程中,每个线程使用自己的 histos[thread_number] 对象,处理包含的 ROOT.TH1Fs。 但是,我的问题显然是,如果我像这样使用 Process 启动线程:

proc = {}
for i in range(Nthreads):
    it0 = 0 + i * n_entries / Nthreads  # just dividing up the workload
    it1 = 0 + (i+1) * n_entries / Nthreads 
    proc[i] = Process(target=RecoAndRecoFix,args=(i,it0,it1,ch,histos)) 
    # args: i is the thread id (index),it0 and it1 are indices for the workload,# ch is a variable that is read-only,and histos is what we defined before,# and the contained TH1Fs are what the threads put their output into.
    # The RecoAndFix function works inside with histos[i],thus only accessing
    # the ROOT.TH1F objects that are unique to it. Each thread works with its own histos[i] object.
    proc[i].start()

然后线程确实可以访问它们的 histos[i] 对象,但不能写入它们。 准确地说,当我在 TH1F 直方图上调用 Fill() 时,没有填充数据,因为它无法写入对象,因为它们不是共享变量

所以这里:https://docs.python.org/3/library/multiprocessing.html 我发现我应该使用 multiprocessing.Array() 来创建一个可由线程读取和写入的数组,如下所示:

typecoder = {}
histos = Array(typecoder,number_of_threads)
for int i in range(number_of_threads):
    histos[i] = {}
    histos[i]['all'] =      ROOT.TH1F objects
    histos[i]['kinds_of'] = ROOT.TH1F objects
    histos[i]['keys'] =     ROOT.TH1F objects

但是,它不会接受字典作为类型。它不起作用,它说 TypeError: unhashable type: 'dict'

那么解决这个问题的最佳方法是什么? 我需要的是将存储在字典中的每个“各种键”的实例传递给每个线程,以便它们独立工作。并且他们必须能够写入这些接收到的资源。

感谢您的帮助,如果我忽略了一些琐碎的事情,我很抱歉,我之前做过线程代码,但还没有使用 python。

解决方法

缺少的部分是区别是“过程”和“线程”之间;您可以在帖子中混合使用它们,但您的方法仅适用于线程,不适用于进程。

线程都共享内存;它们都将引用同一个字典,因此可以使用它来相互交流以及与父母交流。

进程有独立的内存;每个人都会得到自己的字典副本。如果他们想交流,他们必须通过其他方式交流(例如,使用multiprocessing.Queue)。另一方面,这意味着他们获得了分离的安全。

Python 中的另一个复杂问题是“GIL”;线程将主要串行共享相同的 Python 解释器,仅在执行 I/O、访问网络或使用一些为其提供特殊规定的库(numpy、图像处理等)时并行运行。同时,进程获得完全并行。

,

Python 多处理模块有一个管理器类,它提供可以跨线程和进程共享的字典。

请参阅文档以获取示例:https://docs.python.org/3/library/multiprocessing.html#sharing-state-between-processes

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?