像这样,但我想把它弄得漂亮、干净和平行:
import collections
dataset_dict = collections.defaultdict(int)
for img, group_id in dataset:
dataset_dict[classes[group_id]] += 1
print(dataset_dict)
我发现的最好的是python3中的Ray库,但是API的级别非常低,无法与其他现代语言媲美。随着Python中lambdas和PyTorch/Keras机器学习的蓬勃发展,以及java8以来Typescript和彻底检修的进步,我真的需要在python3中使用类似的东西。
你能为上面的代码提供一些简单的例子吗?我和雷试过了,这似乎是最简单的。但问题是在共享变量中写入增量。也许您知道python3有一个更好、更现代的API。
预期的行为是,50000个元素将按CPU的数量进行拆分。每个线程将汇总组计数,然后将结果合并为最终结果。我想在这个例子中它可能只是一个简单的Fork-Join池。我想要一个完美干净的代码,易于阅读。所以你只要读了代码,你就会得到“啊哈”的瞬间,就好像它很简单,但也很聪明,因为美就在简单中。