社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

【深度学习】目标检测的常用数据处理方法！

【Nucleic Acids Research】利用生成式深度学习模型设计蓝藻细菌的合成启动子

本周推荐的6个火火火的Github开源项目！

GitHub(微博搜索)-20240416-1

融合ChatGPT+DALL·E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

【生物催化】一种实用的机器学习辅助蛋白质工程研究范式

【东方金工·上海线下沙龙】深度学习与量化投资

GitHub(微博搜索)-20240414-1

ChatGPT Plus等用户，可使用最新GPT-4 Turbo模型

【一个机器学习知识库，涵盖了从基础到高级主题的机器学习知识，包括-20240413124243

私信 • 关注

delica

delica 最近创建的主题

» delica 创建的更多主题

delica 最近回复了

4 年前

回复了 delica 创建的主题 » 如何销毁Python对象并释放内存

您的问题是,您正在使用应该使用多处理的线程(CPU绑定与IO绑定)。

我会像这样重构你的代码:

from multiprocessing import Pool

if __name__ == '__main__':
    cpus = multiprocessing.cpu_count()        
    with Pool(cpus-1) as p:
        p.map(get_image_features, file_list_1)

get_image_features 把这两行加在它的末尾。我不知道你到底是如何处理这些图像的,但我的想法是在每个进程中处理每个图像,然后立即将其保存到磁盘:

df = pd.DataFrame({'filename':list_a,'image_features':list_b})
df.to_pickle("PATH_TO_FILE"+str(count)+".pickle")

因此,数据帧将被pickle并保存在每个进程中,而不是在它退出之后。进程一旦退出就会从内存中清除,因此这应该可以保持低内存占用率。

4 年前

回复了 delica 创建的主题 » 用Python固定复制警告(复制)

有些人可能只想抑制警告:

class SupressSettingWithCopyWarning:
    def __enter__(self):
        pd.options.mode.chained_assignment = None

    def __exit__(self, *args):
        pd.options.mode.chained_assignment = 'warn'

with SupressSettingWithCopyWarning():
    #code that produces warning

» delica 创建的更多回复

关于移动版 · 三行代码 · 今天看啥 · Code · link之家 · 卧龙搜索 · 藏经阁 · 小百科

Py学习 - 专注于Python技术发展的社区(原Django社区)