社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

【AI应用板块午后走强主力资金抢筹这些AIGC概念股(名单)】-20251121154525

Gemini 3、chatGPT、Grok、Claud等AI工具一网打尽！

Docker 拉取镜像超时？别再瞎抄配置了！亲测 3 个有效镜像源 + 避坑指南

机器学习学术速递[11.21]

机器学习学术速递[11.20]

苹果Android首次实现跨平台互通/华为发布重磅AI技术/ChatGPT群聊功能正式上线

香港科技大学（广州）JPCL | 通过数据驱动的机器学习策略识别热电电解质的高性能溶剂

20.1/Q1，西安交大一附院“深度学习+多组学”碾压传统Cox！AML预后评估的生信范式革命来了？

Nginx 配置实战：从摸鱼到部署，手把手教你搞定生产级配置

新挖掘了 3 个牛哄哄的 GitHub 项目，有点意思啊。

关注

Py学习 » 机器学习算法

在Meta的机器学习工程师面试中，遇到“为什么用LoRA微调，不-20251125145425

爱可可-爱生活 • 2 天前 • 16 次点击

2025-11-25 14:54
本条微博链接

在Meta的机器学习工程师面试中，遇到“为什么用LoRA微调，不能直接更新全部权重？”这个问题，别只答“为了节省内存”，那太浅了。真正原因是“灾难性参数爆炸”问题。

微调Llama 70B模型需要更新700亿参数，梯度和优化器状态加起来约560GB显存，普通GPU根本撑不了。LoRA只需不到10GB，内存压力立刻缩 ...

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/189620

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)