社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

Python 3.14

ChatGPT突发全球性宕机事故，或由前端系统异常导致；抖音安全中心公告:严厉打击AI滥用等欺诈行为...

AI日报：苹果明年推出Siri AI搜索；ChatGPT Projects功能全面放开；月之暗面内测...

里面有个细节很逗，辛顿的前任让 ChatGPT 解释辛顿的行为有-20250907022529

内容标识（AIGC标识）资料汇总

重大福利！OpenAI免费开放ChatGPT Projects，3大功能太香了

外网疯传的 Nano Banana 提示词大合集，在 GitHub 上开源了。

迄今最大供应链入侵事件：GhostAction攻击窃取GitHub中3325个机密凭证

Ollama Proxy 利用 Docker 化的 Nginx -20250907142613

第四家巨头入局！ChatGPT芯片首次曝光

关注

Py学习 » 机器学习算法

机器学习在蒸馏中能否撬动“质”的突破？查看图片 //@爱可可-20250301064233

爱可可-爱生活 • 6 月前 • 107 次点击

2025-03-01 06:42
本条微博链接

机器学习在蒸馏中能否撬动“质”的突破？

查看图片 //@爱可可-爱生活:本文提出了一种创新的奖励蒸馏知识蒸馏框架，通过自监督生成伪奖励并结合强化学习，使小型语言模型不仅学习大型教师模型的数据，更学习其隐含的质量评估标准，最终实现了学生模型超越教师模型的反直觉结果，为高效训练高性能小型语言模型开辟了新路径。

[CL]《Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?》Y Zhang, L Wang, M Fang, Y Du... [Eindhoven University of Technology & Microsoft & University of Liverpool] (2025)

网页链接 #机器学习##人工智能##论文##AI创造营#

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/179589

107 次点击

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

机器学习在蒸馏中能否撬动“质”的突破？ 查看图片 //@爱可可-20250301064233

机器学习在蒸馏中能否撬动“质”的突破？查看图片 //@爱可可-20250301064233