社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【AI加油站】第二十八部:大模型炼丹大师必备《深度学习调优指南中文版-系统性优化模型》(附下载)

人工智能产业链union • 6 天前 • 22 次点击  
图片
本书介绍

《深度学习调优指南中文版-系统性优化模型》是一本由Varun Godbole、George E. Dahl、Justin Gilmer、Christopher J. Shallue和Zachary Nado共同撰写的深度学习调参手册,旨在帮助工程师和研究人员系统地优化深度学习模型的性能。该手册由Google和Google Brain团队支持,版本1.0于2022年4月9日发布,由Jay Ning等人翻译成中文。手册内容丰富,涵盖了从项目启动到模型调优的各个阶段,提供了实用的建议和策略。

第1章:开始新项目的指南

  • 选择模型架构:建议从成熟的模型架构开始,逐步调整以适应特定问题。

  • 选择优化器:推荐从常用的优化器(如SGD、Adam)开始,并注意优化器的超参数调整。

  • 选择Batch Size:Batch Size对训练时间和资源消耗有重要影响。建议选择硬件支持的最大Batch Size,并注意其对超参数调整的敏感性。

  • 选择初始配置:初始配置应简单、快速且资源消耗低,以获得“合理”的结果。

第2章:提高模型性能的科学方法

  • 增量调整策略:从简单配置开始,逐步添加功能并进行改进。

  • 探索与利用:大部分时间用于探索,以深入理解问题,少部分时间用于利用以提升性能。

  • 选择实验目标:每轮实验应有明确目标,范围要小,以便取得实质性进展。

  • 设计实验 :根据目标将超参数分为目标超参数、冗余超参数和固定超参数,创建研究以比较不同配置。

  • 从实验结果中获取经验:检查训练曲线、搜索空间边界、采样点数量等,以确保实验结果的有效性。

第3章:确定每次训练运行的步数

  • 受计算限制与不受计算限制的训练:根据资源限制选择合适的训练时长。

  • 使用学习率搜索算法:通过学习率搜索确定初始训练步数。

  • 调整训练步数:根据训练过程中的表现逐步调整训练步数。

第4章:关于训练管道的额外补充

  • 优化输入管道:使用性能分析工具诊断并优化输入管道。

  • 评估模型性能:建议使用较大的Batch Size进行评估,并在固定步长间隔进行评估。

  • 保存检查点并追溯选择最佳检查点:通过回顾性选择最佳检查点来优化模型性能。

  • 设置实验跟踪:记录实验结果,便于分析和比较。

  • BatchNorm的实现细节:讨论了BatchNorm在多设备设置中的实现问题。

  • 多主机管道的注意事项:在多主机训练中注意日志记录、评估、随机数生成器、检查点和数据分片等问题。

第5章:常见问题的回答

  • 学习率衰减方案:讨论了学习率衰减方案的选择和调整。

  • Adam的超参数调整:提供了Adam优化器超参数调整的建议。

  • 优化算法的选择:解释了为什么在探索阶段使用Quasi-Random-Search而不是更复杂的黑盒优化算法。

  • 调试和缓解优化失败:提供了识别和解决训练不稳定性的方法,如学习率预热和梯度截断。

本书免费下载地址


    关注微信公众号“人工智能产业链union”回复关键字“AI加油站28”获取下载地址。

往期推荐:
【AI加油站】第一部:《大型语言模型应用检索增强生成:改变搜索、推荐和 AI 助手》附下载
【AI加油站】第二部:《程序员的自我修炼手册》(附下载)
【AI加油站】第三部:《大规模语言模型:从理论到实践》(附下载)
【AI加油站】第四部:《使用生成式人工智能和Python开始数据分析》(附下载)
【AI加油站】第五部:《使用生成式人工智能和Python开始数据分析》(附下载)
【AI加油站】第六部:《时间序列:建模、计算与推断》(附下载)
【AI加油站】第七部:《因果关系的逻辑理论的好书-A Logical Theory of Causality》(附下载)

【AI加油站】第八部:《模式识别(第四版)-模式识别与机器学习》(附下载)

【AI加油站】第九部:《Python深度学习(中文版)》(附下载)
【AI加油站】第十部:《机器学习方法》(附下载)
【AI加油站】第十一部:《深度学习》(附下载)
【AI加油站】第十二部:《从零开始的机器学习》(附下载)
【AI加油站】第十三部:《Transformer入门到精通》(附下载)
【AI加油站】第十四部:《LLM 应用开发实践笔记》(附下载)
【AI加油站】第十五部:《大模型基础 完整版》(附下载)
【AI加油站】第十六部:《从头训练大模型最佳实践》(附下载)
【AI加油站】第十七部:《大语言模型》(附下载)
【AI加油站】第十八部:《深度强化学习》(附下载)
【AI加油站】第十九部:清华大学《大模型技术》(附下载)
【AI加油站】第二十部:Prompt入门神书-《Prompt 学习指南》(附下载)
【AI加油站】第二十一部:吴恩达&open AI联合推出《大模型通关指南》(附下载)
【AI加油站】第二十二部:《李宏毅深度学习教程》值得反复阅读的神书!(附下载)
【AI加油站】第二十三部:Prompt经典中文教程-《提示工程指南》(附下载)
【AI加油站】第二十四部:爆火下载28万次!MIT最新神书《理解深度学习》(附下载)
【AI加油站】第二十五部:LLM4大名著,OpenAI专家强推《深度解析:大语言模型理论与实践》(附下载)

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184186
 
22 次点击