3W+星霸榜GitHub！Datawhale爆款Happy-LLM出版啦！

专注AIGC技术的专业社区，关注大语言模型（LLM）的发展和应用落地，聚焦LLM及AI技术的市场研究和开发者生态，欢迎关注！

3W+GitHub星标，多次登上GitHub Trending热榜，数万开发者自发推荐，Datawhale年度王牌Happy-LLM教程《Happy-LLM：从零开始构建大模型》（杨桃书）正式面世！

自2022年底ChatGPT引爆全球大语言模型（LLM）热潮，从“百模大战”到“智能体元年”，LLM迅速成为数字社会的基础设施。然而，对大多数学习者而言，大模型仍是“黑箱”：原理难懂、训练复杂、落地无门。

为此，国内知名AI开源社区Datawhale依托多年开源深耕经验，整合Self-LLM和LLM-Universe两大热门项目经验，编撰这本入门实战书籍。

早在开源阶段，Happy-LLM便一路刷新纪录。如今，这本经众多开发者验证的著作终于从屏幕走向纸面，获得“万人计划”教学名师殷建平、科大讯飞副总裁刘聪、国防科技大学计算机学院教授刘新旺、北京极智嘉联合创始人李洪波、南开大学卓越工程师学院执行院长程明明等专家联袂推荐。

▼点击下方，即可购书

Part.1

一本书是如何炼成的？

从开源教程到纸质书

《Happy-LLM》的诞生并非偶然，早在2023年底，Datawhale社区便先后推出了Self-LLM和LLM-Universe这两个开源大模型教程。

Self-LLM旨在为开发者提供一站式开源LLM部署、推理与微调指南；LLM-Universe则指导开发者从零开始搭建自己的LLM应用。这两个教程一经发布，便获得了国内外开发者的广泛认可，累计在GitHub上收获了数万星标。

然而，随着学习者群体不断扩大，社区收到了大量反馈：市场上缺少一本从零开始系统讲解LLM原理，同时引导学习者亲手搭建和训练LLM的完整教程。

看到这个缺口，Datawhale社区决定集结核心力量，编写一本兼顾理论深度与实战精度的教程。这便是《Happy-LLM》项目的起点——从NLP的基本研究方法出发，沿着LLM的思路与原理逐层深入，依次剖析架构基础和训练过程，并结合主流代码框架，手把手演练如何动手搭建和训练一个LLM。

正如书中所言：“希望读者能从本书开始走进LLM的浩瀚世界，探索LLM的无限可能。”

开源历程交出一份亮眼的成绩单

在正式成书之前，Happy-LLM开源项目已经走过了令人振奋的历程：

2025年6月1日，Happy-LLM正式开源，7日内Star破2000并发布完整PDF；

开源32天登顶GitHub Trending热榜，39天Star破万；

上线159天Star突破2万；

2025年12月电子书上线，次年1月学习人数破千......

这一系列里程碑数据，不仅证明了Happy-LLM的受欢迎程度，更反映了学习者对“从零构建”这一学习路径的迫切需求。

这本书的读者可能是学生，也可能是在职工程师，而Happy-LLM的作者正好对应这两种身份的需求：一位是大学教授，知道怎么把理论讲清楚；两位是从学生一路做到大厂和科研机构的技术人，知道学大模型的人最容易在哪里卡住。

朱信忠，工学博士，博士生导师，二级教授，浙江省特级专家，浙江师范大学杭州人工智能研究院院长。国家高层次人才，国家有突出贡献中青年专家，国家科技进步奖二等奖第一完成人，享受国务院政府特殊津贴。Datawhale首席科学家，Happy-LLM、Hello-Agents等开源项目总负责人及核心贡献者。主要研究方向为大模型、具身智能、世界模型、自主移动机器人及低空具身等。

宋志学，河南理工大学工学学士、测绘工程硕士，西湖大学通用人工智能实验室科研助理。Datawhale成员，Self-LLM、Happy-LLM等开源项目负责人，所负责项目数十次登上GitHub Trending榜单，累计获得GitHub星标5.5万余次。

邹雨衡，对外经济贸易大学数据科学与大数据技术学士、管理科学与工程硕士，小红书人工智能工程师。Datawhale成员，LLM-Cookbook、LLM-Universe等开源项目负责人，所负责项目数十次登上GitHub Trending榜单，累计获得GitHub星标7.6万余次。

书名中的“Happy”并非随意取名，而是寄托了作者们对学习大模型技术的核心愿景。这种“Happy”不是轻松的躺学，而是一种更深层次的快乐——攻克难题后的豁然开朗、构建应用时的得心应手、在 AI 浪潮中建立起自身确定性的从容与愉悦。

那么，这本书究竟靠什么让读者抵达“学得明白、用得顺畅”的Happy之境？答案藏在它的内容与结构编排中。

Part.2

不留死角的LLM全链路知识地图

全书分为基础知识与实战应用两大部分，共7章，形成了一条从NLP基础到大模型落地的完整学习路径。

第一部分：基础知识（第1～4章）

第1章简单介绍NLP的基本任务及文本表示的发展历程，为非NLP领域研究者提供参考；

第2章介绍LLM的基本架构Transformer，包括原理介绍及代码实现，是LLM最重要的理论基础；

第3章系统介绍经典的PLM架构，包括仅编码器（encoder-only）、编码器-解码器（encoder-decoder）和仅解码器（decoder-only）三种架构，同时介绍当前主流LLM的架构和思想；

第4章详细介绍LLM的特点、能力和整体训练过程。

第二部分：实战应用（第5～7章）

第5章带领读者基于PyTorch亲手搭建一个LLM，并实现预训练、有监督微调（Supervised Fine-Tuning，SFT）的全流程；

第6章引入目前业界主流的LLM训练框架Transformers，带领读者基于该框架快速、高效地实现LLM训练过程；

第7章介绍基于LLM的各种应用，包括LLM的评测、检索增强生成（Retrieval-Augmented Generation，RAG）、智能体的思想和简单实现等。

Part.3

三大特色助你学得明白、用得顺畅

本书之所以能让人“Happy”，源于它对学习体验的极致追求。

学得明白——理论全面、系统、通俗易懂

本书不是零散知识点的堆砌，而是一张精心设计的知识网络，每一个概念都从为什么需要它讲起，再解释它是什么，最后落实到怎么用。

例如，讲解多头注意力时，不仅给出数学公式，还通过图示和代码注释说明每一维度的含义。书中对LLM及NLP的核心思路进行了深入剖析，帮助读者建立“举一反三”的能力。

用得顺畅——真实案例、全部源码、代码解析

本书提供完整、可运行的Python脚本，每一段关键代码都配有逐行解析。从基于PyTorch亲手搭建大模型，到借助Transformers框架实现训练、微调，再到RAG和Agent的完整实现，读者可以一边看书一边敲代码，真正做到“所学即所用”。

教学友好——配套PPT与思维导图

本书随书提供教学PPT，知识点的拆分和重点、难点的视觉强调，都按照课堂授课的逻辑组织好了，教师开箱即用，不必再头疼如何制作PPT。此外，还提供全书思维导图，帮助读者随时回顾知识框架。

Part.4

从零开始，拥抱大模型的“Happy”之旅

大语言模型正在重塑各行各业，但前沿技术不应只是少数研究者的专属领地。每一个对AI充满热情的学习者，都有机会理解它的原理、亲手构建它的雏形，并将其应用于自己热爱的领域。

《Happy-LLM：从零开始构建大模型》正是为这样的你而写的。它不假设你有多么深厚的数学功底，也不要求你拥有昂贵的算力集群，只需要你有一颗愿意探索的心，以及一行一行敲下代码的耐心。

从NLP基础到Transformer，从LLaMA2的逐行实现到RAG与Agent的应用开发，这本书将带你复刻一线工程师的成长路径，让你在每一个“原来如此”的瞬间，收获真正的快乐！

向上滑动阅览

END

点击图片立即报名👇️