
《AIGC面试宝典》「阶梯地图」
一、引言
当 Transformer 架构像一把钥匙打开深度学习的新大门,大语言模型(LLM)已从实验室走向产业落地。但对多数人而言,从基础概念到架构选型的学习之路,常像在参数森林里迷路 —— 哪些是必须掌握的核心原理?不同模型架构的取舍背后藏着怎样的逻辑?
本文章将为不同类型算法工程师(大模型算法工程师、 多模态算法工程师)搭建了一条由浅入深的学习路径。
二、【大模型算法工程师】「阶梯地图」
【大模型算法工程师】「阶梯地图」——入门篇
对于初级【大模型算法工程师】而言,入门大模型时常会遇到困惑:基础概念繁杂,专业资料要么过于简略,要么充斥着密集的技术术语,理解起来并不容易。
【大模型算法工程师】「阶梯地图」——入门级恰好能解决这些问题。它聚焦大模型的核心基础,系统讲解了大的学习机制、推理加速、预训练与微调的区别等关键内容,引导 初级【大模型算法工程师】入门大模型:
- 先看《第一层 大模型实战》,把不同大模型的学习过程、实战工作拆解得很清楚,能够帮你本地快速搭建一个大模型应用;
- 再读第二篇《大模型推理加速篇》,当你完成《第一层 大模型实战》课程之后,你一定会有一个思考,是否能够搭建一个大模型服务,这一篇将带你入门如何使用 Ollama、vLLM、TensorRT-LLM、Megatron-LM 部署一个大模型服务,并给客户端提供比较好的服务;
- 再读第三篇《如果从零到一训练一个自定义大模型?》,虽然前面教会你部署一个大模型服务,但是如何从零到一训练一个自定义大模型?,本篇将从大模型继续预训练->如何构建训练数据->如何使用 大模型训练框架(ms-swift、LLaMA-Factory )训练一个大模型;
如何完成了以上学习任务,那么恭喜你,你已经突破大模型算法工程师的第一道坎了!!!
【大模型算法工程师】「阶梯地图」——进阶篇
虽然上一章你知道如何搭建一个大模型服务和如何从零开始训练一个大模型,但是这些对于一个合格的【大模型算法工程师】是完全不够的,因为 你还需要利用 这些技能去完成一些复杂的 大模型任务。
在大模型的技术栈里,如何利用大模型完成一些关键任务至关重要。
这篇文章聚焦大模型的多种应用:
- Ai Agent入门学习——Ai Agent千机变
- AiGC摩天大楼 —— 第三层 Text-to-SQL 篇
- AiGC摩天大楼 —— 第三层 Text-to-SQL 篇 之 SQLCoder 篇
- AiGC摩天大楼 —— 第三层 LLM 对齐角色扮演
- AiGC摩天大楼 —— 第三层 PPT自动生成实战 之 用大模型实现PPT可视化几种思路
- AiGC摩天大楼 —— 第三层 PPT自动生成实战 之 Auto_PPT 自动生成你的PPT
- 第三层 PPT自动生成实战之PPTAgent:PPT自动生成Agent框架
- AiGC摩天大楼 —— 第三层 LLM 会议纪要总结
- AiGC摩天大楼 —— 第三层 长文本摘要生成:预训练模型与分治策略如何协同应用
【大模型算法工程师】「阶梯地图」——高级篇 —— DeepSeek
虽然上一章你知道如何搭建一个大模型服务和如何从零开始训练一个大模型,并利用 大模型 完成一些复杂任务(RAG、Agent、Text-to-SQL 等)。
但是 2025年,国产 DeepSeek 席卷而来,将 DeepSeek 开发 概念变成家喻户晓的大模型 和 面试必会必考题,本章我们将带你学习该内容。
AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——DeepSeek R1初体验 :fire:
AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——如何使用 Ollama 在本地运行 DeepSeek R1? :fire:
AiGC摩天大楼 —— DeepSeek R1系列——如何使用 Ollama和DeepSeek R1搭建RAG系统? :fire:
- 介绍: 如何 QWen2.5 基础模型 GRPO 训练 复现Deepseek-R1。
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——QWen2.5 基础模型 GRPO 训练 复现Deepseek-R1 :fire:
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——KTransformers 实战篇—单卡RTX4090部署R1满血版 :fire:
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:Logic-RL :fire:
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:TinyZero :fire:
- AiGC摩天大楼 —— DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:Open R1 :fire:
- 第一层 LLMs之DeepSeek-R1 复现:使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1 :fire:
- 如何使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1 代码讲解 :fire:
DeepSeek-R1 复现——蒸馏篇 :fire:
- 如何使用 蒸馏 DeepSeek-R1-Distill-Qwen-14B(一)
- 如何使用蒸馏 DeepSeek-R1-Distill-Qwen-14B (二)
- 如何利用 swift 蒸馏 中文DeepSeek-R1 小模型
【大模型算法工程师】「阶梯地图」——高级篇 —— MCP
MCP 实战篇
MCP 面试常考题
- MCP 模型上下文协议(Model Context Protocol) 常考题篇
- MCP、API 与 Function Call 傻傻分不清篇
【大模型算法工程师】「阶梯地图」——面试篇
虽然上一章你知道如何搭建一个大模型服务和如何从零开始训练一个大模型,并利用 大模型 完成一些复杂任务(RAG、Agent、Text-to-SQL 等),也知道 DeepSeek 训练开发。
但是我们在面试的时候,需要怎么去准备呢?
-
《LLMs 千面郎君(更新版)》 采用 优先级方式,将最
《大模型面试宝典》欢迎你的加入
《大模型面试宝典》星球主要是作者的一些学习成果和资料分享。
2025年
deepseek r1 实战帖
ms-swift 学习帖
2024年
2023年
NLP实践教程 —NLP菜鸟逆袭
LLMs实践教程—LLMs九层妖塔
LLMs面经— LLMs千面郎君
NLP面经— NLP面无不过
推荐系统入门—推荐系统入门
推荐系统面经—推荐系统百面百搭
星球非免费。定价299元/年,0.8元/天。(每+100人,+20元。元老福利~)
可以添加小编(yzyykm666)领取 66 元优惠券,学生最高可领取100元优惠券!!!
欢迎你的加入!
《AIGC面试宝典》有哪些干货?
Deepseek 面经—Deepseek千面郎君:目前网上所能搜到的Deepseek面经都是这个全网第一个最全Deepseek面经
目前网上所能搜到的Deepseek
面经都是这个
LLMs面经—LLMs千面郎君:目前网上所能搜到的大模型面经都是这个
全网第一个最全大模型面经
目前网上所能搜到的大模型面经都是这个
AiGC 实践教程 —AiGC摩天大楼
梳理了 AiGC 所有实战任务(大语言模型实战、多模态实战、动作迁移实战等项目)
Agent实战教程— Agent千机变
梳理了 Agent 理论入门和实战
RAG实战教程— RAG潘多拉宝盒
梳理了 RAG 理论入门和实战
LLMs实践教程—LLMs九层妖塔
全网第一个大模型实战教程
NLP实践教程 —NLP菜鸟逆袭
梳理 NLP基础任务(文本分类、命名实体识别、关系抽取、事件抽取、文本摘要文本生成、Prompt)和 LLMs 大模型等开源项目,争取做成一个全网最全NLP小白入门教程!
NLP面经— NLP面无不过
本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含 自然语言处理各领域的 面试题积累
推荐系统面经—推荐系统百面百搭
梳理推荐系统面经
大模型训练系列
大模型训练教程
大模型推理加速教程
大模型推理加速教程
其他