社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

《AIGC面试宝典》「阶梯地图」

关于NLP那些你不知道的事 • 1 月前 • 47 次点击  

《AIGC面试宝典》「阶梯地图」

一、引言

当 Transformer 架构像一把钥匙打开深度学习的新大门,大语言模型(LLM)已从实验室走向产业落地。但对多数人而言,从基础概念到架构选型的学习之路,常像在参数森林里迷路 —— 哪些是必须掌握的核心原理?不同模型架构的取舍背后藏着怎样的逻辑?

本文章将为不同类型算法工程师(大模型算法工程师、 多模态算法工程师)搭建了一条由浅入深的学习路径。


二、【大模型算法工程师】「阶梯地图」

【大模型算法工程师】「阶梯地图」——入门篇

对于初级【大模型算法工程师】而言,入门大模型时常会遇到困惑:基础概念繁杂,专业资料要么过于简略,要么充斥着密集的技术术语,理解起来并不容易。

【大模型算法工程师】「阶梯地图」——入门级恰好能解决这些问题。它聚焦大模型的核心基础,系统讲解了大的学习机制、推理加速、预训练与微调的区别等关键内容,引导 初级【大模型算法工程师】入门大模型:

  1. 先看《第一层 大模型实战》,把不同大模型的学习过程、实战工作拆解得很清楚,能够帮你本地快速搭建一个大模型应用;
  2. 再读第二篇《大模型推理加速篇》,当你完成《第一层 大模型实战》课程之后,你一定会有一个思考,是否能够搭建一个大模型服务,这一篇将带你入门如何使用 Ollama、vLLM、TensorRT-LLM、Megatron-LM 部署一个大模型服务,并给客户端提供比较好的服务;
  3. 再读第三篇《如果从零到一训练一个自定义大模型?》,虽然前面教会你部署一个大模型服务,但是如何从零到一训练一个自定义大模型?,本篇将从大模型继续预训练->如何构建训练数据->如何使用 大模型训练框架(ms-swift、LLaMA-Factory )训练一个大模型;

如何完成了以上学习任务,那么恭喜你,你已经突破大模型算法工程师的第一道坎了!!!

【大模型算法工程师】「阶梯地图」——进阶篇

虽然上一章你知道如何搭建一个大模型服务和如何从零开始训练一个大模型,但是这些对于一个合格的【大模型算法工程师】是完全不够的,因为 你还需要利用 这些技能去完成一些复杂的 大模型任务。

在大模型的技术栈里,如何利用大模型完成一些关键任务至关重要。

这篇文章聚焦大模型的多种应用:

  • RAG 应用搭建
  • Agent 应用搭建
    • Ai Agent入门学习——Ai Agent千机变
  • Text-to-SQL
    • AiGC摩天大楼 —— 第三层 Text-to-SQL 篇
    • AiGC摩天大楼 —— 第三层 Text-to-SQL 篇 之 SQLCoder 篇
  • LLM 对齐角色扮演
    • AiGC摩天大楼 —— 第三层 LLM 对齐角色扮演
  • PPT自动生成实战
    • AiGC摩天大楼 —— 第三层 PPT自动生成实战 之 用大模型实现PPT可视化几种思路
    • AiGC摩天大楼 —— 第三层 PPT自动生成实战 之 Auto_PPT 自动生成你的PPT
    • 第三层 PPT自动生成实战之PPTAgent:PPT自动生成Agent框架
  • 会议纪要总结
    • AiGC摩天大楼 —— 第三层 LLM 会议纪要总结
    • AiGC摩天大楼 —— 第三层 长文本摘要生成:预训练模型与分治策略如何协同应用

【大模型算法工程师】「阶梯地图」——高级篇 —— DeepSeek

虽然上一章你知道如何搭建一个大模型服务和如何从零开始训练一个大模型,并利用 大模型 完成一些复杂任务(RAG、Agent、Text-to-SQL 等)。

但是 2025年,国产 DeepSeek 席卷而来,将 DeepSeek 开发 概念变成家喻户晓的大模型 和 面试必会必考题,本章我们将带你学习该内容。

  • AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——DeepSeek R1初体验 :fire:

  • AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——如何使用 Ollama 在本地运行 DeepSeek R1? :fire:

  • AiGC摩天大楼 —— DeepSeek R1系列——如何使用 Ollama和DeepSeek R1搭建RAG系统?  :fire:

  • DeepSeek-R1 复现 :fire:

    • 介绍:单卡RTX4090部署R1满血版
    • 介绍: 如何 QWen2.5 基础模型 GRPO 训练 复现Deepseek-R1。
    • AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——QWen2.5 基础模型 GRPO 训练 复现Deepseek-R1 :fire:
    • AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——KTransformers 实战篇—单卡RTX4090部署R1满血版 :fire:
    • AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:Logic-RL :fire:
    • AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:TinyZero :fire:
    • AiGC摩天大楼 —— DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:Open R1 :fire:
    • 第一层 LLMs之DeepSeek-R1 复现:使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1 :fire:
    • 如何使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1 代码讲解 :fire:
  • DeepSeek-R1 复现——蒸馏篇 :fire:

    • 如何使用 蒸馏 DeepSeek-R1-Distill-Qwen-14B(一)
    • 如何使用蒸馏 DeepSeek-R1-Distill-Qwen-14B (二)
    • 如何利用 swift 蒸馏 中文DeepSeek-R1 小模型

【大模型算法工程师】「阶梯地图」——高级篇 —— MCP

MCP 实战篇

  • 手把手教 MCP 实现
  • 8种主流Agent框架如何使用MCP

MCP 面试常考题

  • Function Call 面试常考题篇
  • MCP 模型上下文协议(Model Context Protocol) 常考题篇
  • 8种主流Agent框架如何使用MCP
  • MCP、API 与 Function Call 傻傻分不清篇

【大模型算法工程师】「阶梯地图」——面试篇

虽然上一章你知道如何搭建一个大模型服务和如何从零开始训练一个大模型,并利用 大模型 完成一些复杂任务(RAG、Agent、Text-to-SQL 等),也知道 DeepSeek 训练开发。

但是我们在面试的时候,需要怎么去准备呢?

  • LLMs 千面郎君(更新版)
    • 《LLMs 千面郎君(更新版)》 采用 优先级方式,将最

《大模型面试宝典》欢迎你的加入

《大模型面试宝典 星球主要是作者的一些学习成果和资料分享。


  • 2025年

    • Stable Diffusion 面经

    • deepseek r1 面试宝典

    • deepseek r1 实战帖

    • ms-swift 学习

  • 2024年

    • 十月 AIGC面经 (准备发稿)

    • 八-九月 AiGC 实践教程 —AiGC摩天大楼(争取把所有AiGC任务都刷一遍)

    • 七月 大模型推理加速教程

    • 六月 Agent实战教程— Agent千机变

    • 六月 大模型训练系列

    • 五月 RAG实战教程— RAG潘多拉宝盒

    • 四月 AiGC实战训练营—非一般程序猿


  • 2023年

    • NLP实践教程 —NLP菜鸟逆袭

    • LLMs实践教程—LLMs九层妖塔

    • LLMs面经— LLMs千面郎君

    • NLP面经— NLP面无不过

    • 推荐系统入门—推荐系统入门

    • 推荐系统面经—推荐系统百面百搭

图片


星球非免费。定价299元/年,0.8元/天。(每+100人,+20元。元老福利~)

可以添加小编(yzyykm666)领取 66 元优惠券,学生最高可领取100元优惠券!!!

  • 一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;

  • 二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。

欢迎你的加入!

图片

《AIGC面试宝典》有哪些干货?

Deepseek 面经—Deepseek千面郎君:目前网上所能搜到的Deepseek面经都是这个

全网第一个最全Deepseek面经

目前网上所能搜到的Deepseek面经都是这个

图片


LLMs面经—LLMs千面郎君:目前网上所能搜到的大模型面经都是这个

全网第一个最全大模型面经

目前网上所能搜到的大模型面经都是这个

图片

AiGC 实践教程 —AiGC摩天大楼

梳理了 AiGC 所有实战任务(大语言模型实战、多模态实战、动作迁移实战等项目)

图片

Agent实战教程— Agent千机变

梳理了 Agent 理论入门和实战

图片


RAG实战教程— RAG潘多拉宝盒

梳理了 RAG 理论入门和实战

图片

LLMs实践教程—LLMs九层妖塔

全网第一个大模型实战教程

图片


NLP实践教程 —NLP菜鸟逆袭

梳理 NLP基础任务(文本分类、命名实体识别、关系抽取、事件抽取、文本摘要文本生成、Prompt)和 LLMs 大模型等开源项目,争取做成一个全网最全NLP小白入门教程!

图片


NLP面经— NLP面无不过

本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含 自然语言处理各领域的 面试题积累

图片


推荐系统面经—推荐系统百面百搭

梳理推荐系统面经

图片


大模型训练系列

大模型训练教程

图片


大模型推理加速教程

大模型推理加速教程

图片


其他


图片


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/185887
 
47 次点击