DevSpace
技术🏗️ 架构设计2026-05-26·2 分钟阅读

嵌入式工程师的大模型学习路线图

6个月系统学习计划,从嵌入式工程师视角理解大模型,附带知识地图和学习节奏建议。

AI嵌入式学习路线大模型

嵌入式工程师的大模型学习路线图

你懂C语言、懂硬件、懂实时系统、懂性能优化——这些是你的超级能力。
大模型的世界需要新的知识,但底层思维是相通的。
本路线图帮你从嵌入式工程师的视角,系统性理解大模型。


一、认知转变:从确定性到概率性

你的日常思维

C代码:
  if (sensor_value > THRESHOLD) {
      LED_ON();
  }
// 确定性:同样的输入,同样的输出

大模型的思维

模型推理:
  输入: "今天天气"
  输出: "很好" (概率0.3) / "不错" (概率0.25) / "晴朗" (概率0.2) ...
// 概率性:同样的输入,不同的输出(取决于温度参数)

关键理解:大模型不是"程序",是"概率分布"。它不"计算"答案,它"采样"答案。


二、学习路线图(6个月计划)

第1个月:建立直觉

目标:能向同事解释"大模型是什么、怎么工作的"

学习内容

  • 吴恩达 AI for Everyone(6小时)
  • 3Blue1Brown 神经网络系列(1小时)
  • 鱼书《深度学习入门》第1-4章

产出

  • 用一页纸画出"从输入到输出的大模型数据流"
  • 能解释:训练 vs 推理、参数 vs 权重、loss vs accuracy

嵌入式视角的对应理解

深度学习概念 嵌入式对应概念
模型权重 Flash中存储的校准参数表
训练过程 产线上的自动标定程序
推理过程 MCU上的实时运行固件
Loss函数 标定时的误差度量
过拟合 标定参数只在这台设备上好用

第2-3个月:理解核心技术

目标:能看懂Transformer架构图,能解释注意力机制

学习内容

  • 鱼书 第5-7章(反向传播、学习技巧、CNN)
  • 李沐 动手学深度学习(重点:注意力机制和Transformer章节)
  • StatQuest Transformer系列
  • 李沐 论文精读:Attention Is All You Need

产出

  • 手绘Transformer架构图,标注每个组件的作用
  • 用C语言的思维解释Self-Attention的计算过程
  • 能回答面试问题:"Transformer和RNN的区别是什么?"

核心概念掌握

  1. Token:模型处理文本的基本单位(嵌入式类比:ADC采样点)
  2. Embedding:将离散token映射为连续向量(嵌入式类比:查表法)
  3. Self-Attention:序列内部各位置相互关注(嵌入式类比:全局中断优先级)
  4. Positional Encoding:注入位置信息(嵌入式类比:时间戳)
  5. Multi-Head:多组注意力并行计算(嵌入式类比:多通道DMA)
  6. KV Cache:推理时缓存避免重复计算(嵌入式类比:缓存命中优化)

第4个月:理解训练流程

目标:能描述"一个大模型是怎么被训练出来的"

学习内容

  • 《大模型从零开始构建》第2-5章
  • 赵鑫《大语言模型》第6-8章
  • Karpathy Let's build GPT(视频)

产出

  • 写出大模型训练的完整流程:数据收集->清洗->Tokenize->预训练->微调->对齐
  • 能解释:为什么需要那么多GPU?为什么训练要那么久?

训练流程的嵌入式类比

数据收集      ->  传感器数据采集
数据清洗      ->  数据滤波和预处理
Tokenize     ->  ADC离散化
预训练       ->  产线标定(最耗时、最贵)
微调         ->  应用层参数校准
对齐         ->  用户体验调优(让人用着舒服)
部署         ->  烧录固件到MCU

第5个月:理解微调与部署

目标:能理解LoRA、量化等部署优化技术

学习内容

  • 《大模型从零开始构建》第7、9章
  • 赵鑫《大语言模型》第9-11章
  • 了解llama.cpp、MLC LLM等边缘部署框架

产出

  • 能解释:LoRA的原理、量化的 trade-off
  • 知道如何将一个开源模型部署到边缘设备

嵌入式工程师的天然优势

嵌入式技能 在大模型部署中的应用
内存管理 KV Cache管理、激活内存优化
定点运算 INT8/INT4量化推理
并行计算 GPU/NPU上的矩阵乘法优化
性能调优 推理延迟优化、吞吐量提升
系统裁剪 模型剪枝、蒸馏到小模型

第6个月:综合与实践

目标:能在你的专业领域中设计AI+嵌入式的方案

学习内容

  • 关注边缘AI框架:TensorFlow Lite、ONNX Runtime、llama.cpp
  • 了解TinyML(微型机器学习)
  • 用开源小模型(如Qwen-1.8B、Phi-3-mini)做实际项目

产出

  • 设计一个"嵌入式+大模型"的方案(哪怕是概念性的)
  • 例如:在MCU上运行量化后的LLM做本地语音指令理解

三、知识地图

Python基础
    |
    v
numpy矩阵运算 ──> 线性代数基础(矩阵乘法、点积、转置)
    |
    v
深度学习基础(鱼书1-5章)
    |
    v
CNN / RNN / 注意力机制
    |
    v
Transformer 架构 ──> 核心中的核心
    |
    +-- Self-Attention
    +-- Multi-Head Attention
    +-- Positional Encoding
    +-- Layer Normalization
    +-- Residual Connection
    |
    v
GPT系列(Decoder-only)
    |
    +-- Causal Masking(因果掩码)
    +-- Next Token Prediction(预测下一个token)
    +-- Auto-regressive Generation(自回归生成)
    |
    v
预训练 + 微调 + 对齐
    |
    v
模型部署优化
    |
    +-- 量化(FP32 -> INT8/INT4)
    +-- KV Cache
    +-- 模型剪枝/蒸馏
    +-- 边缘部署(llama.cpp等)

四、推荐学习节奏

每周投入建议:6-8小时

  • 周一/三/五:各1小时(看视频)
  • 周六:3小时(读书+写笔记)
  • 周日:1小时(整理和复盘)

不要做的事

  • 不要一开始就推导数学公式——先有直觉再补数学
  • 不要只看不练——每学一个概念,动手写几行代码验证
  • 不要追求100%理解再前进——先建立框架,再填充细节
  • 不要只学理论不看工程——部署优化是你的强项,从这里切入

评论功能需要配置 Giscus 环境变量

请访问 giscus.app 获取配置信息