大模型学习视频资源大全
面向嵌入式软件工程师,精选B站+YouTube中英文优质视频资源。
每部视频均附有内容简介,帮助你快速判断是否需要观看。
一、入门级(零基础 -> 理解大模型是什么)
1. 吴恩达 Generative AI for Everyone(AI for Everyone)
| 属性 | 说明 |
|---|---|
| 平台 | Coursera / B站搬运 |
| 语言 | 英文讲解,中文字幕 |
| 时长 | 约6小时,3-4个模块 |
| 难度 | 零基础 |
| B站搜索关键词 | "吴恩达 AI for Everyone" |
内容简介:
吴恩达专门为非技术人员设计的大模型通识课。不讲代码,不讲数学,用通俗语言解释:什么是生成式AI、大模型能做什么不能做什么、AI对企业和个人的影响、如何在一个组织中引入AI。这是建立"AI世界观"的最佳起点。
为什么值得看:吴恩达的讲解风格是全球公认最清晰的。6小时就能建立对AI的系统性认知,性价比极高。
2. 李宏毅 生成式AI(2024/2025课程)
| 属性 | 说明 |
|---|---|
| 平台 | YouTube / B站搬运 |
| 语言 | 中文讲解 |
| 时长 | 约30+小时,完整学期课程 |
| 难度 | 入门到进阶 |
| YouTube | https://www.youtube.com/@Lihungyilee |
| B站搜索关键词 | "李宏毅 生成式AI" |
内容简介:
台湾大学李宏毅教授的完整学期课程。从生成式AI的基础概念讲起,逐步深入到RNN、Transformer、GPT、BERT、扩散模型、多模态大模型等。每节课有PPT讲解+代码演示。课程幽默风趣,用大量动画和比喻解释复杂概念。
为什么值得看:这是华人世界里最好的AI课程之一。李宏毅擅长用"人话"解释技术,配合动画演示,比看论文轻松100倍。建议配合课件一起看。
3. 3Blue1Brown - 神经网络系列
| 属性 | 说明 |
|---|---|
| 平台 | YouTube / B站搬运 |
| 语言 | 英文讲解,有中文字幕 |
| 时长 | 约4集,每集15-20分钟 |
| 难度 | 零基础 |
| YouTube | https://www.youtube.com/c/3blue1brown |
| B站搜索关键词 | "3Blue1Brown 神经网络" |
内容简介:
用极其精美的数学动画讲解神经网络的核心概念:什么是神经网络、梯度下降是怎么回事、反向传播的数学原理。不写一行代码,但每个公式都用动画让你"看到"它在做什么。
为什么值得看:如果只能用10分钟理解梯度下降和反向传播,看这个系列。可视化质量全球顶级。
二、进阶级(理解大模型怎么工作)
4. 李沐 动手学深度学习v2
| 属性 | 说明 |
|---|---|
| 平台 | B站 |
| 语言 | 中文讲解 |
| 时长 | 90+集,每集15-30分钟 |
| 难度 | 入门到进阶 |
| B站 | https://space.bilibili.com/1567748478 |
| B站搜索关键词 | "李沐 动手学深度学习" |
内容简介:
配套《动手学深度学习》教材的视频课程。李沐(Amazon首席科学家)亲自讲解,从线性回归讲起,一直讲到Transformer和大模型。每节课都是"概念讲解+代码实现+论文精读"的三段式结构。代码用PyTorch实现。
为什么值得看:华语圈AI学习的第一资源。李沐的讲解深入浅出,代码写得极其规范。建议配合教材一起看,视频建立直觉,代码加深理解。
5. 李沐 论文精读系列
| 属性 | 说明 |
|---|---|
| 平台 | B站 |
| 语言 | 中文讲解 |
| 时长 | 50+集 |
| 难度 | 进阶 |
| B站 | 同上,搜索"论文精读" |
内容简介:
精读AI领域的经典论文:Attention Is All You Need(Transformer)、BERT、GPT、ResNet、GAN等。每集拆解一篇论文的核心贡献、方法细节、实验结果。
为什么值得看:直接读论文太难,李沐帮你"嚼碎"了喂你。想深入理解Transformer,必看Attention Is All You Need的论文精读。
6. Andrej Karpathy - Neural Networks: Zero to Hero
| 属性 | 说明 |
|---|---|
| 平台 | YouTube |
| 语言 | 英文讲解 |
| 时长 | 10+集,每集1-2小时 |
| 难度 | 进阶 |
| YouTube | https://www.youtube.com/watch?v=VMj-3S1tku0 |
内容简介:
前OpenAI/特斯拉AI总监Karpathy的封神课程。从最基础的微积分和梯度下降讲起,一步步手搓一个GPT模型。第1集讲微积分和梯度下降,第2集讲反向传播,第3集讲神经网络,一直到后面几集实现一个完整的GPT。全程写代码,不用框架。
为什么值得看:这是全球公认最好的"从零实现大模型"视频课程。Karpathy的讲解极其清晰,代码写得像教科书一样工整。如果你只想看一个系列来深入理解GPT的实现,就是这个。
7. Andrej Karpathy - Let's build GPT
| 属性 | 说明 |
|---|---|
| 平台 | YouTube |
| 语言 | 英文讲解 |
| 时长 | 约2小时 |
| 难度 | 进阶 |
| YouTube | https://www.youtube.com/watch?v=kCc8FmEb1nY |
内容简介:
一场直播式编程,Karpathy从零开始写一个GPT模型,边写边讲。从tokenizer到embedding到attention到训练循环,全部手写。观众可以实时看到代码从空白到完整。
为什么值得看:比起录播课程,直播式的"边写边讲"更能展现一个有经验的AI工程师的思考过程——先写什么、怎么调试、遇到问题怎么排查。
8. StatQuest - Transformer神经网络系列
| 属性 | 说明 |
|---|---|
| 平台 | YouTube |
| 语言 | 英文讲解 |
| 时长 | 5-6集,每集10-20分钟 |
| 难度 | 入门到进阶 |
| YouTube | https://www.youtube.com/c/statquest |
| 搜索关键词 | "StatQuest Transformer" |
内容简介:
用动画+通俗语言讲解Transformer的每个组件:什么是注意力机制、Q/K/V分别是什么、多头注意力在做什么、位置编码的作用。每集只讲一个概念,讲透为止。
为什么值得看:如果你觉得Transformer太复杂,StatQuest帮你把它拆成6个能理解的小块。动画质量一流。
三、实战级(能跑起来、能用起来)
9. Prompt Engineering 教程(DeepLearning.AI)
| 属性 | 说明 |
|---|---|
| 平台 | DeepLearning.AI / B站搬运 |
| 语言 | 英文讲解,中文字幕 |
| 时长 | 约1.5小时 |
| 难度 | 入门 |
| 搜索关键词 | "ChatGPT Prompt Engineering for Developers" |
内容简介:
吴恩达和OpenAI合作推出的Prompt工程课程。两条核心原则(写清晰指令、给模型思考时间)+ 六个具体策略(分隔符、结构化输出、检查条件、few-shot提示等)。短小精干,学完就能用。
为什么值得看:1.5小时学会Prompt工程的系统方法,可能是ROI最高的1.5小时。
10. 跟李沐学AI - 大模型微调实战
| 属性 | 说明 |
|---|---|
| 平台 | B站 |
| 语言 | 中文讲解 |
| 时长 | 多集,每集30-60分钟 |
| 难度 | 进阶 |
| B站搜索关键词 | "李沐 大模型 微调" |
内容简介:
讲解如何微调一个大模型:数据准备、LoRA实现、训练参数调优、效果评估。使用开源工具(如LLaMA-Factory、HuggingFace)进行实操。
为什么值得看:从"会用API"到"会微调模型"的关键一步。嵌入式场景下,微调一个开源小模型部署到边缘设备,是非常实际的需求。
11. Hugging Face 官方教程
| 属性 | 说明 |
|---|---|
| 平台 | YouTube / 官网课程 |
| 语言 | 英文讲解 |
| 时长 | 多模块,灵活选择 |
| 难度 | 入门到进阶 |
| YouTube | https://www.youtube.com/@huggingface |
内容简介:
Hugging Face官方出品的系列教程,覆盖Transformer库的使用、预训练模型的加载和微调、数据集处理、模型部署等。
为什么值得看:Hugging Face是AI领域的"GitHub",学会用它就学会了调用几乎所有开源大模型。
四、观看建议
第一阶段(认知建立,1-2周)
吴恩达 AI for Everyone -> 3Blue1Brown 神经网络 -> 吴恩达 Prompt Engineering
第二阶段(技术深入,3-6周)
李沐 动手学深度学习 -> 李沐 论文精读(Transformer篇)
第三阶段(硬核实现,4-8周)
Karpathy Neural Networks Zero to Hero -> Karpathy Let's build GPT
第四阶段(实战应用,持续)
李沐 大模型微调实战 -> Hugging Face 官方教程