AI架构学习资源索引
面向架构师的GitHub高星AI项目索引。
按架构主题分类,每个项目都有中文说明和适用场景。
一、系统架构设计
| 项目 | Stars | 说明 | 适合谁 |
|---|---|---|---|
| study8677/awesome-architecture | 108 | 21张AI架构图(RAG、Agent、推理服务等) | 快速建立架构认知 |
| FareedKhan-dev/all-agentic-architectures | 3,370 | 17种Agent架构模式实现 | 深入理解Agent架构 |
| Eric-LLMs/Awesome-AI-Engineering | 5 | 全栈LLM工程手册(架构+训练+部署) | 全栈AI工程师 |
| Ali-Meh619/System_Design_ML_Principles | 18 | ML系统设计面试指南,43个主题 | 准备AI架构面试 |
二、RAG架构与模式
| 项目 | Stars | 说明 | 适合谁 |
|---|---|---|---|
| sunilpradhansharma/production-rag-patterns-in-practice | 2 | 26种生产级RAG模式,含架构图 | 设计生产级RAG |
| Guan-JW/awesome-db-for-ai-systems | 2 | AI系统中的数据库架构实践 | 数据库选型参考 |
| mukulchhabra23/llm-system-design | 1 | LLM系统设计手册(RAG/Agent/评估/成本) | 系统架构师 |
| HimClix/agentic-ai-system-design-primer | 1 | Agent系统设计入门(模式/架构/权衡) | Agent架构初学者 |
三、推理引擎与优化
| 项目 | Stars | 说明 | 适合谁 |
|---|---|---|---|
| NLPOptimize/flash-tokenizer | 461 | 高性能Tokenizer引擎 | 推理性能优化 |
| ksm26/Efficiently-Serving-LLMs | 19 | LLM服务优化技术详解 | 推理服务架构师 |
| hofong428/Optimizing-GPU-Kernels | 8 | LLM推理与GPU内核优化 | GPU优化工程师 |
| sandyhu533/llm-infra-learning | 4 | LLM基础设施学习路线图 | AI基础设施工程师 |
四、MCP协议与Agent
| 项目 | Stars | 说明 | 适合谁 |
|---|---|---|---|
| microsoft/mcp-for-beginners | 16,200 | MCP协议入门课程(多语言示例) | 学习MCP协议 |
| lastmile-ai/mcp-agent | 8,338 | 用MCP构建Agent的工作流模式 | Agent开发者 |
| zeljkoavramovic/agentic-design-patterns | 99 | 29种Agent设计模式 | Agent架构师 |
| ksm26/AI-Agentic-Design-Patterns-with-AutoGen | 142 | 用AutoGen实现多Agent系统 | 多Agent系统开发 |
五、边缘AI与嵌入式部署
| 项目 | Stars | 说明 | 适合谁 |
|---|---|---|---|
| Azure-Samples/Phi-3MiniSamples | 71 | Phi-3-mini边缘部署示例 | 边缘AI开发者 |
| STiFLeR7/Edge-LLM | 2 | Qwen2.5-3B GPTQ量化优化(5.75GB→1.93GB) | 边缘模型优化 |
| onyokoli/local-llm | 5 | C++框架,消费级硬件跑7B+模型 | 嵌入式AI开发 |
| Clarit-AI/Synapse | 4 | 高性能llama.cpp fork,边缘推理优化 | 边缘推理优化 |
六、边缘AI架构专项
6.1 嵌入式AI参考架构
┌─────────────────────────────────────────────────────────────┐
│ 应用层 │
│ 语音助手 / 设备诊断 / 产线监控 / 质量检测 / 客服机器人 │
├─────────────────────────────────────────────────────────────┤
│ AI服务层 │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ LLM推理 │ │ RAG检索 │ │ Agent编排 │ │
│ │llama.cpp │ │SQLite+vec│ │本地工作流 │ │
│ └──────────┘ └──────────┘ └──────────┘ │
├─────────────────────────────────────────────────────────────┤
│ 模型层 │
│ Qwen-1.8B INT4 / Phi-3-mini INT4 / 自定义小模型 │
│ 量化: GPTQ/AWQ | 大小: 1-3GB | 精度: INT4/INT8 │
├─────────────────────────────────────────────────────────────┤
│ 硬件层 │
│ ARM Cortex-A78 / NPU / GPU(Mali) / 内存4-8GB LPDDR5 │
└─────────────────────────────────────────────────────────────┘
6.2 嵌入式AI部署检查清单
- 模型选择:参数<3B,量化后大小<2GB
- 量化方案:INT4优先,精度损失<3%
- 推理框架:llama.cpp(C++,ARM友好)
- 内存管理:预分配内存池,避免运行时碎片
- 流式输出:Token-by-Token,降低首字延迟
- 本地知识库:SQLite + 轻量embedding模型
- 语音支持:Sherpa-ONNX / Whisper.cpp
- 功耗管理:按需唤醒,空闲时降频
七、学习路线图
第1周:建立架构认知
├── study8677/awesome-architecture(21张架构图)
└── 本文档第二部分"核心架构模式"
第2-3周:深入RAG架构
├── sunilpradhansharma/production-rag-patterns-in-practice
└── 搭建一个简单的RAG系统
第4-5周:Agent架构
├── FareedKhan-dev/all-agentic-architectures
└── zeljkoavramovic/agentic-design-patterns
第6-7周:推理优化
├── ksm26/Efficiently-Serving-LLMs
└── 部署一个开源模型(vLLM或llama.cpp)
第8周:MCP协议
├── microsoft/mcp-for-beginners
└── 实现一个MCP Server
持续:边缘AI
├── Azure-Samples/Phi-3MiniSamples
└── 在嵌入式设备上跑一个小模型