DevSpace
分享🔗 精选链接2026-05-26·2 分钟阅读

AI架构学习资源索引(GitHub高星项目)

按架构主题分类的GitHub高星AI项目索引,涵盖系统架构、RAG、推理引擎、MCP和边缘AI。

AIGitHub开源项目架构学习

AI架构学习资源索引

面向架构师的GitHub高星AI项目索引。
按架构主题分类,每个项目都有中文说明和适用场景。


一、系统架构设计

项目 Stars 说明 适合谁
study8677/awesome-architecture 108 21张AI架构图(RAG、Agent、推理服务等) 快速建立架构认知
FareedKhan-dev/all-agentic-architectures 3,370 17种Agent架构模式实现 深入理解Agent架构
Eric-LLMs/Awesome-AI-Engineering 5 全栈LLM工程手册(架构+训练+部署) 全栈AI工程师
Ali-Meh619/System_Design_ML_Principles 18 ML系统设计面试指南,43个主题 准备AI架构面试

二、RAG架构与模式

项目 Stars 说明 适合谁
sunilpradhansharma/production-rag-patterns-in-practice 2 26种生产级RAG模式,含架构图 设计生产级RAG
Guan-JW/awesome-db-for-ai-systems 2 AI系统中的数据库架构实践 数据库选型参考
mukulchhabra23/llm-system-design 1 LLM系统设计手册(RAG/Agent/评估/成本) 系统架构师
HimClix/agentic-ai-system-design-primer 1 Agent系统设计入门(模式/架构/权衡) Agent架构初学者

三、推理引擎与优化

项目 Stars 说明 适合谁
NLPOptimize/flash-tokenizer 461 高性能Tokenizer引擎 推理性能优化
ksm26/Efficiently-Serving-LLMs 19 LLM服务优化技术详解 推理服务架构师
hofong428/Optimizing-GPU-Kernels 8 LLM推理与GPU内核优化 GPU优化工程师
sandyhu533/llm-infra-learning 4 LLM基础设施学习路线图 AI基础设施工程师

四、MCP协议与Agent

项目 Stars 说明 适合谁
microsoft/mcp-for-beginners 16,200 MCP协议入门课程(多语言示例) 学习MCP协议
lastmile-ai/mcp-agent 8,338 用MCP构建Agent的工作流模式 Agent开发者
zeljkoavramovic/agentic-design-patterns 99 29种Agent设计模式 Agent架构师
ksm26/AI-Agentic-Design-Patterns-with-AutoGen 142 用AutoGen实现多Agent系统 多Agent系统开发

五、边缘AI与嵌入式部署

项目 Stars 说明 适合谁
Azure-Samples/Phi-3MiniSamples 71 Phi-3-mini边缘部署示例 边缘AI开发者
STiFLeR7/Edge-LLM 2 Qwen2.5-3B GPTQ量化优化(5.75GB→1.93GB) 边缘模型优化
onyokoli/local-llm 5 C++框架,消费级硬件跑7B+模型 嵌入式AI开发
Clarit-AI/Synapse 4 高性能llama.cpp fork,边缘推理优化 边缘推理优化

六、边缘AI架构专项

6.1 嵌入式AI参考架构

┌─────────────────────────────────────────────────────────────┐
│                    应用层                                    │
│  语音助手 / 设备诊断 / 产线监控 / 质量检测 / 客服机器人        │
├─────────────────────────────────────────────────────────────┤
│                    AI服务层                                  │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐                    │
│  │ LLM推理   │ │ RAG检索   │ │ Agent编排 │                    │
│  │llama.cpp │ │SQLite+vec│ │本地工作流  │                    │
│  └──────────┘ └──────────┘ └──────────┘                    │
├─────────────────────────────────────────────────────────────┤
│                    模型层                                    │
│  Qwen-1.8B INT4 / Phi-3-mini INT4 / 自定义小模型             │
│  量化: GPTQ/AWQ | 大小: 1-3GB | 精度: INT4/INT8              │
├─────────────────────────────────────────────────────────────┤
│                    硬件层                                    │
│  ARM Cortex-A78 / NPU / GPU(Mali) / 内存4-8GB LPDDR5        │
└─────────────────────────────────────────────────────────────┘

6.2 嵌入式AI部署检查清单

  • 模型选择:参数<3B,量化后大小<2GB
  • 量化方案:INT4优先,精度损失<3%
  • 推理框架:llama.cpp(C++,ARM友好)
  • 内存管理:预分配内存池,避免运行时碎片
  • 流式输出:Token-by-Token,降低首字延迟
  • 本地知识库:SQLite + 轻量embedding模型
  • 语音支持:Sherpa-ONNX / Whisper.cpp
  • 功耗管理:按需唤醒,空闲时降频

七、学习路线图

第1周:建立架构认知
  ├── study8677/awesome-architecture(21张架构图)
  └── 本文档第二部分"核心架构模式"

第2-3周:深入RAG架构
  ├── sunilpradhansharma/production-rag-patterns-in-practice
  └── 搭建一个简单的RAG系统

第4-5周:Agent架构
  ├── FareedKhan-dev/all-agentic-architectures
  └── zeljkoavramovic/agentic-design-patterns

第6-7周:推理优化
  ├── ksm26/Efficiently-Serving-LLMs
  └── 部署一个开源模型(vLLM或llama.cpp)

第8周:MCP协议
  ├── microsoft/mcp-for-beginners
  └── 实现一个MCP Server

持续:边缘AI
  ├── Azure-Samples/Phi-3MiniSamples
  └── 在嵌入式设备上跑一个小模型

评论功能需要配置 Giscus 环境变量

请访问 giscus.app 获取配置信息