大模型
2026年2月2日大约 3 分钟
大模型
本页将介绍大模型的基础知识,包括 VLM、GLM、多模态模型、RAG、Agent 等。
1. 资源与学习链接
1.1 ZJU LLMs 基础教程
- 项目地址:Foundations-of-LLMs
- 内容概述:
- 大语言模型基础理论
- Transformer 架构讲解
- VLM、GLM 等模型基础
1.2 MiniMind
- 项目地址:MiniMind
- 内容概述:
- 轻量级 LLM 实现
- 支持多种实验任务
- 便于快速上手和理解 LLM 原理
1.3 Qwen 系列示例
- 官方文档:Qwen GRPO 示例
- 内容概述:
- Qwen 模型应用实例
- 包括文本生成、问答、推理等任务
- 提供可直接运行的案例
1.4 阿里云官方训练模型
- 官方文档:Qwen2.5-Coder 训练与部署
- 内容概述:
- 模型训练流程
- 性能评估方法
- 模型压缩与部署策略
2. 推荐学习顺序
- 从 ZJU LLMs 基础教程 开始,建立理论框架
- 再通过 MiniMind 实现轻量实验,加深理解
- 学习 Qwen 示例,掌握实战应用
- 最后阅读 阿里云官方训练模型文档,了解工业落地
3. 注意事项
- 文档中涉及的项目大多依赖 Python 环境,请提前安装相应依赖
- 对于多模态模型与 RAG,建议先熟悉 Transformer 和 BERT / GPT 基础
- RAG / Agent 模型涉及外部检索与知识库整合,可按需实验
