大模型应用开发新手必看:一周速成学习路线,告别术语混乱!

📅 2026/6/26 15:07:30 ✍️ 编辑团队 👁️ 阅读次数
大模型应用开发新手必看:一周速成学习路线,告别术语混乱!
本文为自学大模型应用开发的学习路线总结旨在帮助初学者快速掌握核心概念和技术而非追求全面概念学习。文章强调Python工程能力、调用模型能力和组织复杂流程能力的重要性并提供了学习推荐顺序包括Python基础、LLM概念理解、Prompt/Prompt Engineering、RAG、Agent和LangChain等适合偏工程、系统、业务场景的学习者。最初了解大模型应用开发的时候对各种术语很模糊LLM是什么RAG是什么LLMRAG与Agent是什么关系Langchain又是什么很混乱于是我花了一周的时间去了解学习。本文是我在自学大模型应用开发过程中一边实践、一边修正后整理出的学习路线。 目标不是“学全概念”而是知道哪些必须学、哪些了解即可、哪些可以暂时不碰。这份路线适合谁 / 不适合谁适合想做 大模型应用开发而不是训练模型偏工程、系统、业务场景如接口、日志、数据处理不适合想从零训练大模型;走算法 / 学术研究路线;以数学推导为主要目标整体学习思路大模型应用开发 Python 工程能力 调用模型的能力 组织复杂流程的能力不是堆数学; 死磕底层原理; 从 Transformer 推公式下面是个人自学摸索后规划的学习路线图因为是个人摸索的可能有遗漏如有不对的希望大家可以给出指点学习内容介绍备注python是一种高级编程语言 学习大模型应用开发是 Python 是必须学习的。学习基础内容函数包的调用即可。无需研究深度学习与机器学习。 对于大模型应用开发python的角色是胶水语言工程语言而不是算法语言必须学习LLM大语言模型英文Large Language Model缩写LLM也称大型语言模型,是一种人工智能模型旨在理解和生成人类语言。必须理解概念 不需要自己训练Prompt 与 Prompt EngineeringPrompt 提示词 (一次对模型的具体输入 Prompt Engineering 提示词工程系统性的具体输入必须掌握使用方法 工程能力不是理论RAGRAG全称是Retrieval-Augmented Generation中文叫检索增强生成。必须理解并能实践常见应用模式 不是每个项目都需要Agent把大模型和一堆工具组装起来变成一个能感知和改变外界环境的智能程序称之为Agent复杂场景下需要会用是加分项 不是每个项目都需要Langchain(进阶学习) LangChain是一种创新性的框架是语言模型驱动的应用程序的开发方式。进阶学学不建议一开始学 复杂项目使用pytorch(进阶学习) 深度学习框架用来实现和训练Transformer等模型了解即可不建议一开始学Transformer(进阶学习) 一种神经网络架构广泛应用于NLP(自然语言处理) ,大多数模型基于它学习推荐顺序python基础API调用LLM概念知道能干什么Prompt/Prompr EngineeringRAG(解决查资料不准)Agnet复杂流程自动化LangChain当项目复杂时pyTorch/Transformer 了解不急下面内容为各核心概念的补充说明与学习资料可按需阅读Python定义是一种高级编程语言Python 在这里扮演什么角色Python 是胶水语言 工程语言而不是算法语言。在大模型应用开发中python的主要作用以及不需要做什么python主要作用调接口 处理数据 组织流程 写日志、查问题不需要做什么深度学习训练 复杂数学推导学习范围针对于学习大模型应用开发只需要学习Python的基础内容即可不需要学习机器学习与深度学习。我让deepseek给过我一个学习路线我个人感觉东西可能有点多所以没有全部采用准备在日后学习实践中逐渐记录python学习视频推荐黑马课程简单易懂小白也可很快上手学习B站就有课程可以直接搜索学习。必学基础生存能力基本语法、数据结构(字符串、数字、列表、元组、字典、集合 条件语句if/elif/else 循环for/while 函数、模块 文件读写 异常处理 logging 日志 JSON 处理 requests 调用接口进阶可后面再补虚拟环境venv / conda 配置管理 简单异步asyncio可暂时不学装饰器 / 元类 深度学习框架细节 数学原理推导LLM补充理解与参考资料定义大语言模型英文Large Language Model缩写LLM也称大型语言模型,是一种人工智能模型旨在理解和生成人类语言。LLM 是“已经训练好的语言模型”能做什么理解、生成、总结、推理文本有那些LLM: 国外的GPT、LLaMA、 Gemini国内的DeepSeek、 文心一言(百度)、 通义千问(阿里) 都属于 LLM在应用开发中你只负责调用模型不负责训练模型。推荐学习资料非必须知乎文章链接什么是LLM大语言模型Large Language Model从量变到质变 - 艾凡AFan的文章 - 知乎 https://zhuanlan.zhihu.com/p/622518771Prompt / Prompt Engineering注必须掌握使用方式Prompt一次对模型的具体输入一段文字Prompt Engineering系统性设计 Prompt 的方法日常在大模型应用开发的学习中说学Prompt实际上指的是“Prompt Engineering” 而不是背几句话术。核心目标让模型输出稳定让结果可控、可解析RAG进阶理解与推荐资料RAG全称是Retrieval-Augmented Generation中文叫检索增强生成。RAG 检索 大模型生成解决的问题模型不知道你的私有数据,模型容易胡编适合场景文档问答;日志分析;知识库查询不是每个项目都必须用 RAG但一旦涉及“查资料”它非常常见。推荐学习资料非必须B站详细原理可以看B站up马克的技术工作坊 的RAG详解非常易懂https://www.bilibili.com/video/BV1JLN2z4EZQ/?spm_id_from333.1387.homepage.video_card.click小红书上找的RAG相关文档自己可以在小红书找到也可以从本公众号后台回复RAG获取pdf文档Agent进一步了解Agent 用大模型“规划 调用工具 执行步骤”本质上仍然是程序逻辑模型调用并不是有自主意识的系统适合多步骤、条件判断、自动化流程注意Agent 不是必须项 很多需求用普通 Python 逻辑就能解决。推荐学习资料非必须B站同样推荐的B站up 马克的技术工作坊 的Agent详解https://www.bilibili.com/video/BV1TSg7zuEqR/?spm_id_from333.1387.homepage.video_card.clickvd_source38410fc54f9e8d536c013e81b142c0fd小红书上找的Agent相关文档介绍相关资料可以从公众号后台获取结语抓住大模型时代的职业机遇AI大模型的发展不是“替代人类”而是“重塑职业价值”——它淘汰的是重复性、低附加值的工作却催生了更多需要“技术业务”交叉能力的高端岗位。对于求职者而言想要在这波浪潮中立足不仅需要掌握Python、TensorFlow/PyTorch等技术工具更要深入理解目标行业的业务逻辑如金融的风险控制、医疗的临床需求成为“懂技术、懂业务”的复合型人才。无论是技术研发岗如算法工程师、研究员还是业务落地岗如产品经理、应用工程师大模型都为不同背景的职场人提供了广阔的发展空间。只要保持学习热情紧跟技术趋势就能在AI大模型时代找到属于自己的职业新蓝海。最近两年大模型发展很迅速在理论研究方面得到很大的拓展基础模型的能力也取得重大突破大模型现在正在积极探索落地的方向如果与各行各业结合起来是未来落地的一个重大研究方向大模型应用工程师年包50w属于中等水平如果想要入门大模型那现在正是最佳时机2025年Agent的元年2026年将会百花齐放相应的应用将覆盖文本视频语音图像等全模态如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享扫描下方csdn官方合作二维码获取哦给大家推荐一个大模型应用学习路线这个学习路线的具体内容如下第一节提示词工程提示词是用于与AI模型沟通交流的这一部分主要介绍基本概念和相应的实践高级的提示词工程来实现模型最佳效果以现实案例为基础进行案例讲解在企业中除了微调之外最喜欢的就是用提示词工程技术来实现模型性能的提升第二节检索增强生成RAG可能大家经常会看见RAG这个名词这个就是将向量数据库与大模型结合的技术通过外部知识来增强改进提升大模型的回答结果这一部分主要介绍RAG架构与组件从零开始搭建RAG系统生成部署RAG性能优化等第三节微调预训练之后的模型想要在具体任务上进行适配那就需要通过微调来提升模型的性能能满足定制化的需求这一部分主要介绍微调的基础模型适配技术最佳实践的案例以及资源优化等内容第四节模型部署想要把预训练或者微调之后的模型应用于生产实践那就需要部署模型部署分为云端部署和本地部署部署的过程中需要考虑硬件支持服务器性能以及对性能进行优化使用过程中的监控维护等第五节人工智能系统和项目这一部分主要介绍自主人工智能系统包括代理框架决策框架多智能体系统以及实际应用然后通过实践项目应用前面学习到的知识包括端到端的实现行业相关情景等学完上面的大模型应用技术就可以去做一些开源的项目大模型领域现在非常注重项目的落地后续可以学习一些Agent框架等内容上面的资料做了一些整理有需要的同学可以下方添加二维码获取仅供学习使用