当前位置：首页 > news >正文

大模型应用开发过程中主流架构模式——大模型+多个小模型

news 2025/12/29 20:56:28

“ 架构是灵活多变的，切勿钻牛角尖 ”

虽然说经过这一两年时间的发展，大模型的能力已经得到巨大的提升，甚至有些模型已经超出了意料。

但大模型在工程化落地中依然面临着很多问题，比如说成本问题，技术问题，以及能力问题，毕竟大模型并不是万能的，某些模型虽然在某些方面表现较强，但并不是无所不能的。

因此，该怎么解决这个问题呢？

这时通用大模型+多个垂直小模型的解决方案就出现了。

大模型+多个小模型

大家看到大模型+多个小模型，会不会就认为大模型就是参数量庞大的模型，多个小模型就是参数量较小的模型？

其实这里说的大模型+多个小模型并不是从我们传统意义从技术角度理解的模型，而是从业务角度上的模型。

这里的大模型指的是你们公司主要业务依赖的模型，比如一家做AIGC业务的企业，它的大模型肯定是以生成业务为主；但生成式范围那么大，不可能有一家公司能维护如此多的模型，肯定是以一两个业务方向为主，其它的为辅。

在这里插入图片描述

比如说一家公司做AI音乐生成业务，但如果它还想做视频处理和文字处理的业务，这时它可能就没有那么多资金，技术和时间来维护如此多的模型。

而多个垂直小模型也并不是说一定是体量小的模型，而是那种非主要业务的模型；可能是自己维护的小模型，也可能是调用第三方的大模型服务。

大模型+小模型的配置方式细分来说还有很多适用场景，比如上面说的主业务模型+边缘业务模型；再比如，一个功能强大的视频生成模型+多个不同风格的垂下小模型，通过大+小的方式来解决不同场景的问题，以及节约企业成本。

不论是学习还是实际的企业应用，千万要明白没有人能做解决所有的问题，也没有人能完成所有的任务，因此合作才是最好的选择，而大模型+垂直小模型的方式就是最好的合作体现——合作共赢。

个人或企业只需要关注于自身的核心业务，而不用把时间和精力浪费在一些自己根本无力完成的任务上，这就是要做回报率最高，最有性价比的事情。

很多人都喜欢做一条龙，集研发，生产，销售为一体，但对大部分中小企业来说成为产业链条上的一环或许是更好的选择。

而在今年上半年，360CEO周鸿祎也不止一次的提过，不要过分追求大模型的能力和性能，使用多个功能强大的垂直小模型可能会比一个大模型做的更好，更强。

前面可以说是使用大模型+多个小模型的好处，那么使用这种方案有没有什么坏处呢？

凡事都有两面性，使用大模型+小模型虽然能带来很多好处但同样也面临着很多问题。

虽然很多时候由于业务的多元性导致我们不得不使用多个模型，但使用多个模型最大的问题就是要适配不同的模型，每个模型都有其不同的输入和输出，而且不同模型的能力不一而足。

我们要在兼容不同模型的基础之上，还要同时兼顾多种模型的复杂性和稳定性。

在这里插入图片描述

就类似于传统业务系统架构中，由于业务需要或其它原因导致我们不得不引入一些中间件，但有过项目经验的人应该都知道，每引入一个中间件都会给项目带来一些不确定的潜在风险。

万一中间件不稳定怎么办，万一中间件宕机了怎么办等等，怎么做容错处理等。

总之，没有一成不变的架构，也没有完美无缺的系统，我们需要根据实际情况根本不同的业务场景，选择合适的解决方案，而不是想着靠一个架构解决所有问题。

最后，最最最重要的事就是，面对问题一定要灵活多变，切记不可钻牛角尖。

如何学习AI大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

查看全文

http://www.mrgr.cn/news/50384.html

Windows 11开发

DDR系列之一：内存的种类

【前端】浏览器中的hevc视频播放库汇总，无需wasm

扩散模型训练方法一直错了！

计算机和网络

Redis拒绝连接问题分析与解决方案

黑龙江等保测评：APP安全性的重要性与实施策略

XPM_CDC_ARRAY_SINGLE

Java比较两个Excel是否内容一致

【接口限流】java中springboot实现接口限流防抖处理（JUC注解版）

【Java小白系列课】-01-Java环境安装-变量

Palo Alto Networks Expedition 未授权SQL注入漏洞复现(CVE-2024-9465)

网络资源模板--Android Studio 实现宿舍管理系统App

MYSQL数据库和oracle数据库的详细对比，该怎么选择？

ICM20948 DMP代码详解（81）

pandas中数据子集的获取

惊人秘诀！揭秘ChatGPT写作的最佳提问技巧！帮你拿到满分论文

华宇携司法大模型亮相2024中国移动全球合作伙伴大会

解锁救援秘诀：为什么救生抛投器你用不明白？

如何学习AI大模型？

一、全套AGI大模型学习路线

二、640套AI大模型报告合集

三、AI大模型经典PDF籍

四、AI大模型商业化落地方案

相关文章：