当前位置：首页 > news >正文

4B参数秒杀GPT-3.5：MiniCPM 3.0惊艳登场！

news 2025/12/16 12:47:58

面壁智能

在 AI 的世界里，总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0，这个仅有4B参数的"小钢炮"，正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。

MiniCPM 3.0

MiniCPM 3.0

MiniCPM 3.0 目前的主要功能有：

长上下文功能：原生支持 32k 上下文长度，性能完美。我们引入了 LLM x MapReduce 方法，理论上可以处理长达无穷大的上下文长度。

出色的中英文教学跟随能力：超过 GLM-4-9B-Chat 和 Qwen2-7B-Instruct 的英语教学遵循 IFEval 和中文教学跟随 FollowBench-zh。

卓越的推理能力： 在数学能力方面，它优于 GPT-3.5-Turbo 和 MathBench 上的几个 7B-9B 模型。在极具挑战性的 LiveCodeBench 上，它超越了 Llama3.1-8B-Instruct。

支持函数调用🛠️和代码解释器：在伯克利函数调用排行榜（BFCL）上参数少于 9B 的模型中实现了 SOTA，性能优于 GLM-4-9B-Chat 和 Qwen2-7B-Instruct。

RAG 功能：我们发布了 MiniCPM RAG Suite。MiniCPM-Embedding 和 MiniCPM-Reranker 基于 MiniCPM 系列模型，在中英跨语言检索测试中实现了 SOTA 性能。MiniCPM3-RAG-LoRA 专为 RAG 场景设计，在开放域问答等多项任务上优于 Llama3-8B 和百川 2-13B 等模型。

性能对比

各项参数对比

MiniCPM 3.0 尽管只有4B的参数大小，但测试数据表示它的能力可不一般。

各项参数对比

这个"小不点"不仅在多项能力上超越了 GPT-3.5，还在某些方面胜过了Qwen2-7B、Phi-3.5、GLM4-9B 和 LLaMa3-8B 等"大块头"。而且从平均的水平来看更是力压群雄，超过了所有对比的模型。

各项参数对比

在上下文长度为 32k 的 Needle in a Haystack 测试中，MiniCPM 3.0 展现出了超越 GPT-4 和 KimiChat 等顶级模型的长文本处理能力。它就像是一个永不疲倦的阅读者，无论文本多长，都能保持高效准确的理解和处理。

有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用，就在厚德云。

http://www.mrgr.cn/news/22950.html

相关文章：

MySQL之查询表中重复数据、模糊查询列信息、快速copy表数据（1）

python编程二维码里放视频

实时图像处理的加速器：《基于FPGA的数字图像处理原理及应用》（可下载）

【软件测试】盒木进销存管理系统需求说明书

未来的去中心化网络：Web3与AI的深度融合探讨

RabbitMQ创建交换机和队列——配置类注解

table标签里不能包含div标签？居然因为它！！！

Error mongodb connect: 使用Mongoose连不上mongodb官方数据库

阿里云服务器K8S安装教程

重磅发布！《人工智能安全治理框架》1.0版来了

深圳MES系统在制造业的应用与发展

三十四、模型绑定与验证

RedisTemplate操作Redis

Python列表浅拷贝的陷阱与破解之道

29个横幅广告及详细点评，帮您优化广告效果

苹果账号登录后端验证两种方式 python2

Qt工程使用MQTT-C库与mqtt服务器数据通信

【C++11 ——— 右值引用和移动语义】