当前位置: 首页 > news >正文

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

image.png

面壁智能

在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。

MiniCPM 3.0

image.png

MiniCPM 3.0

MiniCPM 3.0 目前的主要功能有:

长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了 LLM x MapReduce 方法,理论上可以处理长达无穷大的上下文长度。

出色的中英文教学跟随能力:超过 GLM-4-9B-Chat 和 Qwen2-7B-Instruct 的英语教学遵循 IFEval 和中文教学跟随 FollowBench-zh。

卓越的推理能力: 在数学能力方面,它优于 GPT-3.5-Turbo 和 MathBench 上的几个 7B-9B 模型。在极具挑战性的 LiveCodeBench 上,它超越了 Llama3.1-8B-Instruct。

支持函数调用🛠️和代码解释器:在伯克利函数调用排行榜 (BFCL) 上参数少于 9B 的模型中实现了 SOTA,性能优于 GLM-4-9B-Chat 和 Qwen2-7B-Instruct。

RAG 功能:我们发布了 MiniCPM RAG Suite。MiniCPM-Embedding 和 MiniCPM-Reranker 基于 MiniCPM 系列模型,在中英跨语言检索测试中实现了 SOTA 性能。MiniCPM3-RAG-LoRA 专为 RAG 场景设计,在开放域问答等多项任务上优于 Llama3-8B 和百川 2-13B 等模型。

性能对比

image.png

各项参数对比

MiniCPM 3.0 尽管只有4B的参数大小,但测试数据表示它的能力可不一般。

image.png

各项参数对比

这个"小不点"不仅在多项能力上超越了 GPT-3.5,还在某些方面胜过了Qwen2-7B、Phi-3.5、GLM4-9B 和 LLaMa3-8B 等"大块头"。而且从平均的水平来看更是力压群雄,超过了所有对比的模型。

image.png

各项参数对比

在上下文长度为 32k 的 Needle in a Haystack 测试中,MiniCPM 3.0 展现出了超越 GPT-4 和 KimiChat 等顶级模型的长文本处理能力。它就像是一个永不疲倦的阅读者,无论文本多长,都能保持高效准确的理解和处理。

 有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。


http://www.mrgr.cn/news/22950.html

相关文章:

  • MySQL之查询表中重复数据、模糊查询列信息、快速copy表数据(1)
  • python编程二维码里放视频
  • 实时图像处理的加速器:《基于FPGA的数字图像处理原理及应用》(可下载)
  • 【软件测试】盒木进销存管理系统 需求说明书
  • 未来的去中心化网络:Web3与AI的深度融合探讨
  • Mysql面试题
  • RabbitMQ创建交换机和队列——配置类 注解
  • table标签里不能包含div标签?居然因为它!!!
  • Error mongodb connect: 使用Mongoose连不上mongodb官方数据库
  • 阿里云服务器K8S安装教程
  • 重磅发布!《人工智能安全治理框架》1.0版来了
  • 深圳MES系统在制造业的应用与发展
  • 三十四、模型绑定与验证
  • RedisTemplate操作Redis
  • C++复习day05
  • Python列表浅拷贝的陷阱与破解之道
  • 29个横幅广告及详细点评,帮您优化广告效果
  • 苹果账号登录后端验证两种方式 python2
  • Qt工程使用MQTT-C库与mqtt服务器数据通信
  • 【C++11 ——— 右值引用和移动语义】