编程知识
  • 编程日记
当前位置: 首页 > news >正文

LMDeploy 量化部署实践闯关任务

news 2025/5/9 4:23:54

进行模型量化

量化1.8b模型
`lmdeploy chat /root/models/internlm2_5-1_8b-chat-w4a16-4bit/ --model-format awq

模型量化结果

在这里插入图片描述

测试

在这里插入图片描述
占用
在这里插入图片描述
kv量化
在这里插入图片描述
占用
在这里插入图片描述

查看全文

http://www.mrgr.cn/news/16608.html

相关文章:

  • Lagent 自定义 Agent 智能体
  • 从智慧城市与代理IP看未来科技与个人隐私间的微妙平衡
  • [合集]一汽大众(斯柯达、奥迪、兰博基尼、宾利等)故障代码查询合集
  • python基础(15多线程编程介绍)
  • 怎么快速入门大模型技术——人工智能技术学习方法
  • Java对象的创建过程
  • 【ROS2】PID控制
  • 展望 RisingWave 2.0:提供流批一体功能的 SQL 数据库
  • DeepSpeed入门
  • 【Windows学习笔记】1:OneCore和Windows API
  • 深入解析HarmonyOS Image组件的使用与优化
  • Windows服务器应急响应(下)
  • C语言:getchar()、putchar()及int、char之间的互相赋值
  • 【JavaScript】函数:arguments对象
  • fork入门
  • 手机充值的功能测试框架 - 测试要点
  • EXO项目StandardNode;max_generate_tokens;buffered_token_output;is_finished;
  • Unity实战案例全解析 之 背包/贩卖/锻造系统(左侧类图实现)
  • fastmock使用
  • Linux——IO模型_多路转接(epoll)
  • 最新文章

    • redis高级进阶
      redis高级进阶
      2025/5/6 18:00:51
    • 2025年一加7pro刷twpr / magisk / kali nethunter教程+资源下载+避坑指南
      2025年一加7pro刷twpr / magisk / kali nethunter教程+资源下载+避坑指南
      2025/5/3 0:49:32
    • PV操作:宣帧闯江湖武林客栈版学习笔记【操作系统】
      PV操作:宣帧闯江湖武林客栈版学习笔记【操作系统】
      2025/5/3 0:28:14
    • 给U盘加上图标
      给U盘加上图标
      2025/5/2 18:34:47
    • 第 12 届蓝桥杯 C++ 青少组中 / 高级组省赛 2021 年 4 月 24 日真题
      第 12 届蓝桥杯 C++ 青少组中 / 高级组省赛 2021 年 4 月 24 日真题
      2025/5/2 15:22:37
    • sftp连接报错Received message too long 168449893
      sftp连接报错Received message too long 168449893
      2025/5/2 15:21:32
    • 编程知识介绍
    • 商务合作
    • 免责声明

    CopyRight © 编程知识版权所有