当前位置: 首页 > news >正文

模型压缩之知识蒸馏

一、知识蒸馏功能

除了前面笔记中的剪枝,知识蒸馏也是模型压缩一个重要方法之一,并且该方式是把一个复杂的大模型上学习到的知识迁移到另一个更适合部署的小模型上,在保证精度不下降的同时,实现模型压缩。

二、知识蒸馏的类型

 

注意:

在深度学习中,两幅图像的交叉熵越大表示:

  1. 两个概率分布之间的差异越大。交叉熵是用来衡量两个概率分布之间的差异程度的指标。当两个分布越不相同时,交叉熵也就越大。

  2. 模型预测的结果和真实标签之间的差距越大。交叉熵常用作训练神经网络的损失函数,用来衡量模型预测输出与真实标签之间的差距。当预测结果与实际标签差异较大时,交叉熵也会比较大。

  3. 模型学习效果较差。交叉熵越大意味着模型难以拟合训练数据,无法很好地学习到数据的潜在规律。这可能是由于模型结构、超参数设置等问题导致的。

因此,在深度学习中,我们通常希望最小化模型在训练集上的交叉熵损失,从而提高模型的学习效果和预测性能。减小交叉熵是深度学习模型优化的一个重要目标。


http://www.mrgr.cn/news/19707.html

相关文章:

  • 统计学习方法与实战——统计学习方法概论
  • 【技术前沿】智能反向寻车解决方案:提升停车场用户体验与运营效率
  • python如何连接人大金仓数据库
  • 鸿蒙-PC三栏布局
  • 性能测试经典案例解析——网上报税系统
  • 力扣62-不同路径(Java详细题解)
  • 高效易用的仓库进销存管理软件盘点,总有一款适合你!
  • 金仓 KES Plus 不充会员也好用
  • 安装Selenium进行web⾃动化测试
  • 在windows上怎么看动态库dll是64还是32位的
  • 10.6 应用层协议
  • 基于python的Selenium webdriver环境搭建(笔记)
  • 快速复制sql表结构 或者表结构加数据WHERE 1=1 和 WHERE 1=2
  • JPA关联MyBatis
  • 代码随想录:62.不同路径
  • ASPICE认证、培训与评估:汽车行业软件开发的三大支柱
  • 828华为云征文|华为云Flexus X实例docker部署srs6并调优,协议使用webrtc与rtmp
  • maven中如何配置多个仓库使其同时生效
  • 论文速读|全身人形机器人的仿人运动研究
  • 【JS】如何给fetch添加超时功能