当前位置: 首页 > news >正文

Deepspeed框架学习笔记

       DeepSpeed 是由 Microsoft 开发的深度学习优化库,与PyTorch/TensorFlow等这种通用的深度学习框架不同的是,它是一个专门用于优化和加速大规模深度学习训练的工具,尤其是在处理大模型和分布式训练时表现出色。它不是一个独立的深度学习框架,而是依赖 PyTorch 等框架,扩展了这些框架的性能优化能力。 主要面向分布式训练,通过高效的内存管理、计算优化、模型并行化等技术,帮助开发者在现有硬件上以更快的速度和更低的成本训练超大规模模型。下面对其性质和使用进行如下总结:

(1)特性

DeepSpeed 在模型训练、推理、压缩等方面都进行了特定优化

其中:

  • DeepSpeed-Training:提高大规模深度学习训练的效率和可用性。它包括诸如 ZeRO、3D-Parallelism、DeepSpeed-MoE(混合专家模型)和 ZeRO-Infinity 等技术,为大型模型的有效高效训练做出贡献。

  • DeepSpeed-Infe


http://www.mrgr.cn/news/21681.html

相关文章:

  • 龙芯+FreeRTOS+LVGL实战笔记(新)——05部署主按钮
  • 【NumPy】基础知识
  • 14.1 为什么说k8s中监控更复杂了
  • Java基础 1. Java开发环境搭建
  • C语言程序设计 笔记代码梳理 重制版
  • JobScheduler 调用导致的运行时长30分钟的功耗问题
  • 爆改YOLOv8|利用图像分割网络UNetV2改进yolov8主干-即插即用
  • 【60天备战软考高级系统架构设计师——第十一天:系统集成与测试——集成策略】
  • 指针与函数(一)
  • Python安装:Mac 使用brew 安装Python2 和 Python3
  • mybatis 自定义类型处理器
  • 鸿蒙轻内核M核源码分析系列十五 CPU使用率CPUP
  • Web安全之XSS跨站脚本攻击:如何预防及解决
  • 【Qt】处理键盘事件
  • JVM - Java内存区域
  • Ubuntu创建一个虚拟摄像头
  • 使用Docker快速安装和运行Elasticsearch
  • 00Mac安装playwright
  • MySQL 如何实现乐观锁?
  • 通信工程学习:什么是A/D模数转换