当前位置: 首页 > news >正文

大语言模型微调框架Unsloth:简化模型微调流程,提升模型性能

在这里插入图片描述
Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍,内存使用量减少了 70%,而且准确性不会降低!

特点

  • 通过手动派生所有计算繁重的数学步骤和手写 GPU 内核,unsloth 可以在不更改任何硬件的情况下神奇地使训练更快。
  • 与 Flash Attention 2 (FA2) 相比,在单个 GPU 上快 10 倍,在多个 GPU 系统上快 32 倍。
  • 我们支持从 Tesla T4 到 H100 的 NVIDIA GPU,并且可以移植到 AMD 和 Intel GPU。

支持模型

可以看到主流的开源模型基本都有支持,Llama、Qwen、Mistral、Gemma、Phi等等
在这里插入图片描述

版本

本身开源(Free),同样也支持企业级操作,费用见下图
在这里插入图片描述

Google Colab支持

Unsloth 开源版本可以安装在本地或像 Google Colab 这样的其他 GPU 服务中。大多数人通过 Google Colab 界面使用 Unsloth,它提供了一个免费的 GPU 来训练。

链接地址:https://docs.unsloth.ai/get-started/unsloth-notebooks
在这里插入图片描述
开源地址:https://github.com/unslothai/unsloth

可以点击里面的“start for free"直接开始你的微调工作。
在这里插入图片描述


http://www.mrgr.cn/news/1190.html

相关文章:

  • Mojo 集合list的详解及相关说明
  • pycharm2023.1破解
  • 责任链设计模式
  • 【python数据分析08】——Pandas统计分析(读/写不同数据源的数据)
  • 【体检】程序人生之健康检查,全身体检与预防疫苗,五大传染病普筛,基因检测等
  • 手机使用技巧:如何恢复Android手机不见的短信
  • C++--map和set
  • 桶射巡飞无人机技术详解
  • 解析已有架构+文心快码(Baidu Comate)软件架构
  • Java二十三种设计模式-中介者模式(22/23)
  • 【Rust光年纪】深度剖析Rust数据科学库:统计分析、概率可视化和回归分析应有尽有
  • dockerfile
  • JavaScript - Ajax
  • 微信小程序骨架屏
  • 前端post传入拿到数据,后端报null,并且能够添加或者编辑成功
  • CreateFile()逻辑梳理(二)
  • stl---vector
  • 工业三防平板在数字化工厂建设中的重要趋势
  • 【Linux入门】Linux常见指令
  • SpinalHDL之spinal.core 组件(下篇)