当前位置：首页 > news >正文

开源模型应用落地-qwen2-7b-instruct-LoRA微调合并-ms-swift-单机单卡-V100（十三）

news 2025/7/4 10:54:46

一、前言

本篇文章将使用ms-swift去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

二、术语介绍

2.1. LoRA微调

LoRA (Low-Rank Adaptation) 用于微调大型语言模型 (LLM)。是一种有效的自适应策略，它不会引入额外的推理延迟，并在保持模型质量的同时显着减少下游任务的可训练参数数量。

2.2.参数高效微调(PEFT)

仅微调少量 (额外) 模型参数，同时冻结预训练 LLM 的大部分参数，从而大大降低了计算和存储成本。

2.3.Qwen2-7B-Instruct

是通义千问 Qwen2 系列中的一个指令微调模型。它在 Qwen2-7B 的基础上进行了指令微调，以提高模型在特定任务上的性能。

Qwen2-7B-Instruct 具有以下特点：

强大的性能：在多个基准测试中，Qwen2-7B-Instruct 的性能可与 Llama-3-70B-Instruct 相匹敌。
代码和数学能力提升：得益于高质量的数据和指令微调，Qwen2-7B-Instruct 在数学和代码能力上实现了飞升。

http://www.mrgr.cn/news/15885.html

相关文章：

【面试经验】美团实习时mentor讲的面试技巧

Keil5 Debug模式Watch窗口添加的监控变量被自动清除

算法day16(补第15天)|用递归方法求解：513.找树左下角的值

★ 算法OJ题 ★ 力扣11 - 盛水最多的容器

SpringBoot SSM vue在线作业考试系统

vue子组件样式影响父组件

使用 ip addr add 命令管理网络接口 IP 地址

解题-写一个程序判断当前机器的大小端存储模式 #两种方法

SpringCloud乐尚代驾学习笔记：司机端登录（四）

【化学方程式配平 / 3】

笔记：应用Visual Studio Profiler分析CPU使用情况

Python数据分析的数据导入和导出

「数组」二分查找模版|二段性分析|恢复二段性/ LeetCode 35|33|81（C++）

Python中的“break”与“continue”：控制循环的艺术

DDR test Tool for imx9

【Python篇】Python 类和对象：详细讲解（上篇）

生产环境中变态开启devtools（强制）

classA cla= ...； if(cla == nullptr) 这种写法是否安全

远程教学必备神器：热门远程控制软件大盘点

Vue3.0教程001：Vue3简介