当前位置: 首页 > news >正文

LLama3技术报告笔记(垂直能力)

3.4.1 代码能力

典型应用:Copilot; Codex;

多任务:代码生成;写文档;debug;code review;

多语种:Python, Java, JavaScript, C/C++,... , HTML/CSS, SQL, bash/shell

1. Code专家模型

从预训练模型分支出来,加入1T token的混合数据(code占比85%),做continue-pretraining;

使用CodeLlama的配方;最后数千个steps改用long-context微调(16K窗口);最后,使用code占比高的数据,做SFT+DPO对齐训练;

用途:为主模型,做rejection-sampling;

2. 数据生成

痛点:follow指令;代码语法错误;生成错误的代码;fix bug;

自动生成了270万个样本,用来作SFT;

2.1 带feedback的代码生成

研究表明,用自己模型生成的代码,再训练自己模型,效果不变好反变差;因此,这里引入feedback,让模型从自己的错误中学到东西,回到正轨;


http://www.mrgr.cn/news/12321.html

相关文章:

  • Angr CTF Part 1
  • Kakfa的核心概念-Replica副本(kafka创建topic并指定分区和副本的两种方式)
  • [笔记]中间件基础 - 进一步阅读的扩展点
  • Numpy常用内置函数及运算函数
  • css基础学习总结(一)
  • 灵神算法题单——滑动窗口(求子数组个数)
  • 人工智能以纳米级精度检测癌症和病毒感染
  • 使用rqt_console和roslaunch
  • 一键获取店铺商品:阿里巴巴API返回值详解
  • Redis的持久化
  • 【从问题中去学习k8s】k8s中的常见面试题(夯实理论基础)(二十)
  • 尚硅谷Java面试题第四季-Java基本功
  • linux命令之mkdir
  • WordNet介绍——一个英语词汇数据库
  • Vue3、Vite、Pinia基础学习
  • 【论文阅读】基于生成对抗网络的模型窃取方法的研究(2021)
  • docker基础到进阶
  • 【html+css 绚丽Loading】000021 万象轮回珠
  • EmguCV学习笔记 VB.Net 7.1 角点检测
  • 工厂模式与策略模式:理解与应用