当前位置: 首页 > news >正文

[论文笔记] megatron 大模型超参搜索pipeline

一、批量生成配比

# 保证element + "en"的总体占比不变
# 从element_min_ratio到element_max_ratio,生成element在这个范围内的超参搜索配比。
import pandas as pd
import numpy as np
pd.set_option('display.max_colwidth', None)df = pd.read_csv("qwen2_data_ratio_lan17_dclm_code.csv", dtype={'dir': str, 'lang': str, 'size': float})
df_grouped = df.groupby(['lang']).sum().rename(columns={"size":"total_size"})
df_grouped.reset_index()initial_lang = ['en','zh','es','fr','pt','ko','ja','tr','vi','th','ms','id','ar','it','de','pl','ur','sft','edu'

http://www.mrgr.cn/news/11667.html

相关文章:

  • 博弈论详解 2(SG函数 和 SG定理)
  • 【负载均衡式在线OJ】oj_server模块
  • DNS详解
  • 国际业务产品系统应用架构设计
  • 零工市场小程序应该有什么功能?
  • 没有大海也能冲浪-带你学习尾波冲浪
  • 打卡学习Python爬虫第五天|使用Xpath爬取豆瓣电影评分
  • 流媒体协议分析
  • npm install报错解决记录
  • MySQL空间管理:查询、优化与碎片清理
  • 毕 业 设 计(论 文)远程接入企业网络规划与设计
  • 【Docker】安装Docker环境遇到的坑(VirtualBox)
  • 设计模式之简单工厂模式
  • npm镜像源报错 unexpected token >
  • zotero同步之infiniteCLOUD网盘 WebDAV
  • vue3组件封装系列-表格及分页-第二弹
  • word文档合并样式问题
  • 国产游戏行不行,主要还得“盘”商业模式!
  • 【Docker】Linux系统以及威联通QNAP部署思源笔记的通用教程
  • 一文读懂 DDD领域驱动设计