编程知识
  • 编程日记
当前位置: 首页 > news >正文

AI学习记录 - PPO算法草稿

news 2025/7/1 13:00:06

returns

在这里插入图片描述
下面是两种方式生成returns的值,第一种好一点
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
delta计算方式不一样
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

通过一些计算方式,将未来的一些计算值,赋予到前面去,从而影响将前面的token和后面的token绑定到一起,从而实现每当生成一个tokend的时候,都会考虑到未来的token。
在这里插入图片描述

查看全文

http://www.mrgr.cn/news/93962.html

相关文章:

  • LiveCommunicationKit OC 实现
  • 力扣热题 100:二叉树专题进阶题解析(后7道)
  • 23种设计模式简介
  • Liunx(CentOS-6-x86_64)使用Nginx部署Vue项目
  • VUE3开发-9、axios前后端跨域问题解决方案
  • 英语学习(GitHub学到的分享)
  • 滑动窗口算法-day7(越长越合法子数组)
  • 18、函数的反柯里化
  • SpringMVC 基本概念与代码示例
  • 【git】 贮藏 stash
  • 《 C++ 点滴漫谈: 三十 》高手写 C++,参数这样传才高效!你真的用对了吗?
  • 【git】删除已加入 .gitignore却仍被git追踪的文件
  • 1分钟看懂React的那些Hook‘s
  • java每日精进 3.11 【多租户】
  • 【性能测试】Jmeter详细操作-小白使用手册(2)
  • win10安装部署DB-gpt,坑多
  • 【Linux docker】关于docker启动出错的解决方法。
  • git规范提交之commitizen conventional-changelog-cli 安装
  • cu118 安装vllm 极简教程 踩坑笔记
  • [pytest] 配置
  • 最新文章

    • Class00.1:数据操作+数据预处理
      Class00.1:数据操作+数据预处理
      2025/6/25 16:37:02
    • 【4目方案】基于海思3403平台开发4目360°全景拼接相机方案
      【4目方案】基于海思3403平台开发4目360°全景拼接相机方案
      2025/6/25 12:45:55
    • Windows部署Sonic前后端(详细版)
      Windows部署Sonic前后端(详细版)
      2025/6/23 18:25:17
    • 仅测角系统跟踪MATLAB实现,在修正椭圆坐标系MSC下的稳定跟踪算法
      仅测角系统跟踪MATLAB实现,在修正椭圆坐标系MSC下的稳定跟踪算法
      2025/6/23 2:04:54
    • 推进可解释人工智能迈向类人智能讨论总结分享
      推进可解释人工智能迈向类人智能讨论总结分享
      2025/6/23 1:57:42
    • 一、什么是生成式人工智能
      一、什么是生成式人工智能
      2025/6/22 14:03:11
    • 编程知识介绍
    • 商务合作
    • 免责声明

    CopyRight © 编程知识版权所有