当前位置: 首页 > news >正文

nlp时序模型股价预测的基本思路(持续更新)

我觉得在学习时序预测的时候应该先了解它的思路
1.获取数据(很重要)
个人认为获取数据,包括数据的质量,类型,维度,以及精度,对我们模型的训练都十分重要。

2.数据划分
为什么要单独列出来,因为一般都是先划分完数据集再进行标准化,不然先标准化再划分会造成数据泄露。因为我们没有把我们所要去预测的那一列(label)去剔除,所以我们标准化的时候取值会把我们要预测的哪一列特征(label)带进去,这下就会造成数据泄露

3.标准化(归一化)
标准化的类型有哪些?
最常用的是最大最小均值归一化。
请大家理解 train,val, test这三个集合的区别后在看。
注意的是train集和val集要分别标准化,但是我们的test集不用标准化,因为我们得到通过标准化得到我们预测后的数据,再和我们的test集的数据进行对比,进行性能评估。
对于损失函数我们预测用mse,分类用交叉熵

4.创建参数和对应的自定义数据集
也就是我们的模型能看到以前多少条数据。也就是seq_len,拿informer为例子就是多少天的数据,比如32就是一个月,64两个月,拿这两个月去预测我们未来多少天的数据。相当于pre_len。通过这些参数我们去创建滑框数据。

5.正式的创建训练模型测试
但是要注意的是,就是在自己的loss计算的时候自己的维度要对齐进行参数计算,比如我用五天数据预测后1天的数据,那么你传入训练的时候应该要遮住前五天的数据进行取值,然后验证的时候需要取后五天进行算测试。


http://www.mrgr.cn/news/12137.html

相关文章:

  • Python网络爬虫模拟登录与验证解析
  • 【3.3】贪心算法-解分发糖果
  • Apache Doris 使用 CBO 和 RBO 结合的优化策略
  • 此站点的连接不安全,解决方法
  • Sentinel-1 Level 1数据处理的详细算法定义(七)
  • 基于Vue3和Node.js的完整增删改查项目实现教程:从后端封装到前端调用
  • WHAT - 通过 react-use 源码学习 React
  • 配电房挂轨机器人巡检系统的主要优点包括
  • 足球数据分析-基于机器学习的足球比赛角球数预测模型构建
  • 前端:html+css:伪类画箭头(实心)
  • 中资优配:金融审计进入“主审+参审”新模式
  • 使用go实现TCP服务器
  • 【算法进阶2-动态规划】最长公共子序列、欧几里得算法-分数、RSA算法-密码于加密
  • Python3.11使用labelimg
  • [Jsprit] Jsprit学习笔记-核心算法VehicleRoutingAlgorithm
  • 代码随想录第十九天 | 110.平衡二叉树,257. 二叉树的所有路径,404.左叶子之和,222. 完全二叉树的节点个数
  • API网关之Kong
  • 【Electron】桌面应用开发启动直接打开一个网址或者浏览器打开一个网址
  • 【CSS】border-image 样式不生效 - 和谷歌浏览器版本有关系 - 谷歌 80 版本边框图片样式失效问题
  • pgsql导入导出数据