当前位置: 首页 > news >正文

AI自动采集教学行为——用AI来做机器学习部分和深度学习部分(含torch和cuda)包含机器学习模型和bert模型的使用

文章目录

  • 数据清洗
  • 机器学习
  • 深度学习
      • 代码没问题之后的文件下载
  • bert环境配置太麻烦 ,改用飞浆的bert
  • 飞浆失败-接着bert,用谷歌AI
  • bert的使用

数据清洗

要遍历当前文件夹下从1.x1sx8.x1sx的所有文件,
提取“句子”列,‘标注’列和‘上下文情境’这三列

按顺序把excel中的这三列拼接在一起。
合并输出成一个xlsx文件。

import os
import pandas as pd# 获取当前脚本所在的目录
current_directory = os.path.dirname(__file__)# 切换到脚本所在的目录
os.chdir(current_directory)# 定义文件名列表
file_names = [f"{i}.xlsx" for i in range(1, 5)]# 用于存储所有文件的数据
all_data = []
existing_files = []# 遍历所有文件并提取所需的三列
for file_name in file_names:if os.path.exists(file_name):  # 确保文件存在df = pd.read_excel(file_name)# 检查是否包含“句子”,“标注”和“上下文情境”列if all(col in df.columns for col in ['句子', '标注', '上下文情境']):required_columns = df[['句子&

http://www.mrgr.cn/news/15964.html

相关文章:

  • 计算机学习
  • python用波形显示udp数据实现一个模拟示波器
  • 事务的 ACID特性及如何保证的
  • SCI二区|吸血水蛭优化算法(BSLO)原理及实现【免费获取Matlab代码】
  • MFC工控项目实例之九选择下拉菜单主界面文本框显示菜单名
  • python办公自动化:使用`Python-PPTX`创建和操作表格
  • 【网络安全】打开这份“开学礼” 谨防骗子“冲业绩”
  • Docker私有镜像仓库Harbor安装并推拉镜像
  • 文本数据分析-(TF-IDF)(1)
  • 大语言模型算力优化策略:基于并行化技术的算力共享平台研究
  • 黑龙江等保测评流程
  • 内存泄漏是什么?发生在什么场景?如何解决?
  • 浏览器的高级搜索
  • 建模杂谈系列249 增量数据的正态分布拟合
  • 如何用GPT进行编程辅助?
  • 第十二章节 xxjob, seata, zk, minio,activeMQ进行 helm化
  • 生信软件32 - 变异位点危害性评估预测工具合集
  • WEB渗透Win提权篇-PrintNightmare
  • apisix 本地开发环境部署
  • 大模型企业应用落地系列》基于大模型的对话式推荐系统》对话推荐系统技术架构