当前位置: 首页 > news >正文

pytorch入门(1)——pytorch加载数据初认识

环境配置及其安装:

2023最新pytorch安装(超详细版)-CSDN博客

pytorch加载数据初认识

  • Dataset:创建可被Pytorch使用的数据集

提供一种方式获取数据及其label

  • Dataloader:向模型传递数据

为网络提供不同的数据形式

代码实战

蚂蚁蜜蜂/练手数据集:链接: https://pan.baidu.com/s/1jZoTmoFzaTLWh4lKBHVbEA 密码: 5suq

train为训练集,val为测试集,可以看到ants里蚂蚁的图片,bees里是蜜蜂的图片

from torch.utils.data import Dataset
from PIL import Image
import osclass MyData(Dataset):def __init__(self, root_dir, label_dir):self.root_dir = root_dirself.label_dir = label_dirself.path = os.path.join(self.root_dir, self.label_dir)# 函数是os模块中的一个重要函数,用于获取指定目录下的所有文件和子目录。self.image_path = os.listdir(self.path)def __getitem__(self, idx):img_name = self.image_path[idx]img_item_path = os.path.join(self.root_dir, self.label_dir,img_name)img = Image.open(img_item_path)label = self.label_dirreturn img, labeldef __len__(self):return len(self.image_path)root_dir = "hymenoptera_data/train"
ants_label_dir = "ants"
bees_label_dir = "ants"
ants_dataset = MyData(root_dir, ants_label_dir)
bees_dataset = MyData(root_dir, bees_label_dir)
train_dataset = ants_dataset + bees_dataset


http://www.mrgr.cn/news/26056.html

相关文章:

  • 高并发内存池项目(5)——实现PageCache
  • IDEA 怎么编辑文件模板
  • 使用 PyTorch 从头开始​​构建您自己的 Llama 3 架构
  • 探讨基于AI技术的相亲交友系统设计与实现
  • nlohmann::json中有中文时调用dump转string抛出异常的问题
  • 3.大语言模型LLM的公开资源(API、语料库、算法库)
  • 1688商品详情API返回值中的售后保障与服务信息
  • 【限流算法】常见的限流算法有哪些,怎么做限流操作
  • Bio-Linux-shell详解-1-从0开始
  • 基于Prometheus和Grafana的现代服务器监控体系构建
  • 回顾解析:Mirai僵尸网络及其持续威胁
  • Boot header格式描述详细信息。CSU DMA用于数据传输。安全流开关允许数据移动。PL配置通过PCAP接口。PL bit流包含设备配置数据。
  • 隧道代理IP的去重计算与应用探索
  • java 通过文件下载地址读取文件内容
  • CSP 2023 提高级第一轮单项选择题解析
  • linux系统管理面板1panel
  • 配多少?现货黄金个性化投资方案
  • 65. 不用加减乘除做加法【难】
  • 场外个股期权是不是也不会爆仓?
  • python学习第十节:爬虫基于requests库的方法