当前位置: 首页 > news >正文

day43

1. Dataset 类的__getitem__和__len__方法
Dataset是 PyTorch 中封装数据的抽象类,需自定义子类并实现两个核心方法。
__len__():返回数据集的总样本数(告诉Dataloader数据集有多大);
__getitem__(idx):根据索引idx返回对应的样本(特征 + 标签),支持按索引取数据。

2. Dataloader 类
Dataloader是 PyTorch 中加载数据的工具,基于Dataset实现。
功能:批量加载数据、打乱数据、多线程加载
核心参数:
dataset:传入自定义的Dataset对象;
batch_size:每个批次的样本数;
shuffle:是否打乱数据(训练集设为True,测试集设为False);
num_workers:多线程加载的进程数(加速数据读取)。

3. MNIST 手写数据集
MNIST 是手写数字图像数据集,常用于图像分类入门,PyTorch 中可通过torchvision.datasets.MNIST直接加载。

作业:

CIFAR 数据集介绍
CIFAR 是彩色图像分类数据集,分为 CIFAR-10(10 个类别)和 CIFAR-100(100 个类别):
CIFAR-10 包含:飞机、汽车、鸟、猫等 10 类物体;
图像规格:32×32 像素的彩色图(3 通道:RGB);
数据量:50000 张训练图、10000 张测试图。

@浙大疏锦行

http://www.jsqmd.com/news/190940/

相关文章:

  • 智能图书馆管理系统完整部署指南:10分钟快速搭建教程
  • OpCore Simplify:新手必学的Hackintosh配置完整攻略
  • electron-egg桌面应用开发:从零构建企业级跨平台解决方案
  • Flux.1 Kontext Dev:本地化AI图像生成的革命性开源解决方案
  • FlashAI通义千问大模型本地部署终极指南:零基础快速上手
  • Qwen-Image-Edit-Rapid-AIO V18:新手也能掌握的AI图像编辑终极指南
  • CSDN官网技术问答精选:关于IndexTTS2常见问题解答
  • 使用树莓派摄像头搭建视频流服务的深度剖析
  • Typora官网主题美化提升撰写IndexTTS2技术文档体验
  • Bloxstrap玩家进阶手册:解锁Roblox隐藏体验的终极工具箱
  • UltraISO注册码最新版哪里找?不如用它刻录IndexTTS2启动盘
  • js-xss安全防护终极指南:从零构建企业级XSS防护体系
  • Internet Archive下载器完整使用手册:轻松保存数字图书馆资源
  • 联想拯救者BIOS隐藏功能深度解锁:3个步骤释放硬件全部潜能
  • DLSS-Enabler完整使用指南:让非NVIDIA显卡也能享受DLSS黑科技
  • ComfyUI-TeaCache缓存加速技术全面指南
  • OpCore Simplify:智能EFI配置解决方案,让黑苹果安装不再复杂
  • 智能动作识别系统:5分钟掌握实时人体姿态分析核心技术
  • 物联网网络驱动库快速上手指南:构建稳定可靠的嵌入式网络应用
  • Three.js可视化+IndexTTS2语音驱动,构建三维数字人对话场景
  • UltraISO网络启动功能实现IndexTTS2无盘工作站部署
  • 下一代AI开发范式革命:PaddleX如何重构企业智能化转型路径
  • 微信小程序开发扫码登录授权访问IndexTTS2个人中心
  • Three.js加载3D角色模型并绑定IndexTTS2语音口型动画
  • 微信小程序开发实时语音识别对接IndexTTS2回复系统
  • 处理AI音乐深度技术详解《AU 把 AI 音乐拉回人间》第一章Spectral详解(卓伊凡)
  • SeedVR2-7B视频修复终极指南:从零开始的完整教程
  • NetSuite ERP系统集成IndexTTS2生成财务语音日志
  • Typora官网写作神器搭配IndexTTS2,边写边听文稿效果
  • OpCore Simplify:三分钟完成黑苹果EFI配置的终极指南