当前位置: 首页 > news >正文

数据集中valid的作用

简单来说,valid(或 val)文件夹的存在是为了在模型训练过程中,定期、独立地评估模型的性能,以便进行模型调优、防止过拟合和选择最佳模型。它是机器学习工作流中至关重要的一环。

一般的数据集结构:

image

1. Train(训练集)

  • 目的:这是模型“学习”所用的主要数据。模型通过反复查看这些图片和对应的标签,来调整其内部的权重和参数,学习如何从图片中识别出目标(比如,猫、狗、汽车等)。

  • 类比:就像学生的教科书和课堂练习。学生通过反复学习和做书后习题来掌握知识点。

2. Valid / Val(验证集)

这是你问题的核心。它的作用非常关键:

  • 目的1:实时评估训练效果:在训练过程中,每训练完一定的轮数(epoch),程序就会自动拿当前的模型去验证集上跑一遍,计算准确率、召回率、mAP等指标。这样你就能看到模型在“未见过的”数据上表现如何。

  • 目的2:防止过拟合(Overfitting):如果模型只在训练集上表现越来越好,而在验证集上表现开始变差,这就意味着模型可能“过拟合”了。它只是死记硬背了训练集中的噪声和细节,而没有学到通用的特征。验证集是发现过拟合的“警报器”。

  • 目的3:超参数调优:你可以根据验证集的表现来调整模型的超参数(如学习率、批大小等),从而找到一组最优的参数配置。

  • 目的4:选择最佳模型:训练通常会保存多个时间点的模型权重(best.ptlast.pt)。那个在验证集上表现最好的模型(best.pt)通常会被认为是最终的最佳模型。

  • 类比:就像学校的月考/模拟考。它的目的不是打分排名,而是为了检查学生一段时间的学习效果,发现知识薄弱点,以便老师和学生及时调整接下来的教学和学习计划。题目是新的,但考试范围是学过的。

3. Test(测试集)

  • 目的:这是对模型的最终考核。它只在整个训练过程完全结束后使用一次。你用挑选出来的最佳模型(基于验证集性能选出的)在测试集上运行,得到的性能指标(如mAP)才被认为是模型真正的、 unbiased(无偏) 的泛化能力指标。

  • 关键要求:测试集在训练和调参过程中必须完全被隔离,绝对不能以任何形式被模型“看到”或用于调整参数。否则,测试结果就会变得乐观而不真实。

  • 类比:就像最终的高考。学生不能提前知道考题,考完也不能再回去复习了。这次考试的成绩决定了最终能上什么大学。

 

为什么需要三者分离?

想象一下如果只有训练集和测试集:
你训练模型后,直接去测试集上测试,发现成绩不好。于是你回去调整模型参数,再来测试集上看结果……如此反复,你的模型实际上已经在不知不觉中针对测试集进行了优化(“作弊”了)。这个模型在测试集上可能表现很好,但拿到真实世界中面对全新的数据时,性能可能会大幅下降。

验证集的存在就打破了这种循环,它提供了一个独立的、用于开发和调试模型的基准。

 

总结对比

 
 
数据集 英文 作用 类比
训练集 Training Set 用于模型学习,调整模型参数 教科书和课堂练习
验证集 Validation/Valid Set 用于模型开发,调超参、防过拟合、选模型 月考和模拟考
测试集 Test Set 用于最终评估,报告模型的真实泛化能力 最终高考

 

那我们如何开始训练呢?

第一步:组织数据目录

确保你的数据按照如下结构摆放。假设你的项目根目录是 yolov11_project/

image

最佳实践

  • 使用相对路径而不是绝对路径,这样你的代码更容易移植。

  • trainvaltest 文件夹下的 images 和 labels 中的文件必须一一对应(除了扩展名)。例如:

    • train/images/0001.jpg -> train/labels/0001.txt

    • valid/images/0002.jpg -> valid/labels/0002.txt

 

第二步:创建数据集配置文件

这是最重要的一步。你需要在项目的某个位置(例如在 yolov11_project/ 下)创建一个 .yaml 文件(例如 data/my_custom_dataset.yaml)。

文件内容如下:

# 数据集的路径(相对于启动训练命令的位置)
path: ../datasets/my_custom_dataset  # 数据集根目录
train: train/images  # 训练集路径,相对于 'path'
val: valid/images    # 验证集路径,相对于 'path'
test: test/images    # 【可选】测试集路径,相对于 'path'# 类别数量
nc: 3  # 替换为你的数据集中目标类别的数量(例如:人、车、交通灯则 nc=3)# 类别名称列表
names: 0: person    # 类别0的名称1: car       # 类别1的名称2: traffic_light # 类别2的名称# ... 根据你的nc数量继续添加

第三步:启动训练

在命令行中,进入你的YOLO代码目录(yolov11/),然后运行训练命令。

# 切换到YOLO代码目录
cd yolov11_project/yolov11# 开始训练
python train.py \--data ../data/my_custom_dataset.yaml \--weights yolov11s.pt \--epochs 100 \--img 640

训练过程中会发生什么

  • 程序会读取 train 文件夹的数据进行模型权重更新。

  • 每个epoch结束后,程序会自动在 valid 文件夹的数据上验证性能,并计算mAP等指标。

  • 训练日志和模型权重会保存在 runs/train/exp/ 目录(每次训练会新建一个 expN 文件夹)。

  • 训练结束后,最佳模型会保存为 runs/train/exp/weights/best.pt

第四步:进行最终测试(可选但强烈推荐)

训练完成后,你应该用从未参与过训练和调参的 test 集来评估最佳模型的真实性能。

python val.py \--data ../data/my_custom_dataset.yaml \--weights runs/train/exp/weights/best.pt \--task test # 明确指定任务为测试
  • --weights runs/train/exp/weights/best.pt: 指定你要测试的模型权重(上一步得到的最佳模型)。

  • --task test: 告诉程序使用数据集配置文件里 test 路径下的数据。如果不加这个参数,默认会使用 val 集。

运行后,程序会输出模型在测试集上的详细指标(mAP, precision, recall等),这才是对你模型泛化能力的最终评价。

总结

  1. 摆好数据:按标准结构放置 trainvalidtest

  2. 写配置文件:创建 .yaml 文件,正确指定路径和类别信息。

  3. 开始训练:使用 train.py 并通过 --data 参数引用你的配置文件。模型会在 train 上学习,在 valid 上验证。

  4. 最终测试:使用 val.py 并指定 --task test,在 test 集上评估 best.pt 模型。

遵循这个流程,你就能科学、正确地利用好数据集中的每一个部分。

http://www.wxhsa.cn/company.asp?id=6861

相关文章:

  • 深入 RocketMQ 核心源码:从环境搭建到高可用设计的全方位解析
  • 单例模式
  • apache修改默认位置
  • 实用指南:YOLOv11的旋转目标检测改进-(扩展检测头支持旋转框预测,适配遥感场景)
  • 从零到顶会:NLP科研实战手册 - 实践
  • 肝不好能喝酒吗
  • ROS中如何将日志格式设置为行号的形式
  • USB相关的sysfs文件(重要的)【转】
  • 25上第一周
  • 深入解析:RxJava在Android中的应用
  • 模型选择与配置说明
  • 梯度下降算法
  • 002_文本分类任务的问答
  • 车牌识别
  • 告别人工标注瓶颈!Reward-RAG:用 CriticGPT 打造更懂人类偏好的检索模型
  • Latex 中百分号怎么打
  • 文件上传-条件竞争绕过
  • 文件包含漏洞
  • 9.17 CSP-S模拟23/多校A层冲刺NOIP2024模拟赛19 改题记录
  • Java基本语法
  • 在AI技术快速实现创想的时代,挖掘前端学习新需求成为关键——某知名编程教育平台需求洞察
  • 负载均衡层详解part3-lvs
  • 4. MySQL 索引优化实战
  • 算法课第一周作业
  • 线段树懒标记模板
  • 谁在我这位置遗留或丢失了一颗口罩爆珠(好像是桃子味)?
  • python小计划——学生管理系统
  • C++ 并发
  • UML 5章
  • 《微服务事务管理》 - 教程