当前位置：首页 > news >正文

机器学习 |1 模型评估

news 2026/6/16 10:05:00

1.经验误差与过拟合

经验误差/训练误差：误差指的是学习器输出的预测值与真实值之间的差距，经验误差是学习器在训练数据上的误差

泛化误差：学习器在新样本上的误差

过拟合与欠拟合：以前文中猫和狗的分类具体例子，假如学习器训练的很完美，能区分出每一根毛发，甚至看出每一根毛长成啥样，以此作为分类依据，我给它5000张图片，它直接给我设定了5000个特征，你不能说它错，但是它分的太仔细了。这个就是过拟合。学习器由于精度太高导致泛化性能下降。欠拟合指的就是，学的太粗糙。从分类器的角度来说，分类依据太少，可能仅以皮毛的颜色来区分猫和狗，当然不准确，就是欠拟合。

2.评估方法

为了评估学习器的性能，通常用测试集来测试学习器对新样本的判别能力，然后以测试集上的“测试误差”作为泛化误差的近似。但是为了测试误差的准确性，最好是测试集与训练集不重合，否则，在训练集上判别为正确的，在测试的过程中还会判别未正确，其实不利于评估。

从数据集中划分训练集和测试集，主要有以下三种做法：

三种划分方法

1.留出法

把D划分为两个互斥的集合S和T，分层采样，保持S和T中正例比例相同。大约2/3~4/5用作训练。

2.交叉验证法

将D划分为k个大小相同互斥的子集。每次选择k-1个训练，另一个测试，重复k次。最常用的k是10次。当k=m，为留一法。

3.自助法

包含m个样本的样本集D，随机抽取一个，放入D'，放回。重复执行m次。样本在m次中始终不被采集到的概率为(1-1/m)^m。（每次不被采集的概率为1-1/m) 当m趋向于无穷时，可以看作e^(m*ln(1-1/m)) = 1/e。

发布于 2026-04-26 00:16・北京

http://www.jsqmd.com/news/709049/

相关文章：

2026年昆明代理记账与工商变更全生命周期企业财税合规服务深度横评指南 - 企业名录优选推荐

只要中一个，就说明你已经找到了对抗加班文化的正确方法

【Linux】权限解析(从chmod到umask和粘滞位)

告别纯卷积！用Transformer给遥感图像变化检测‘瘦身’：BIT模型实战解析（附PyTorch代码）

IPATool深度解析：解锁iOS应用生态的终极命令行武器

全面掌握EPANET：开源水力水质模拟工具从入门到实战

AI期刊论文工具实测：审稿人不再批“文献太旧”“结构不对”，避坑投稿是什么体验？ - 逢君学术-AI论文写作

5分钟终极指南：如何用untrunc免费快速修复损坏的MP4/MOV视频文件

集成学习预测融合技术解析与实践

Element UI 2.x 自定义文件列表删除按钮的正确姿势：手动调用 handleRemove 方法

收藏｜2026年版Java程序员转型大模型完整指南，小白也能轻松入门

Audiveris乐谱识别完全指南：三步将纸质乐谱变为数字音乐

保姆级教程：在Ubuntu 20.04上为ROS Noetic配置MQTT客户端（含常见错误排查）

警惕口腔诊疗隐形风险！义乌王萍口腔：以合规院感守护每一次诊疗安全 - 速递信息

重新定义iOS应用获取：IPATool如何解决开发者的核心痛点

情绪即战力：重新定义职场高阶生存法则

汽车ECU诊断难题：如何用免费开源工具实现专业级解决方案

易投屏手机群控系统

C语言PLCopen适配开发黑盒揭秘：逆向分析CODESYS Runtime v3.5.14.20源码结构，提取可复用的State Machine与FB实例管理框架

PyTorch随机数生成实战：从torch.rand到randperm，新手避坑与进阶用法

注意力机制怎么选？实测对比YOLOv5中的C3CA、C3CBAM、C3ECA、C3SE模块性能差异

Element Plus终极指南：5个步骤打造专业级Vue 3企业应用界面

Elasticsearch高级搜索实战：多字段相关性得分融合技巧全解

从DVWA靶场到真实项目：手把手教你用PHP的htmlspecialchars函数彻底防御反射型XSS

PowerToys中文版：解锁Windows效率的魔法钥匙

给路由器开发者的笔记：搞定WiFi 5G (802.11ac/ax)欧盟CE认证，DFS测试这些坑别踩

用STM32的PWM驱动AT8870控制直流电机：从电平控制到精准调速的保姆级代码解析

自建AI智能体指挥中心：OpenClaw Dashboard架构与实战

ThinkPad T480黑苹果终极指南：让你的商务笔记本变身macOS工作站