第一章_机器学习概述_05.机器学习_特征工程介绍
一、特征工程概念入门
1、特征
2、特征工程
特征工程:利用专业背景知识和技巧处理数据,让机器学习算法效果最好。
二、特征工程涉及概念
1、特征提取
原始数据中提取与任务相关的特征,构成特征向量
2、特征预处理
特征对模型产生影响;因量纲问题,有些特征对模型影响大、有些影响小
特征预处理包括:归一化、标准化(掌握)
归一化:(当前值 - 最小值)/(最大值 - 最小值)
3、特征降维
将原始数据的维度降低,叫做特征降维,一般会对原始数据产生影响
4、特征选择
原始数据特征很多,与任务相关是其中一个特征集合子集,不会改变原数据
5、特征组合
把多个的特征合并成一个特征。利用乘法或加法来完成
