第一章_机器学习概述_03.机器学习_算法分类
一、有监督学习 & 无监督学习
有监督学习:输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的。
无监督学习:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系。
二、有监督分类问题 & 回归问题
三、半监督学习
工作原理:
1、让专家标注少量数据,利用已经标记的数据(也就是带有类标签)训练出一个模型
2、再利用该模型去套用未标记的数据
3、通过询问领域专家分类结果与模型分类结果做对比,从而对模型做进一步改善和提高
思考有什么好处?半监督学习方式可大幅降低标记成本
四、强化学习
1、强化学习(Reinforcement Learning):机器学习的一个重要分支
2、应用场景:里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景
3、 基本原理:通过构建四个要素:agent,环境状态,行动,奖励,agent根据环境状态进行行动获得最多的累计奖励。
强化学习:寻找最短路径(最优解),以便获得最多的奖励。
