跳到主要内容

机器学习

定义和概念

Arthur Samuel (1959): 研究如何给计算机以学习的能力使得不需要显式编程。

Tom Mitchell (1998): 我们说程序从经验 E 中学习了,如果它在某个任务 T 的某个度量 P 上的表现比未接触经验 E 时要好。

我们称样本是希望机器学习系统处理的对象,每个样本的实例可以表示成一个向量 x,它的每一个元素是一个特征。

监督学习

监督学习 给定含有若干个样本的数据集,每个样本的特征为 \x\x 且有对应的标签 \y\y ,从中学习概率分布函数 p(\y\x)p(\y|\x)

  • 回归:连续标签值
  • 分类:离散标签值

特征的选取需要我们对原始数据进行选择和加工,将其变成特征提供给机器学习模型。

无监督学习

无监督学习 给定含有若干个样本的数据集,每个样本的特征为 \x\x,从中学习概率分布函数 p(\x)p(\x)

强化学习

强化学习 给学习算法一个规则和目标并让算法通过主动探索寻找达到目标的最佳策略。