统计学习方法的基本概念

1. 输入空间和输出空间

  • 输入和输出所有可能取值的集合。通常输出空间小于输入空间(感觉并不一定)。
  • 每个具体的输入是一个实例,通常由特征向量表示,所有特征向量的集合被称为特征空间

2. 特征空间

  • 每一维对应于一个特征
  • 可以与输入空间相同,也可以不同,模型实际上都是定义在特征空间上的。

3.回归问题,分类问题和标注问题

  • 回归问题:输入变量与输出变量均为连续变量的预测问题(明天天气)
  • 分类问题:输出变量为有限个离散变量的预测问题(打标签,把用户分类)
  • 标注问题:输入变量与输出变量均为变量序列的预测问题(?)

4.联合概率分布(监督学习关于数据的基本假设之一)

监督学习假设输入和输出的随机变量是遵循联合概率分布P(X,Y)【分布(密度)函数】独立同分布产生的。

5.假设空间

一个由输入到输出的映射,写作P(y|x)或y=f(x)