【永利集团304com】CS229学习笔记,机器学习之模型表述

首先我们通过一些例子来讨论监督学习问题吧。假设我们有如下数据集:

本文是斯坦福机器学习课程2-1节的笔记,主要内容是对机器学习问题,如何进行建模表述?
在房价预测案例中,我们有一个数据集,包含某地住房价格。如下:

永利集团304com 1

永利集团304com 2

我们可以将上述数据集绘制成如下图所示:

永利集团304com,历史交易数据

永利集团304com 3

根据该数据集,我们可以在坐标图上画出相应的数据集。很自然的,我们要想预测该地区的房价,就是在该坐标图上求解一条直线或者曲线,而这条线会尽可能多的穿过历史交易数据的点。
在上述问题表述中,有几个常见的术语需要明确一下:房屋面积是数据的特征(feature),某一条历史交易数据都是一个训练样本(training
example),所有的历史交易数据叫做训练集(training set)。

那么我们如何根据这些数据集预测其他房屋的价格呢?

永利集团304com 4

为了今后更好地学习,以上例为例,我们将房屋面积定义为输入变量永利集团304com 5,其亦称为特征变量;将房屋价格定义为输出变量永利集团304com 6%7D),其亦称为目标变量;永利集团304com 7表示一个训练实例,其中上标永利集团304com 8表示第永利集团304com 9个训练实例;集合永利集团304com 10表示训练集,其中永利集团304com 11表示训练集的大小。

训练集

当然,我们也可使用永利集团304com 12表示输入变量空间,永利集团304com 13表示输出变量空间。在房屋价格此例中,永利集团304com 14

通过把训练集输入给学习算法,进而学习得到一个假设的
h,然后将要预测的房屋尺寸作为输入变量输入给
h,预测出该房屋的交易价格作为输出变量输出为结果,如下图所示:

发表评论

电子邮件地址不会被公开。 必填项已用*标注