1. 集中趋势衡量
(1)理解以下名词:平均值(),中位数,众数
(2)方差, 标准差s
2. 回归(regression)与分类(classification)
回归:Y变量为连续数值型(continuous numerical variable),例如房价。 如线性回归解决问题
分类:Y变量为类别型(category variable),例如颜色类别。 注意,逻辑回归是分类问题
3. 简单线性回归(simple linear regression)
回归分析用来建立方程模拟两个或者多个变量之间的关系。被预测的变量(y)被称为因变量(dependent variable),
被用来进行预测的变量叫做自变量(indecent variable)
简单线性回归包含一个自变量和一个因变量,且二者的关系使用一条直线来模拟
4. 简单线性回归模型
, 其中是偏差
简单线性回归方程:
, 参数本别是截距和斜率。 方程对应的直线称作回归线
使用线性回归就是要根据数据求得两个参数的过程。
5. 关于偏差
(1)是随机的变量,均值为0;(2)其方差对所有x都一样 (3)是独立的 (4)正态分布
6. 参数确定
根据训练数据确定参数时,多采用平方差的和最小的评价方法
可以得到如下结果:
,
7. 简单的例子
https://github.com/liuleigit/ML_tutorial/SLR
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/7419.html