机器学习算法 – 线性回归代码实现

1-线性回归整体模块概述

这节课咱们一起来动手去写一下
现在回归算法在我们写之前
先给大家捋一捋
咱们一会儿要做的一个整体流程长什么样子
首先呢当我们书记来之后
就是有了一份data来出去之后啊
第一步我肯定是要先对数据进行一个预处理的操作
预处理啊
比如说一些归一化或者标准化都可以啊
先让我们数据各个维度啊
它取值范围小一些
这是一个标准化的操作
然后呢接下来我们要做这个线性回归算法
你说啊这个线性回归算法要求什么
无非就是求了一下什么样的斯特跟我们的x组合完之后
它能够最拟合咱们的一个真实值吧
就是这样一个事儿吧
所以啊我们最终目的还是去求一下这个the这个奇特的个数啊
比如说你的数据它是个十尾的
那你的吉他呢就有sa 1 sa一直到sa 10
我需要分别把每一个特征
它对应的sa都完全求出来
怎么求这个咱们之前在讲那个原理过程当中
是不是说了我们的机群当中啊
它是一个优化的思想
用梯度下降可以进行这样一个优化吧
所以说我们要实现出来这样一个gd就是gradient descend
我们的t度下算法
在梯度下降确理过程当中啊
大家可以想一想
我们都需要哪些个指标啊
首先第一个很重要的就是我要需要一个损失值吧
至于损失值我去看一下当前这个石头唉
他跟我说句
钻完之后好不好
肯定是不够好吧
有一个loss值
我们需要这个lot值能够越低越好
所以说啊在这里我们就是通过就是qq下象当中的嘴
是指看一下什么叫死它是最合适的
然后呢不断的去修改这个值就可以了
在我们的ppt当中啊


就是这样一行
这里就是咱们之前讲的那个qq下降在地球想象当中啊
比如这里我们来看一下吧
我们最终其实要哪一部啊
前面咱们所有的推导这些啊都是为了方便大家理解的
当我们实际写代码的时候
我们只需要最后这一步就可以了
因为最后这一步相当于它是完成了整个的梯度下降计算过程当中
看一下这里啊我们都需要哪些指标
首先呢这个m分之一它是所有的样本的个数吧
有了数据之后
所有样本个数这个咱们能算吧
然后呢这个y y什么y它不就是我当前的那个真实值
因为咱们要做的是一个有监督任务吗
所以说我的一个标签值
这个也是我需要去做的
这是我的一个预测值
所以说一会儿呢我还要构建一个c的参数矩阵
我需要用c跟x把我的预测值求出来
这个xig它是我数据样本当中本来有的吧
所以说整体我们就需要这样一个框当中所有的点了
一会儿
等会把其中所有需要的计算值全部给它计算出来
整体上来说啊
咱的难度并不大
只要完成这样一个梯度下降算法
就能够把这个线回归给它宣传出来了
这个是我们的一个签合约当中基本的一个训练过程
然后呢一会儿啊咱们给大家演示过程当中呃
我们还要做一些额外实验
比如说现在呃我们拿到了一份数据
数据当中有多特征
那我只用其中一个特征得到的结果
那肯定是不好的
我肯定要做什么
肯定要拿多特征吧
在会场做了一个对比实验
我会把就是单个特征拿出来炫耀模型和多个特征拿出来炫耀模型
在代码上给大家演示一下
看一看我们整理流程该怎么去做
并且呢我们要观察实验
看一下最终对比结果是怎么样的
这是我们第一个实验
第二实验我们现在做线回归啊
基本上它确实就是一条线吧
比如一堆数据点在这样的分布的
然后呢我们训练出一条线
比如画一下这个蓝色的
最终呢我能得到要回归线
就是一条直线吧
那我们能不能得到一些曲线呢
比如这个任务显然曲线的拟合效果要比直线更好一些吧
我们能不能做一些非线性变换呢
也可以啊
一会儿给大家演示一下
在我们的现回流当中啊
怎么样去加入一个非线性因素
使得我们的回复方程能呈现出一种非线性的一个呃样子
这是我们第二实验
然后第三个实验
第三个实验当中要给大家对比的就是我们的特征
正常情况下是拿到原始的输入数据
完事了吧
我们能不能把特征再做得更复杂一些呢
嗯有一种变化方法叫做一个多项式特征变换

就是拿到原始数据特征之后
对原始数据特征再进行各种各样的变换
使得我们数据特征再丰富一些
最后呢在你和数据看一下咱得到的结果
所以说咱今天要做这个先回归
不光简直是简单的去实现一个现规算法
我们还要在一些这些数据集当当中给大家进行演示
不同的一种变化方法
不同的策略
咱得到效果分别长什么样子行了
然后刚给大家简单概述一下
一会儿才要完成的事
接下来呢就给大家一个模块
一个模块去完成一下
其中每一步我们要计算完成任务
首先导进来一下我们的工具包
第一个就是我们的男排
一会儿呢咱们肯定要进行矩阵计算吧
比如说在这个pp当中
我们对pp当中啊
你看看起来是什么
给大家的一个感觉
好像是诶
这是一个值
这也是一个值
这也是一个值
其实在实际阶段当中啊
我们不是一个值一个值计算啊
因为一个数一个数计算
你这个for循环要是嵌套起来太麻烦了
通常情况下我们都怎么办
我们都是以按照矩阵的方式来做计算的
所以说接下来我们所有的计算操作基本上都是一些矩阵的计算
这里呢咱们就要用到安排这个工具包的安排当中
咱们用矩阵去给它计算一下

发表评论

邮箱地址不会被公开。 必填项已用*标注