初始化步骤

1、对数据进行预处理操作。
2、先得到所有的特征个数。
3、初始化。

然后呢在咱们这个你看整体的项目当中啊
这一块还有叫做一个ut
就是这个linur regression
它是我新建的
就是咱当前这个空的
然后呢下面有一个youtus当中有一个features
我们简单给大家来点开看一下fisher当中啊

有一个就是啊训练当中的预处理的一部
这一步啊
咱直接给他拿过来去做就可以了
这一步很简单
一会儿跟大家简单说一下
所以说我们在这里还得把我们数据处理这个文件
就是features当中我的一个预处理给它导进来
一会儿给大家演示一下
就这一步当中他每一步做了一件什么事儿
咱现在在写算法当中
我们暂时也用不到
直接给导进来就可以了
嗯看一下它的一个目录结构
我们应该符合什么
它第一个是ut当中
ut当中什么
它是一个ut里边看的目录
几个括号是点features吧
所以在这里我去点features一下
在feature当中就是你用哪个
你倒进哪个就可以了
咱用的是这个吧
就是它的一个预处理
我直接把它复制过来
把它先给它跑
就多了一个import
把它导进来
一会儿呢咱用它来做一个预处理
接下来就是我要去啊构建这个线性回归了
咱们不是说之前这个咱们刚才不是说啊
这个线性回归当中要计算很多模块吗
所以说啊咱以后要丰富的一个内容比较多的定义成一个类

在这里啊
咱们就要一步一步完成纤维当中所有的知识点了
嗯咱们先给它定义一个类吧啊linear regression
在这里就是我们得想一下
在第一步当中
我们肯定要进行一个初始化操作
初始化里边我们需要先创建什么
先传建一会儿呢
咱们要用到的一些值了
先想一想吧
一会儿咱就用什么
首先你要做这个线回归
你最少得有什么
你最少得有个数据吧
数据啊就是我的一个features
我的各个列特征
所以说我先把data传进来啊
一会儿我们会拿一个实际数据集来大家演示
然后咱们现在先来完成这样一个线性模块
我有数据
有数据完之后呢
我当前这个东西啊它是什么
咱们是一个有监督任务吧
所以说啊不光我有一个数据
我还有一个标签
刚才在那个你看这里
但是这里我们在这一块
你看它有一个叫做pommel迪克
还有一个呃就是非线性变换的一种方法
这个咱们暂时先拿过来
一会儿等用
到时候会给大家再一个个详细的解释
第一步就是我们构建一个基本线回应模型当中
我们现在用不到
为了使得咱一会儿的整理模型能够复现的更容易些啊
所以说我这块先写的完善一些
这样吧
咱们既然是先不用
我就先给它制成零吧
零就代表我们先不用
大家先不用去管
等后续咱们用到时候给大家一个解释
其中啊他做了一件什么事儿
然后看这里还没有什么哦
还有一个就是标准就是预处理
预处理咱也指定了处置
默认情况下就是数据来之后
我们是要经过一个预处理操作的
这里就是我们的一个初始化函数出来
还是当中我需要把我所有的值都传进来了
第一步咱们来看吧
我们要干什么
你不是在这里传数据了吗
那是不是要对我数据先进行一个预处理操作
预处理操作过程当中
我们需要把当前的一个data以及呢我直接插入复制吧
看这里边需要什么东西
我全复制过来就行了
就是前三个拿过来就可以了
在这里我这个data要不要对数据做一些额外的变换
咱先默认它是不做一些玩的变化
这个传进来默认情况下咱先不做一些关系电话
等咱们用到时候带大家去说
然后他做完之后
它还会有一些返回值
返回值当中啊
这样我给大家写一下
其中啊它其实有这样的一些返回值
反之当中我们来讲当前做完之后来看这里吧
直接把它反应值拿过去就行了
这几个值这个值分别表示这就是预处理完之后的一个结果
给大家解释一下
呃这样吧这样来看
要不然看着不是特别清晰
data process就是我们预处理完之后的一个数据
相当于啊咱做完这个标准化之后得到的一个结果
然后这个fishmir还有一个sp值
它就是当我们用一个标准化操作之后
我们会得到当前的一个命值
还有它的一个标准差
这些是咱们一会儿要拿到手去用的啊
就是现在用不用可能还不太一定
因为一会儿呢我们在测试过程当中可能还会用到这些纸
咱先把它都拿到手
这是我第一步先做了一个预处理的一个操作
做完一术语之后
接下来我们是不是得把当前的一个data进行更新啊
当前的一个data就是我预处理完之后的数据了
在训练的时候就是全部是用我预处理完之后的一个结果
当做的一个训练数据的
然后呢标签我的标签它是不会发生变化的
所以说啊咱这里labels直接把它拿过来就可以了
labels不会发生变化
然后下一个下一个当中啊
就是咱们想一想一共需要哪些值啊
刚才我也说了
这里这些先拿到手吧
这样先把都复制过来吧
咱一块儿拿好多个这个features man
然后等于直接把哪里可以
然后呢我的一个st地址也拿过来
下面还有哪些值啊
下面就是咱们刚才说的
要不要做这些变换
我先给它拿过来
都等于当前传递参数就可以了
等于我当前传进来的一个参数
然后最后一个就是我的一个要不要去做这样归一化别的传进来
咱一会儿没准还都能用上
然后接下来接下来就是我要去构建我的一个c参数了
在这里大家可以想先想一想
就是咱们的一个题的参数
它是一共有多少个呢
劫财入他的一个数应该是跟我们特征的个数是完全一一对应起来的吧
这个没问题吧
相当于就是参数它有多少个
咱的一个c它就有多少个
所以说第一我在这里哦
我得先算一下咱们的一个number features这块写一下吧
number我的一个feature feature等于什么
我的data
你看一下我这个data data当中啊
他是不是说可以算他的一个shape值啊
点shape一下
点shift完之后就是行和列
我们需要我们需要什么
我需要的是他的一个点吧
因为我不光我不需要知道多少样本
但是我现在需要知道多少特征吧
所以这feature当中我第一个index值是一inde是一表示我有多少个列
然后呢我要定一个c特值
c值是不是我们最终要求解的一个参数值
c值它的个数等于什么个数
是跟我这个feature的个数是一对应的吧
所以说咱先给他来一个初始化吧
npc zero初始化当中啊
就是它的构建成一个矩阵的格式
矩阵格式当中它的是跟我features是一模一样的
这样我是不是就完成了
咱当前的一个就是因内函数当中所有的一个步骤了
还把我的一个特征的个数
以及我c它它的一个规格全部给它列出来了
好在这里啊
咱们可以先做一个简单的注释啊
写一下我们今天还是当初做哪些事儿呃
对我们的数据
第一步对数据进行预处理操作啊
这第一步第二步呢我要先去先得到啊
所有的呃就是先得到所有吧
得到所有的特征个数
然后第三步初始化
初始化咱们的那个呃几个参数矩阵
参数矩阵啊
这就可以了
这里我们主要完成这三个步骤

发表评论

邮箱地址不会被公开。 必填项已用*标注