线性回归实战准备

https://www.bilibili.com/video/BV1iS4y1z7JF?p=9

大家好,欢迎回到课程从零入门人工智能,在上一节课里面呢?昨天老师和大家分享了线性回归相关的知识,以及求解方法,还有它的一些案例。

它是本节课,我们就是要为我们这个线性回归的实战,就是说做准备,然后和大家分享实战相关的一些重要的知识点。”


好,我们直接进入本节课程的一个主要内容。首先向大家介绍一下我们去实现机器学习非常重要,非常强有力的一个工具,大家也经常听说的Scikit-learn,然后这个 Scikit-learn 它是专门针对机器学习,然后的一个应用,然后来开发出来的一个开源的框架。开源框架也就是我们说的算法库,有点类似于我们之前和大家介绍的,比如说numpy,pandas吧,它就是专门用来解决机器学习问题的,它通过这个 Scikit-learn 呢,我们可以实现一个数据的预处理,数据的分类,回归、降维、模型选择等非常常用的一些机器学习的算法和功能,可以说这个包是非常强大的。”
如果我们没有这些 Scikit-learn ,就像我们上节课,其他的要去求解这个线性回归模型的,你可能要写几百代码,但有了这两个你会发现不到五行代码就可以去完成一个模型的一个求解,非常非常的快速,然后这个可以说把你可能省了百分之七八十的一个时间。”
我们说完这个 Scikit-learn 的一个就是简单概念了。

我们跟大家介绍一下它的一个特点,那首先它就是像电影一样,它集成了机器学习里面各类成熟的算法,基本上机器学习的所有程序上来都是有的,然后非常容易的安装和使用。小伙伴们会发现,哦,原来老师和大家介绍的这些工具包都和我们这个他们谈到这些软件了,我都会非常注重一点,就是容易安装使用,因为这样起来的话呢,大家学起来会很快,而且效率会非常高的,也有很多的一些案例,大家可以去学习它的一些教程了,文档也都非常的”
详细,然后大家可以去上它的官网去看一下,我们大家也可以上去看一下,当然呢,它也有一个就是说不足的地方了,就是不支持Python以外的语言,也不支持深度学习和强化学习,这是比较遗憾的一个地方。不过也没关系,这个并不影响就可以了,成为一个非常强大的一个工具,帮我们来看一下,就是上它的一个官方网站上就看一下,就是它的一个介绍我们看一下,我们上一下这个对应的这个网页,

我们可以看到就是这个呢,就是 Scikit-learn 它的一个官方网站啊,都是英文的,然后在百度搜索的话”
应该有一些,我今天有一个中文的一个介绍页面,然后我们可以看到这里面呢,它可以解决分类问题,回归问题,然后聚类的,然后还有一个降维,模型选择呀,数据处理啊,非常非常强大,而且我们可以看到这里都有案例的,基本上每一个问题都有案例,然后比如说我们即将要去实现的就是个线性回归,它就属于回归问题,然后大家除了跟着我们课程学,也可以上它这个课程的官方网站上去学习一下。”


比如说我们说过它是属于监督式学习的吧。然后呢,我们可以看到就是通用的一个线性回归模型,我们可以点进去看一下,我们这个时候呢,就可以看到,就是说和我们刚才介绍的其实是很像的一些东西,

包括y=的一些,比如说x然后再加很多,就是它的可能是个多,比如说多元的一个线性回归的吧,

然后这里呢又教大家怎么样去调用这个模型,它让我们话不多说,我们还是进入我们课程的一个主要的一个内容讲解,我们切回我们的PPT,我们听了,已经了解了,那我们再来看一下,就是我们用这个scikit-learn了去求解这个线性回归的这个问题,对吧,那我们已经说过了吗?

求解这个现象,回归那些最重要的呢,就是我们要去找这个A和B教学这个方向,就是为了那怎么样去实现呢?原来已经和大家分享过了,那我们这次的实战呢,我们不会去做太细节,它深入的东西,我们那就直接是教大家怎么样去实现,那这个要去实现呢,我们就是通过的快乐,然后去调用它的一个理念。”
Model的一个就是里面的一个例子,Graph选择这个工具包,工具库,然后我们就通过这个库,然后去创建一个实际的一个对象。我们已经说过了,它是面向对象的一个编程,对吧?那我们通过这个方式呢,就可以很好的去就是说新建一个实例,然后可以很好的去完成这一个线性回归的一个模型建立,而建好之后呢,我们通过这个目的就可以去找出这个A和B来了,然后找出这个B来之后呢,我们可以把它展示出来,就是直接我们这个原来的这个实例,那是个model嘛,我们就直接调用它”
的这个曲线,它的这一个属性就得到了它这个A,然后还有这个平台就增加了这个B,我们可以看到这个1加B它的系数,也就是我们这个B选择就是A,对吧,然后我们这个X等于零的时候和8折的这个节点的Instacart,也就是我们的这一个对应的这个B啦,对吧,这个时候呢,就完成了对于它的一个求解,

那我们求解好之后呢,我们还要对这个新的数据做出预测,也很简单,当然这个模型然后直接调用product的这个方法,就完成了一个对新数据的一个预测”
这个是对于这个信息回归模型的一个求解,非常的方便和快速。求解好之后,我们还想了解一下我们这个模型它到底好不好,所以我们评估一下它的表现。当然它说的模型评估呢,我们在之后的一个章节里面会专门去讲解,就是详细的讲解,并且对比一些不同的评估方法。”
但是呢,为了让大家在现在就可以更好的去了解我们的模型呢,老师也会先做一些简单的一个介绍,那我们针对这个线性回归模型,我们会采用三种方法来评估,第一个呢,就是说我们会使用这个方差MSG来对它进行个评估,所谓MSC一样,其实就和我们的这个损失函数非常像,对不对?”
分层上面就再再出一个,其实就是损失函数了。那我们这里呢,其实你看的就是频率,就是预测,然后减去实际,然后它的一个平方求和,然后再串谋,这就是我们的一个所谓的军方误差。通过这个军方误差你就可以知道你这个模型,这个军方误差越小,就说明这个拟合的是越好,对不对?”
所以呢,如果理想情况下当然是零了,这是大部分实际情况可能是做不到的,我们能让它尽可能详细的就可以了。除了这个误差,那我们还有一个加阿防止。阿防止呢,是这样的一个求解呢,其实就是首先上面的其实就是MSC了,然后下面的就是一个方差,然后用1减去他们,就是我们的军方值,然后这个阿方它主要就是说可以让你更好的了解我这个模型它拟合得好不好,如果它是接近1,它就是拟合很好,至于它的一个具体的一个原理,那我这里就不深入地去去讲了。”
然后感兴趣的小伙伴可以就是说上百度上去搜索一下,反正我们的一个目标呢,就是和大家说一下,就是MSC越小越阿平方,分数越接近于越好,如果你有一个模型,这个事情平方是一定要去说明你就是完美的一个拟合好,那我们已经说了它的一个,就是这两个因子的一个定义呢,我们来看看它是怎么样实现就是说去获得这两个,就是评估的这个因子的。”


我们首先它也是通过这个,然后调用它里面那个MySQL和这个,然后我们直接调用这两个方法,把我们对这个实际的位置和预测的外作为一个就是,就是对应的一个一个变量,然后输给它,我们这个时候就可以把对应的这一个MSC和SQL就可以看出来了,它其实也非常简单,啊,除了这两种方法,那我们还有一种方法,就是我们直接画图,把这个wait和改变,就是实际的位置和这个预测位置直接在图形里面展示出来,然后通过这个可视化的方式就可以,因为人眼其实是非常挑剔的,你要是把这个展示出来之后,你”
发现他们为合拍片,假设他们是非常接近一条直线的,而且这个直线呢是一个就是就是我们想一想啊,假设横坐标是对吧,纵坐标是一撇,如果我们他们俩是无限接近的话,那是不是一个这样的一条直线,固定的一条曲线就是歪的,唯一的时候Opera等于1.18,也就是说你这个呢是45度对不对?”
就是如果他们是完美拟合它,就这样一条直线。所以我们这个模型,苹果一方面是image越小越好了,而平方的分数越高越好,那一撇和歪的这个关系呢,就是它的集中度要越高,然后另外的呢,就是说除了计算的越高呢。还有呢,就是说我们要尽可能的应该是今天这条线就一撇,是假设,是等以外的,对吧,这是最好的。”


然后我们之后通过实战,我们就可以看一下,就是我们拟合出来的一个效果,出来这两个呢?再和大家介绍一个,就是我们的一个图形展示,那其实我们在上一个章节里面呢,已经和大家介绍过了,这个MATLAB,它这个工具包对吧?那我们这里呢,还是继续用这个工具包,只是为了就是说,为了演示,为以后做准备,因为我们经常可能还有可以有一些其他的一些功能,那我在这里也给大家做一些预先的讲解。”
首先第一个呢就是化参见图,那其实这个很简单了,因为我们以前有说过我们要画一个假设,一个就是这种线性的图呢,我们用它的就行了,上面图呢,我们就开头,然后把X灌输给它,其实就有点类似于我们现在左边的这四个都是三年图,对吧?”
就是很多零散的点,除了这个我们还想一张图上可以有很多的小图,因为我们接下来的这个实战课程里面,你会发现我们这个的时候呢,我们这个输入的这个X,它有很多个维度,就是说除了面积,它还有我们这个收入啊,然后还有我们这个房子的年龄,啊,然后它的房间数量啊,还有这个区域人口啊,有很多。”
那这个时候呢,我们希望一张图上把它们直接直观的看,展示出来,这样的话就是说在一个界面展示出来会非常方便,非常方便对比。那怎么去实现呢?我们就直接调用这个Preview里面的下面的一个setup的一个方法了,那也就是说要画字图,对吧。那我们来给大家解释一下,它的意义是什么意思?”
就是说我一开始一个图里面能够把它分成两部分,就是就是两行一列,就把这一拿,这个后面这个应该就是指我在第一个、第一个小部分里面画图,这个2.11,然后我先创建一个这样的一个实例,然后再画就行了。这个时候拿这个点的就是在这个这个区域里面画,另外呢,我再调用一次,然后就2.1,那还是1,对吧,2那就是这个区域了,这个时候就其实画画了一个字图,这个是我们下面实现了把两个小图放在一起,那我们如果要实现左边的这一个呢,其实就是可能就是两行两列啊,然后”
一拉对不对,然后两行两列,然后其实就可以实现对于它的一个那就是把多个图画在一个大的图里面。好,那我们说完这里呢,其实我们的准备工作就已经准备得差不多了,我们就直接进入我们的一个实战环节。当然在这之前呢,给大家一个延伸阅读的资料,那就是说在官网上面,对于线性回归问题的一个介绍,然后大家可以登录这个,可以让它的官网上去看一下,那我们期待在具体的这个代码实战环节和大家继续一起学习。”

发表评论

邮箱地址不会被公开。 必填项已用*标注