似然函数的作用

统计学中,似然函数是一种关于统计模型参数的函数。表示模型参数中的似然性。

然后接下来我们再来看下一点

这点当中啊
我们这点难度当当中可能难度有点大了
我给大家得来观察一下
现在我们要求的东西是什么误差项
哎咱们刚才也知道了
x是为数据
我们也知道y呢是我的标签
我们手里也有了
那现在差了一点什么
现在是不是差了一点
当前我的一个参数应该是什么吧
我的θ该怎么样进行求解
这是我们现在要落到的一个重点
那既然刚才解释了我们的一个误差项是服从于这样的一个高斯分布
我可以把这样一个高斯分布的表达式先列出来吧
这有个高速高速分布啊
代表示我估计大家可能还记住啊
就是根号下二派乘法分之一
然后这个e x p表示这是那个e把原来2.7那个数二倍的马方
前面有个负的
然后这一块就少了一点
正常情况应该少什么
应该是你的一个误差项减去什么
减去一个均值吧
但是呢咱刚才是不是说均值是等于零的
所以啊在这里我做了一个简化
就是我没有写这个谬
它的均值均值是零嘛
那零就是任何数减零都还在这个数码我就不写了
这是个平方向
那有最高的分布之后
我们再来看它是关于谁的
它是关于误差项的吧
那你说我最终结果我希望找的东西是谁呀
误差是多少
关心吗
我要求出来一个具体误差是3万还是2万还是8万吗
这不是我要求的吧
我要求的是一个c吧
所以说我在这个式子当中
我要转换一下
把跟误差项相关的直东西
或者把跟误差项相关的式子
一旦我们转换成跟c相关的这件事
是不是就可以往咱们求解上去靠了
再来看一下吧
这个东西怎么一转
在这里我可以写一下
我说y减去一部记录等于什么
等于一个c tx吧
那现在我们就可以做这样一个转换了
我干什么
我把啊不是在这块应该这样
应该是这个y减去sx等于一个一部系统吧
这样才能把这个一部系统用y和c做一个代替吧
那此时上来看
如果说我做了这样一个代替
就把它移到左边
做这一个之后
是不是这一项还有这些东西就都没有了
就是来直接进行一个替换了吧
咱们得到这样一个结果
这个结果当中我希望大家先来进行一个通俗解释
可能大家来看这个式子
哎呀觉着里边涉及公式有点多
为大家一个解释一下什么意思啊
大家先来看是不是这回事啊
先来通俗说一下
我们现在呢要找的是一个s
要找这个c他要干什么呢
我希望这个c跟我的这个x组合完之后
还是不要找吉特和s的一个组合呀
不是单找吉特吧
斯特和x的组合完之后
我希望他跟真实值应该怎么样
越接近越好吧
所以说我现在就能得到这样一件事
我说死和s组合完之后成为真实值
成为y的可能性应该怎么样
越大越好吧
再来捋一捋
我看大家是不是一件事儿啊
斯特和x组合完之后能成为y的可能性应该越大越好吧
这个是我们现在要解释的一点
但这点当中我们还涉及到一个事儿
这件事叫什么呢
我通过这个自然函数来给大家解释一下咱当前指定的这个方程啊
它到底就是做了一件什么事

我先说一下
给大家举个例子吧
比如说现在啊
现在比如前热榜去了澳门了
澳门当中回答大家也听过
澳门当中里面有一些赌场吧
在这些个赌场当中啊
比如说我现在我去想试一试
我在试的过程当中
我估计大家都跟我一个心理
肯定不敢自己先玩
现在该怎么样
看看别人能不能赢
是不是
假如说这边来了五个老哥
我老哥一个去玩
我看第一个老哥赢了艾可
这是我绝招
赌场当中啊
能不能赢
是兽一组参数来控制的
然后呢第一个实验样本
第一个老哥去了
他赢了啊
这是我现在要观察到的一个现象
然后呢第二老哥也去了一点
赢了参数是怎么样
你说读塔的参数它是不会去变的吧
在参数不变的前提下
我观察到第二样本他是不是也赢了
第三个样本
第四个到第五个老哥他却都赢了
那此时我认为我可能认为什么
此时呢我可能认为
接下来现在呢有一组参数控制这个赌场最终的一个输赢
所有样本我观测到的结果都赢了
那我会认为接下来我再去玩的时候
也会有100%的可能性能赢
那这件事说明什么
我为什么会有100%的可能性
说我能赢
因为我认为这个参数它是根据我的数据来决定的
或者说我的参数是跟数据相关的
我的数据能验证这组参数
所以我觉得前面五个数据都赢了
我再去也100%会赢
说白了三函数描述了这样一个事儿
什么样的参数跟我们的数据组合完之后
恰好是真实值
这里我提到一点什么
我们的数据吧
参数最好参数肯定是不变的
我们的数据也是不变的
这就是我们要找的一个结果吧
但这里我希望大家强调一点是吗
来看一下这个符号
这个符号表示什么意思啊
它是一个累乘吧
为什么会有一个累乘
i从一开始到m什么意思啊
你说现在我在赌场当中去观察
我说前面一个老哥赢了
你说你说我敢说我下一次我就可能赢吗
我可能觉得他是侥幸吧
前面有俩人
我可能觉得侥幸
前面有1万个人都赢了
我再赢不了
那就不可能了吧
所以说i从一开始到m
我们是希望通过大量的数据去找到最合适的一个参数
相当于我们要做这样一个估计
希望用的数据越多
是不是结果应该越准确一些啊
这个就是我的一个三函数当中
为什么会有个垒成诶
他为什么是乘法
不是加法
再来想一想
那么之前是不是提到过啊
之前咱没调过
这点
在数学当中有一点我们刚才说了一件事
叫什么独立同分布
一旦独立同分布的时候
有一个前提叫什么
我的一个联合概率密度等于边缘概率密度是什么成绩吧
不知道大家还能不能回想起这样一个事儿
这个事儿为什么成立
是在独立同分布的一个前提下
咱刚才是不是恰好说了
我这个数据是不是满足于独立同分布的
所以说当前我们用累乘是一点毛病没有的
所以呢请大家解释第一点
它为什么是一个里程
第二点第二点来说呀
我们接下来就要进行一个估计了
估计的过程当中
我们来想一想
我问大家一个事儿
你说如果说啊咱现在要做的就是什么样的x跟s组合完之后
能成为y的可能性要越大越好
那这里这件事该怎么解啊
来看这个东西
这是什么
这是个乘法啊
m如果说我说我都不往大了
说是等于1000
那此时这个式子它是什么
它是一个1000项的一个乘积吧
那大家可以想一想
这1000项的一个成绩
对于一个乘法问题来说怎么样
是不是非常难解的一个东西啊
你见过1000项的东西乘在一起让你去解吗
没见过吧
那什么问题可能是好解一点啊
加法吧
乘法不好解的东西我们可以转成加法
那这件事咱们该怎么样进行转换呢
我们来看一下
谢谢大家列出来这样一个式子吧
比如说在对数当中
我写上这样一个a乘上一个b它等于什么呀
哎比如说像log a b这里面是个乘法是吧
比如在这里
你看咱们都是乘法吗
那如果说咱们现在默认啊
就都是底相同的
他对什么对数的乘法
底边相乘等于ram相加吧
所以说我现在得到了一个前提是吗
通过一个对数可以把一个乘法问题转换成一个加法问题吧
这样咱这问题是不是就好解了
像我刚才说的这1000相乘一起
那简直是扯淡一样
不可能去算吧
但是呢一旦我转了一个加法这件事
他是不是就好解决了
但是当你在做这个转换的前提的时候
我们要想一个问题
你转换完了之后
咱求解的结果是不是变了
之前我求这个一套是我三个函数
刚才解释过了
此时一旦你加上了一个对数之后
凭什么能加对数啊
进入对数之后
你的求解的结果是不是要发生一些变化啊
比如现在设十
你这要变成什么了
这块变成了一个log 10了吧
那结果是变了呀
那变了还成立吗
在这里啊
我需要大家有个前提
就是什么
我们现在要求的是什么呀
我求的真是这个c一套
我的三函数值等于多少吗
我真要求这个log c一的多少吗
我不关心吧
我关心的是什么呀
比如说现在呃
现在比如说先这样吧
我就画一个值吧
假设说刚才我除了这样
我说什么样的x跟c组合之后使得的结果能越大越好
那这块我说我这个x轴
我是一个c
这个是我的一个结果吧
那在这个基础当中
你是不是要找到它这个哪个c
比如这块有一个c值
它能够使得结果达到最后最大吧
那此时我们要求的是不是一个极值
而是一个极值点吧
哎注意点
我们到底要求极值
还要求极值点
这个lsd等于什么关系吗
我根本不关心啊
我只要知道死了
我的回归方程c一哎
这里thet它不是一个值啊
它表示的是比如说一组行线
一组向量了
c1 c2
一直到这个sn
他表示这组结果吧
我把这组结果求出来就可以了
所以我要找的它是一个极值点
当我求极值点的时候
如果说我改变了当前这个方程
比如前面加上一个对数
虽然它会改变我的一个极值
但是它不会改变我的极值点
这样说没毛病吧
那此时当前我依旧是个求极值的任务
他俩是不等价的
那就是等价的吧
所以我们能做这样一个对数的自然
因为极值点它没有变极值
对我来说我不关心
这样我们就给它转换成了什么
把一个乘法任务转换成了一个加法任务吧
由加法任务咱这件事啊就好解释了
我们来看一下对于当前我的一个对手三人结果之后
我们该怎样进行一个求解
首先第一步要干什么
来看一眼
再回头看一眼
这是一个什么
这是个累成吧
累程会变成什么
在对数前面就是在累乘前面加了一个对数
等于变成了一个累加的一个对数吧
你看这里
我们来看下面的结果

发表评论

邮箱地址不会被公开。 必填项已用*标注