最大化似然估计?你知道什么叫”似然“吗?
文章目录
- 1. 似然(Likelihood)是什么?
- 2. 似然的形式化定义
- 3. 最大似然估计
- 4. "似然"的直观理解
- 5. 似然与概率的区别
- 6. 总结
🍃作者介绍:双非本科大四网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发,目前开始人工智能领域相关知识的学习
🦅个人主页:@逐梦苍穹
📕所属专栏:人工智能
🌻gitee地址:xzl的人工智能代码仓库
✈ 您的一键三连,是我创作的最大动力🌹
“似然估计”(Likelihood Estimation)是统计学中的一个重要概念,常用于推断模型的参数。
为了理解这个概念,首先需要理解“似然”是什么意思。
1. 似然(Likelihood)是什么?
似然是给定一个模型或参数下,观测到某些数据的概率。简单来说,似然不是数据本身的概率,而是给定数据后,模型或参数的合理性(即解释这些数据的可能性)的度量。
- 概率(Probability):通常用于描述在已知模型和参数下,生成某些数据的可能性。例如,我们可以计算某个事件在概率分布下发生的概率。
- 似然(Likelihood):则是反过来使用的,已知某些数据,我们用来衡量某个模型或某些参数是否合理的度量,即这些模型或参数是否能够解释所观测到的数据。
2. 似然的形式化定义
设定我们有一个参数为 θ \theta θ的模型,其生成数据的概率分布为 p ( x ∣ θ ) p(x|\theta) p(x∣θ),其中 x x x是观测到的数据, θ \theta θ是模型的参数。
- 当我们已知参数 θ \theta θ时, p ( x ∣ θ ) p(x|\theta) p(x∣θ)就是数据 x x x的概率。
- 但是当我们已知数据 x x x而想要估计参数 θ \theta θ时, p ( x ∣ θ ) p(x|\theta) p(x∣θ)被称为似然,它表示在给定数据 x x x的情况下,参数 θ \theta θ的合理性。
所以,似然函数 L ( θ ∣ x ) = p ( x ∣ θ ) L(\theta|x)=p(x|\theta) L(θ∣x)=p(x∣θ),是将数据 x x x视为固定的,参数 θ \theta θ为变量。
3. 最大似然估计
最大似然估计(Maximum Likelihood Estimation, MLE)
最大似然估计是最常见的估计参数的方法。其基本思想是找到能够最大化似然函数的参数 θ \theta θ值,即找到最有可能解释观测数据的参数。
用公式表达就是: θ ^ = arg max θ L ( θ ∣ x ) = arg max θ p ( x ∣ θ ) \hat{\theta} = \underset{\theta}{\text{arg max}} \, L(\theta|x) = \underset{\theta}{\text{arg max}} \, p(x|\theta) θ^=θarg maxL(θ∣x)=θarg maxp(x∣θ)
其中:
- θ ^ \hat{\theta} θ^是最大化似然函数所得到的参数估计值。
- L ( θ ∣ x ) L(\theta|x) L(θ∣x)是给定数据 x x x的情况下,参数 θ \theta θ的似然。
换句话说,我们选择那个能使得模型生成观测数据概率最大的参数作为参数估计值。
4. "似然"的直观理解
设想一个场景,你站在山上看到了远处一块田地。
你不知道那块田里种的是什么(这就好比你不知道模型的参数),但是你看到了几株植物(观测数据)。
你现在需要通过观察这些植物来推断田地里主要种植的是什么作物。
不同的作物种类是模型的 不同参数。
似然函数的作用就是帮助你找到最可能解释这些植物的作物类型,即找到哪个参数值使得观察到这些植物的概率最大。
5. 似然与概率的区别
- 概率(Probability):在已知模型和参数的情况下,计算数据发生的可能性。例如,已知某个硬币是公平的(模型参数已知),那么正面朝上的概率是 0.5 0.5 0.5。
- 似然(Likelihood):在已知数据的情况下,推测模型参数的合理性。例如,观察到硬币正面朝上,反过来推测硬币是否是公平的。换句话说,如果你看到硬币多次正面朝上,你可能会怀疑硬币不公平,似然值会告诉你哪种硬币(公平或不公平)的解释最合理。
6. 总结
- 似然是指在已知数据的情况下,衡量一个模型或其参数是否合理的度量。
- 最大似然估计是一种通过最大化似然函数来寻找模型参数的方法,它能够找到最有可能生成观测数据的参数值。
通过最大似然估计,我们能有效地从观测数据中推断出模型的参数,特别是在机器学习和统计建模中,这是一个常用的估计方法。