极大似然法 @

极大似然法是一种在统计学中用于参数估计的重要方法,以下从基本思想、求解步骤、应用场景等方面为你讲解:

基本思想 @

极大似然法的核心是基于这样一个原理:

在一次试验中,概率最大的事件最有可能发生。

对于一个给定的样本数据集,我们假设这些数据是由某个未知参数的概率分布生成的。

极大似然法就是通过寻找一组参数值,使得在这组参数下,观测到给定样本数据的概率最大。

求解步骤 @

  • 确定似然函数:首先,需要根据样本数据和所假设的概率分布来构建似然函数。如果样本是独立同分布的,那么似然函数就是每个样本的概率密度函数(对于连续型随机变量)或概率质量函数(对于离散型随机变量)的乘积。例如,对于一个服从正态分布的样本数据集\(\{x_1, x_2, \cdots, x_n\}\),其似然函数为\(L(\mu,\sigma^2)=\prod_{i = 1}^{n}\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}\),其中\(\mu\)是均值,\(\sigma^2\)是方差。
  • 对似然函数取对数:为了方便计算和分析,通常对似然函数取对数,得到对数似然函数。因为对数函数是单调递增的,所以对数似然函数与原似然函数的最大值点是相同的。对于上述正态分布的例子,对数似然函数为\(\ln L(\mu,\sigma^2)=-\frac{n}{2}\ln(2\pi)-\frac{n}{2}\ln(\sigma^2)-\frac{1}{2\sigma^2}\sum_{i = 1}^{n}(x_i-\mu)^2\)。
  • 求对数似然函数的最大值:通过对对数似然函数关于参数求偏导数,并令偏导数等于\(0\),得到一组方程组,解方程组即可得到使对数似然函数最大的参数值,这些参数值就是极大似然估计值。对于正态分布的例子,分别对\(\mu\)和\(\sigma^2\)求偏导数并令其为\(0\),可解得\(\hat{\mu}=\frac{1}{n}\sum_{i = 1}^{n}x_i\),\(\hat{\sigma}^2=\frac{1}{n}\sum_{i = 1}^{n}(x_i-\hat{\mu})^2\),其中\(\hat{\mu}\)和\(\hat{\sigma}^2\)分别是\(\mu\)和\(\sigma^2\)的极大似然估计值。

应用场景 @

  • 参数估计:在各种概率模型中,如正态分布、泊松分布、二项分布等,极大似然法常用于估计分布的参数。例如,在估计某地区居民收入的正态分布参数时,可通过收集居民收入样本数据,利用极大似然法求出均值和方差的估计值。
  • 机器学习:在机器学习的监督学习算法中,极大似然法常用于估计模型的参数。例如,在逻辑回归中,通过极大似然法来估计模型的权重参数,使得模型对给定的训练数据有最大的似然度,从而实现对数据的分类或预测。

具体分析 @

以下是一个极大似然法在抛硬币问题中应用的例子:

假设我们有一枚硬币,我们想知道这枚硬币正面朝上的概率\(p\)。为了估计\(p\),我们进行了\(10\)次独立的抛硬币试验,观察到正面朝上的次数为\(7\)次,反面朝上的次数为\(3\)次。

我们假设抛硬币的结果服从二项分布,每次抛硬币正面朝上的概率为\(p\),反面朝上的概率为\(1 - p\)。那么,在\(10\)次试验中观察到\(7\)次正面朝上的概率可以用二项分布的概率质量函数来表示,即似然函数为:

\(L(p) = C_{10}^7p^7(1 - p)^{10 - 7}\)

其中\(C_{10}^7=\frac{10!}{7!(10 - 7)!}\)是组合数,表示从\(10\)次试验中选择\(7\)次正面朝上的组合方式数。

为了找到使\(L(p)\)最大的\(p\)值,我们对似然函数取对数,得到对数似然函数:

\(\ln L(p)=\ln(C_{10}^7)+7\ln p + 3\ln(1 - p)\)

然后对\(p\)求导,并令导数等于\(0\):

\(\frac{d\ln L(p)}{dp}=\frac{7}{p}-\frac{3}{1 - p}=0\)

解这个方程可得:

\[ \begin{align*} \frac{7}{p}-\frac{3}{1 - p}&=0\\ 7(1 - p)-3p&=0\\ 7 - 7p - 3p&=0\\ 7 - 10p&=0\\ p&=\frac{7}{10}=0.7 \end{align*} \]

所以,通过极大似然法估计出这枚硬币正面朝上的概率\(p\)为\(0.7\)。

这个例子展示了如何使用极大似然法根据观察到的数据来估计概率模型中的参数,使得在该参数下观察到的数据具有最大的可能性。