一个随机变量 X 取值为 x 的概率 (probability)/概率密度,一般可以用一个有若干参数的函数来表示。这个函数的参数记作 θ\theta

probX(x)=f(xθ)prob_X(x)=f(x|\theta)

而似然性 (likelihood) 就是把上式 f 看作以 θ\theta 为自变量,x 为参数的函数,从表达式上看不出区别:

L(θx)=f(xθ)=probX(x)L(\theta|x)=f(x|\theta)=prob_X(x)

最近处理一个数据集,整理完之后的直方图如下:

double-peak
double-peak

比较明显,比起一个正态分布 f(x)=1σ2πe12(xμσ)2f(x)=\frac{1}{ \sigma \sqrt{2\pi} } e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2},这些数据更像是来自不同均值和方差的两个分布。那么对于每个数据点 x0x_0,它到底来自哪个分布呢?可以分别计算 L1(μ1,θ1x0)=f(x0μ1,θ1)L_1(\mu_1,\theta_1\vert x_0) = f(x_0\vert\mu_1,\theta_1)L2(μ2,θ2x0)=f(x0μ2,θ2)L_2(\mu_2,\theta_2\vert x_0) = f(x_0\vert\mu_2,\theta_2),然后比较 L1L_1L2L_2 的大小。

本文收录于以下合集: