概率论中的分号表示
在贝叶斯推断和参数估计等相关文献中常见$P(X|Y)$与$P(X;Y)$两种不同的表示方法,常常令初学者感到困惑:参数$Y$和随机变量$X$到底是什么关系?二者有什么区别?
简单来说,分号用来分隔变量和参数,其中分号左边是随机变量,分号右边的部分表示未知但确定的参数,这种情况下,也可以用“|”进行分隔,即分号与“|”等价。
更具体来看,判断表达式的含义需要根据上下文中Y表示了什么:
| Y | 解释 | |
|---|---|---|
| P(X|Y) | 随机变量 | 条件概率分布 |
| P(X|Y) | 未知但确定的参数 | 在给定参数Y时,X的概率分布 |
| P(X;Y) | 未知但确定的参数 | 在给定参数Y时,X的概率分布,与P(X|Y)表示的含义相同,可理解为是一种P(X),亦可写作:$P_Y(X)$ |
通过上表对比可见,若$Y$是未知但确定的参数,$P(X|Y)$与$P(X;Y)$的表示是等价的,但我更喜欢分号分隔的表示法,可以与条件概率的表示更明确地加以区别。
再举个例子,对于线性回归模型$y=wx+b$,定义待估计参数$\theta=(w, b)$,给定数据集$D$,则似然函数可写作$L(\theta;D)$或$L(\theta|D)$,它可以理解为就是$L(\theta)$或$L_D(\theta)$,是关于$\theta$的一个函数。