MMSE估计的来龙去脉

1 问题模型

通常，我们需要估计未知随机变量的值，但是往往需要通过对另外一个随机变量的观测来对进行推断。我们把的概率密度分布叫做先验概率。当我们获取到观测值，然后对进行估计时，此时的概率值叫做后验估计。

后验估计通常通过贝叶斯公式完成。

2 贝叶斯公式

贝叶斯公式表述如下：

此处给一个例子，假设，且，求.

根据贝叶斯公式有：

因为：

则：

利用全概率公式：

所以 .

3 最大后验估计准则

由于后验概率密度分布包含了关于的所有信息。所以我们可以利用后验概率密度对进行点估计。对进行点估计的一个准则是：选择一个使得的值最大。这个估计准则叫做最大后验估计准则。

为了找到的MAP值，我们力图找到使得式~()的取值最大。

注意不依赖于，所以我们只需要最大化即可。更进一步，如果是等概分布，那么我们只需要最大化即可，即找到那个最大化的值即可。此时，MAP准则和ML准则等效。

4 条件期望

包含时的所有信息。所以我们可以利用找到关于的多个估计，比如均值，中位数，mode。我们定义mode为最大化的x的值，即：mode是MAP对应的的值。另一个取值方式是取后验分布的均值，即：

给一个例子，感受一下的计算。假设

求.

首先利用全概率公式，我们有：

我们有 ,则 :

5 MMSE

接下来我们证明是在均方误差准则下的最好估计。假设给定我们要估计的值。一般情况，是的函数。估计的误差为：

通常，我们希望均方误差的期望最小，即：

式~()正是我们称这个方法为最小均方误差估计的原因。

为简便起见，假定我们在没有任何观察的情况下对进行估计，我们会用一个什么样的值作为的估计值呢？假设这个值是，那么MSE为：

我们对求导，有：

令，那么有。现在，假设，我们有观测数据，那么此时我们会对做什么样的估计呢？假设估计为，那么MSE有：

就上式对求导，并令导数等于零，则：

即最小均方误差准则下的最优解是条件期望。这个值我们可以通过贝叶斯公式求出。

6 MMSE的一些特性

由于是的函数，即。我们也可以认为，同样有，即关于在MSE准则下的估计是条件期望。

由于，所以有。即是的无偏估计。

定义随机变量。令是MMSE估计算子，定义为估计误差。那么，并且对于任意的估计子都有. 对于这个结论，我们给出证明：

另外，我们有，所以。

接下来我们证明和是不相关的。我们有：

因为，所以，又因为和是互不相关的，则有：

上式可以解释为的方差有一部分是估计体现的，有一部分是估计误差体现的。如果估计值捕捉到了大部分的方差，那么估计误差就会小一些。

我们把式 ()用期望重写为：

由于，且，则有：

7 应用

MMSE估计在通信系统和信号处理领域诸多方向都会出现，比如信道追踪，信号检测，译码，图像重建，无线定位，频偏估计等等。在这些领域，我们通常需要基于观测估计未知的参数，观测方程可以表示为：

其中是测量噪声，测量方程可以是线性的也可以是非线性的。

有很多方法可以帮助我们从中估计出。这些方法可以简单的分为基于统计的和非统计的。基于统计的方法有：最大似然估计（MLE），最大后验概率估计（MAP），最小均方误差估计（MMSE）。基于非统计的方法有：最小二乘（LS），最优线性无偏估计（BLUE）和最小方差无偏估计（MVU）。基于统计的估计通常以最小估计误差为优化目标，给出最优的参数估计结果。基于非统计的估计则提供了一种当信号统计特性未知时的简单估计方法。无论采用哪一类估计方法，估计子的无偏性和协方差都是我们要考虑的两个度量。在一些特殊的场合，基于统计的估计算法和基于非统计的估计算法是等效的。基于我们对系统和统计信息的掌握，我们有多种估计算法可选。例如，如果我们知道系统测量是线性的，测量噪声是零均值高斯变量，，那么我们可以使用MLE来估计。更进一步，如果我们知道的先验信息，那么可以用线性的MMSE算法来估计。

MMSE方法的目标是最小化均方误差，因此在统计意义上，这个算法是最优的（假设已知先验信息）。MSE定义为：

其中是的后验分布。则MMSE的估计结果为：

通过对上式求导：

最优的MMSE估计算子是：

可以看到，最优MMSE估计是它的后验概率期望。通常，我们使用贝叶斯链式法则来求解后验概率：

其中是似然函数，是先验信息，是归一化项，可以通过全概率公式求：

对于一个特性系统或者估计问题来说，MMSE剩下的问题就是求解式 ()中出现的统计密度。

接下来我们以线性高斯MMSE估计子为例，其系统模型为：

其中，是精度矩阵.另外假设目标随机变量服从高斯分布。

其中是对应的均值矩阵和精度矩阵。

基于以上的公式，似然函数为：

因此，基于高斯分布的特性，后验分布为：

其中是的广义逆，。我们发现，后验概率是两个高斯分布的乘积，因此也是一个高斯分布。

其中：

我们把的结果带入式 ()，则有：

之前我们知道MMSE估计结果是后验期望，所以：

接下来，我们考虑通信系统的场景。在通信系统中，的均值通常为，即，所以：

在式 ()中是精度矩阵。通常，我们还会看到式 ()使用协方差矩阵的写法。我们知道精度矩阵和协方差矩阵的关系为：

所以式 ()可以变为：

其中是接收端的信噪比。如果信号功率是归一化的，那么。所以在通信系统中，线性MMSE估计为：

式~()在通信系统中经常出现，尤其是信道估计和符号检测模块。在符号检测模代表信道。