在统计学中,矩阵正态分布或矩阵高斯分布是概率分布,是多元正态分布到矩阵值随机变量的概括。
定义随机矩阵X(n×p)的概率密度函数遵循矩阵正态分布 具有以下形式:
其中 表示轨迹,M是n×p,U是n×n,V是p×p。
矩阵法线通过以下方式与多元正态分布相关:
当且仅当
其中 表示Kronecker产品, 表示 的矢量化。
证明可以使用迹线和Kronecker乘积的若干属性来显示上述矩阵法线函数和多元法线密度函数之间的等价,如下所示。我们从矩阵法线PDF的指数的参数开始:
这是多元法线PDF的指数的参数。使用行列式属性完成证明:
属性如果 ,然后我们有以下属性:
预期值平均值或预期值为:
我们有以下二阶预期:
其中 表示跟踪。
更一般地,对于适当尺寸的矩阵A,B,C:
转换转置变换:
线性变换:令D(r-by-n),满秩r≤n且C(p-by-s),满秩s≤p,则:
例子让我们设想根据多元正态分布相同分布的n个独立p维随机变量的样本:
当定义第i行为的n×p矩阵时,我们得到:
其中的每一行等于,即,是n×n单位矩阵,即行是独立的,。
最大似然估计给定k个矩阵,每个大小为n×p,表示为,我们假设已对其进行了采样iid从矩阵正态分布,可以通过最大化获得参数的最大似然估计:
平均值的解决方案具有封闭形式,即
但协方差参数没有。但是,这些参数可以通过将其梯度归零来迭代地最大化:
和
协方差参数在某种意义上是不可识别的,对于任何比例因子,s> 0,我们有:
从分布中绘制值矩阵正态分布的采样是多元正态分布的采样过程的特例。 让为来自标准正态分布的np个独立样本的n×p矩阵,因此
然后让
因此
其中A和B可以通过Cholesky分解或类似的矩阵平方根运算来选择。2
本词条内容贡献者为:
何星 - 副教授 - 上海交通大学