如果 ( x ) 和 ( y ) 是两个独立且都服从正态分布的随机变量,那么它们的和 ( x + y ) 也会服从正态分布。这个性质是由正态分布的一个基本特性决定的,即线性组合的正态随机变量仍然是正态分布。
具体来说,假设 ( x ) 和 ( y ) 分别服从均值为 ( mu_x ) 和 ( mu_y ),方差为 ( sigma_x2 ) 和 ( sigma_y2 ) 的正态分布,即 ( x sim N(mu_x, sigma_x2) ) 和 ( y sim N(mu_y, sigma_y2) )。那么,它们的和 ( x + y ) 的分布可以表示为:
[ x + y sim N(mu_x + mu_y, sigma_x2 + sigma_y2) ]
这里,( x + y ) 的均值是 ( x ) 和 ( y ) 均值的和,方差是 ( x ) 和 ( y ) 方差的和。
这个性质背后的数学原理涉及到正态分布的概率密度函数(PDF)的线性性质。正态分布的PDF是关于其均值对称的,并且当多个独立的正态分布随机变量相加时,它们的PDF可以线性组合。
以下是这个性质的一个直观解释:
1. 中心极限定理:即使原始数据不是正态分布的,只要样本量足够大,样本均值的分布将接近正态分布。这是因为正态分布是所有分布中在样本量增大时最稳定的分布。
2. 线性组合的连续性:正态分布是连续分布,且线性组合保持了连续性。这意味着,如果两个连续的随机变量都服从正态分布,它们的线性组合(如和)也将是连续的,并且仍然服从正态分布。
因此,无论 ( x ) 和 ( y ) 的具体分布如何,只要它们是独立的正态分布随机变量,它们的和 ( x + y ) 就会服从正态分布。