正态分布公式是怎么推出来的。200分

2024-12-22 00:26:56
推荐回答(5个)
回答1:

  正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。

  

  正态分布一种概率分布,也称“常态分布”。正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ^2)。服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。

  正态分布的密度函数的特点是:关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,图像是一条位于x轴上方的钟形曲线。当μ=0,σ^2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

  正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质

回答2:

§18.1正态分布

连续的随机变量x的概率密度分布函数f(x)如果服从

(18.1)

关系,就说该变量遵守正态分布(也称为高斯分布)。这里a和σ分别是该变量的平均值和标准差。正态分布最早由数学家高斯得到,它广泛适合观测的误差等很多种场合。这个分布可以从某种合理的假设出发而推导出来,所以被认为是理论依据比较充分的概率分布。20世纪科技界流行的一种观点就是自然现象似乎都应当符合正态分布,很多理论工作也是在正态分布的假设上形成的。这些工作提高了正态分布的地位。人们对正态分布的重视也导致对其他的分布函数的忽视。这种观点与丰富的自然现象不符。

这里我们利用最复杂原理配合对应的约束条件推导出正态分布公式(18.1)。

一个连续变量x的概率密度分布函数是f(x),那么这个函数的积分应当等于1(变量出现各种值的概率的合积值为1—必然事件),

(18.2)

如果该随机变量的标准差必须为一个固定值σ,即

(18.3)

承认变量仅受上面的约束条件(没有更多的),并且承认变量出现什么值有随机性,在这些约束下的随机性最大也就是变量对应的复杂程度或者说信息熵最大,即∫-f(x)ln f(x)dx 应当最大。利用拉哥朗日方法构造一个新函数F

F=∫-f(x)ln f(x)dx+C1[∫f(x)dx-1]+C2[∫(x-a)2f(x)dx-σ2]

以上积分应当遍及变量x的一切可能值(从负无穷大积分到正无穷大)。复杂程度最大就是要求函数F对f的变分为零,有

我们得到

-lnf(x)-1+ C1+ C2(x-a)2=0

f(x)=exp(-1+ C1)exp[C2(x-a)2] (18.4)

这个公式已经与正态分布公式具有相同的外型了。利用关系(18.2)、(18.3)可以把(18.4)中的待定常数C1、 C2确定出来。借助定积分表,得到的分布函数恰好是最初给的(18.1)式。这样就利用最复杂原理(最大信息熵)和标准差为常数的限制得到了正态分布函数公式。它意味着对于确定的标准差,随机变量可以有很多种分布函数,但是复杂程度最大(信息熵最大)的分布函数只可能是正态分布。

于是我们从最复杂原理推导出来了正态分布公式。

公式中的平均值为a,它的含义自然是

(18.5)

请注意,在推导公式时公式(18.5)并没有作为约束条件出现。这与负指数分布的推导时把它作为约束条件是不同的。

与(18.1)公式对应的正态分布见于图18.1中。

图18.1正态分布函数

对应二元正态分布也有类似的结果。如果f(x,y)是一个二元的概率密度分布函数,即

(18.6)

它对于变量x,y的标准差分别为固定值σx ,σy ,即

(18.7)

(18.8)

上面的a,b分别是x,y的平均值。而x,y的相关矩ε

(18.9)

也是固定值(等价于相关系数固定)。

那么复杂程度最大时的随机变量的概率密度分布函数也可以利用拉哥朗日方法求得。它就是经常遇到的二元的正态分布公式:

,ρ≠1,(18.10)

这里的ρ是变量的相关系数,它与相关矩ε的关系是

ρ=ε/(σxσy) (18.11)

这样,形成二元的正态分布所依赖的约束条件和原理(最复杂原理)我们也清楚了(说明:具体推算过程是1995年由马力同志完成的,因为比较繁这里没有列出)。

利用分布函数可以计算信息熵,对应正态分布,它的信息熵H与变量的标准差σ的对数值成正比例

关于正态分布的应用事例在很多书籍都有介绍,这里就不必再重复了。

本节说明著名的正态(高斯)分布也是最复杂原理(信息熵最大)的一个应用特例。

回答3:

首先请你相信你学到的这些公式是正确的。这个世界是分工越来越细的世界,大家各施其职,地球上并不需要太多从事理论研究的人,哪怕是发明微积分的牛顿,他自己也不知道微积分的理论基础,直到后来的魏尔斯特拉斯和柯西,才将微积分(或者说是分析学)注入了理论基础和严密性。
至于这个公式,其实是有它的来历的。概率论的核心是中心极限定理,正态分布的公式事实上是应用这个定理求极限得到的,但是如果你不是学基础数学的学生,我个人认为没有太大的必要去查阅这个过程,大致知道其来历即可。
至于你说的双曲线和椭圆,事实上这两个曲线和抛物线,三者合称为二次曲线,你可以看看北大的解析几何教材。

回答4:

你这个问题问的好,现在像你这样的学生很少了.
我也不是很厉害,说几句给你个启发
要做为概率密度的函数,面积应该为1.因为事件概率加起来是1.那个正态公式是西方人发现的,他有几个参数,定积分对它积分结果就是1.而且,形状中间一段占了很大面积,也就是很大概率,和生活中一般的现象多数符合.因此,人们对A,X设不同值可以应用于生活.这样的被人发现出名的积分函数有很多的.你买点书看看好了.关于准钱那个是可以算出来的.
我们国内大学的课本在数学方面很深奥的,但是例子大多是假设的,我很少见有企业认真的做市场调查利用统计学分析样本的,呵呵

回答5:

我没学过概率论,不过在我看来这中间的逻辑关系是这样的:

首先,一般的问题通常是由很多事件(n个)综合决定的,而每个事件是否实现有两种可能,各占一半,所以整个问题的概率与n阶二项式的系数相关(中心极限定理)。而高斯函数正是n->正无穷时二项式系数分布函数的极限,所以可以代表这个问题的概率分布,也就是正态分布。

所以说逻辑上分三步:n个独立事件-〉二项式系数-〉高斯函数

具体的中心极限定理以及高斯函数极限的证明就要另找资料了。