作业帮 > 数学 > 作业

什么是二项分布?

来源:学生作业帮 编辑:作业帮 分类:数学作业 时间:2024/05/18 02:44:42
什么是二项分布?
中文名称:
二项分布
英文名称:
binomial distribution
定义:
描述随机现象的一种常用概率分布形式,因与二项式展开式相同而得名.
二项分布即重复n次的伯努利试验.在每次试验中只有两种可能的结果,而且是互相对立的,是独立的,与其它各次试验结果无关,结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努利实验.
统计学定义
在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概
二项分布与生活息息相关
率为p.这样的单次成功/失败试验又称为伯努利试验.实际上,当n =
1时,二项分布就是伯努利分布.二项分布是显著性差异的二项试验的基础.
医学定义
在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous
variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等.二项分布(binomial
distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布.
考虑只有两种可能结果的随机试验,当成功的概率(π)是恒定的
二项分布公式
,且各次试验相互独立,这种试验在统计学上称为伯努利试验(Bernoulli
trial).如果进行n次伯努利试验,取得成功次数为X(X=0,1,…,n)的概率可用下面的二项分布概率公式来描述:
P=C(X,n)*π^X*(1-π)^(n-X)
式中的n为独立的伯努利试验次数,π为成功的概率,(1-π)为失败的概率,X为在n次贝努里试验中出现成功的次数,表示在n次试验中出现X的各种组合情况,在此称为二项系数(binomial
coefficient).
所以的含义为:含量为n的样本中,恰好有X例阳性数的概率.
二项分布(Binomial
Distribution),即重复n次的伯努利试验(Bernoulli
Experiment),用ξ表示随机试验的结果.
如果事件发生的概率是P,则不发生的概率p=1-p,N次独立重
二项分布公式
复试验中发生K次的概率是
P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k), 其中C(n, k) = n!/(k! *
(n-k)!)
注意!:第二个等号后面的括号里的是上标,表示的是方幂.
那么就说这个属于二项分布..
其中P称为成功概率.
记作ξ~B(n,p)
期望:Eξ=np
方差:Dξ=npq
证明:由二项式分布的定义知,随机变量X是n重伯努利实验中事件A发生的次数,且在每次试验中A发生的概率为p.因此,可以将二项式分布分解成n个相互独立且以p为参数的(0-1)分布随机变量之和.
设随机变量X(k)(k=1,2,3...n)服从(0-1)分布,则X=X(1)+X(2)+X(3).X(n).
因X(k)相互独立,所以期望:E(X)=E[X(1)+X(2)+X(3).X(n)]=np.
方差:D(X)=D[X(1)+X(2)+X(3).X(n)]=np(1-p).
证毕.
以上证明摘自高等教育出版社《概率论与数理统计》第四版
如果
1.在每次试验中只有两种可能的结果,而且是互相对立的;
2.每次实验是独立的,与其它各次试验结果无关;
3.结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努利实验.
在这试验中,事件发生的次数为一随机事件,它服从二次分布.二项分布可
二项分布
以用于可靠性试验.可靠性试验常常是投入n个相同的式样进行试验T小时,而只允许k个式样失败,应用二项分布可以得到通过试验的概率.
若某事件概率为p,现重复试验n次,该事件发生k次的概率为:P=C(n,k)×p^k×(1-p)^(n-k).C(n,k)表示组合数,即从n个事物中拿出k个的方法数.
应用条件
1.各观察单位只能具有相互对立的一种结果,如阳性或阴性,生存或死亡等,属于两分类资料.
2.已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π,实际工作中要求π是从大量观察中获得比较稳定的数值.
二项分布公式
3.n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果.如要求疾病无传染性、无家族性等.
性质
1.二项分布的均数和标准差在二项分布资料中,当π和n已知时,它的均数μ及其标准差σ可由式(7.3)和(7.4)算出.
μ=nπ(7.3)
σ=(7.4)
若均数和标准差不用绝对数表示,而是用率表示时,即对式(7.
二项分布公式
3)和(7.4)分别除以n,得
μp=π(7.5)
σp=(7.6)
σp是样本率的标准误的理论值,当π未知时,常用样本率p作为π的估计值,式(7.6)变为:
sp= (7.7)
2.二项分布的累计概率(cumulative
probability)常用的有左侧累计和右侧累计两种方法.从阳性率为π的总体中随机抽取含量为n的样本,则
(1)最多有k例阳性的概率
(7.8)
(2)最少有k例阳性的概率
(7.9)
其中,X=0,1,2,…,k,…,n.
3.二项分布的图形已知π和n,就能按公式计算X=0,1,…,n时的P(X)值.以X为横坐标,以P(X)为纵坐标作图,即可绘出二项分布的图形,如图7.1,给出了p=0.5和
p=0.3时不同n值对应的二项分布图.
二项分布的形状取决于π和n的大小,高峰在m=np处.当p接近0.5时,图形是对称的;p离0.5愈远,对称性愈差,但随着n的增大,分布趋于对称.当n→∞时,只要p不太靠近0或1,特别是当nP和n(1-P)都大于5时,二项分布近似于正态分布.关于二项分布近似为正态分布的判定条件,不同著述中存在争议,在甘怡群《心理与行为科学统计》中:当np>10且n(1-p)>10时,二项分布可以近似为正态分布(第72页);在张厚粲《现代心理与教育统计学》中:当p(1-p)且n(1-p)≥5时,二项分布可以近似为正态分布(第178页).
π=0.5时,不同n值对应的二项分布
π=0.3时, 不同n值对应的二项分布
图7.1二项分布示意
分布区别
两点分布又称伯努利分布
两点分布的分布列就是
x

0

1

P

1-p

p

不论题目有什么区别,只有两种可能,要么是这种结果要么是那种结果,通俗点,要么成功要么失败
而二项分布的可能结果是不确定的甚至是没有尽头的,
列一个二项分布的分布列就是
X 0 1 2 ……… n
P C(0)(n)·(1-p)^n C(1)(n)·p·(1-p)^(n-1)
……C(n)(n)·p^n·(1-p)^0
也就是说当n=1时,这个特殊二项分布就会变成两点分布,
即两点分布是一种特殊的二项分布
像其他地方说的二项分布是两点分布的多重实验也不无道理,因为两者都是独立的重复实验,只不过次数不同罢了
E(n) = np, var(n) = np(1-p) (n是实验次数,p是每次实验的概率)