医学全在线
搜索更多精品课程:
热 门:外科内科学妇产科儿科眼科耳鼻咽喉皮肤性病学骨科学全科医学医学免疫学生理学病理学诊断学急诊医学传染病学医学影像药 学:药理学药物化学药物分析药物毒理学生物技术制药生药学中药学药用植物学方剂学卫生毒理学检 验:理化检验 临床检验基础护 理:外科护理妇产科护理儿科护理 社区护理五官护理护理学内科护理护理管理学中 医:中医基础理论中医学针灸学刺法灸法学口 腔:口腔内科口腔外科口腔正畸口腔修复口腔组织病理生物化学:生物化学细胞生物学病原生物学医学生物学分析化学医用化学其 它:人体解剖学卫生统计学人体寄生虫学仪器分析健康评估流行病学临床麻醉学社会心理学康复医学法医学核医学危重病学中国医史学
您现在的位置: 医学全在线 > 精品课程 > 卫生统计学 > 河北医科大学 > 正文:卫生统计学电子教材:第四章
    

卫生统计学-电子教材:第四章

卫生统计学:电子教材 第四章:第四章 常用概率分布第一节 二项分布一、二项分布的概念与特征 (一)成败型实验(Bernoulli实验) 在医学卫生领域的许多实验或观察中,人们感兴趣的是卫生资格考试网某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性等。将我们关心的事件A出现称为成功,不出现称为失败,这类试验就称为成-败型实验。指定性资料中的二项

第四章  常用概率分布

第一节   二项分布

一、二项分布的概念与特征  

(一)成败型实验(Bernoulli实验)

在医学卫生领域的许多实验或观察中,人们感兴趣的是卫生资格考试网某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性等。将我们关心的事件A出现称为成功,不出现称为失败,这类试验就称为成-败型实验。指定性资料中的二项分类实验。

成-败型(Bernoulli)实验序列:

满足以下三个条件的n次实验构成的序列称为成-败型实验序列。

  1)每次实验结果,只能是两个互斥的结果之一(A或非A)。

  2) 相同的实验条件下,每次实验中事件A的发生具有相同的概率π。(非A的概率为1-π)。

实际工作中要求π是从大量观察中获得的较稳定的数值。

  3) 各次实验独立。各次的实验结果互不影响。

(二)二项分布的概率函数

   二项分布是指在只能产生两种可能结果(如“阳性”或“阴性”)之一的n次独立重复实验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,…,n的一种概率分布。

若从阳性率为π的总体中随机抽取大小为n的样本,则出现“阳性”数为X的概率分布即呈现二项分布,记作:B(X;n,π)或B(n,π)。

举例 设实验白鼠共3只,要求它们同种属、同性别、体重相近,且他们有相同的死亡概率,即事件“白鼠用药后死亡”为A,相应死亡概率为π。记事件“白鼠用药后不死亡”为   ,相应不死亡概率为1-π。设实验后3只白鼠中死亡的白鼠数为X,则X的可能取值为0,1,2和3,则死亡鼠数为X的概率分布即表现为二项分布。

互不相容事件的加法定理

独立事件的乘法定理

构成成-败型实验序列的n次实验中,事件A出现   的次数X的概率分布为:

其中X=0,1,2…,n。  n,π是二项分布的两个参数 。

对于任何二项分布,总有

例4-2  临床上用针灸治疗某型头疼,有效的概率为60%,现以该疗法治疗3例,其中2例有效的概率是多大?

分析:治疗结果为有限和无效两类,每个患者是否有效不受其他病例的影响,有效概率均为0.6,符合二项分布的条件。

2例有效的概率是0.432

一例以上有效的概率为:

或:

(三)二项分布的特征

1.  二项分布的图形特征

n,π是二项分布的两个参数,所以二项分布的形状取决于n,π。可以看出,当π =0.5时分布对称,近似对称分布。当π ≠0.5时,分布呈偏态,特别是n较小时, π偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n 的增大,分布逐渐逼近正态。因此, π或1- π不太小,而n足够大,我们常用正态近似的原理来处理二项分布的问题。

2.  二项分布的均数和标准差

 对于任何一个二项分布B(X;n,π),如果每次试验出现“阳性”结果的概率均为π ,则在n次独立重复实验中,出现阳性次数

X的总体均数为:

方差为:

标准差为: 

例   实验白鼠3只,白鼠用药后死亡的死亡概率π=0.6,则3只白鼠中死亡鼠数X的

总体均数为:   =3×0.6=1.8(只)

方差为:  

标准差为: 

如果以率表示,将阳性结果的频率记为  , 则P的

总体均数

总体方差为

总体标准差为  

式中 是频率p的标准误,反映阳性频率的抽样误差的大小。

例4-4 如果某地钩虫感染率为6.7%,随机观察当地150人,样本钩虫感染率为p,求p的抽样误差 。

二、二项分布的应用

(一)   概率估计

例4-5  如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大?

(二)单侧累计概率计算

 二项分布出现阳性次数至少为K次的概率为

阳性次数至多为K次的概率为

例4-6 如果某地钩虫感染率为13%,随机观察当地150人,其中至多有2人感染钩虫的概率有多大?至少有2人感染钩虫的概率有多大?至少有20人感染钩虫的概率有多大?

至多有2名感染的概率为:

至少有2名感染的概率为:

至少有20名感染的概率为:

第二节  Poisson分布的概念与特征

  一、Poisson分布的概念

  Poisson分布也是一种离散型分布,用以描述罕见事件发生次数的概率分布。Poisson分布也可用于研究单位时间内(或单位空间、容积内)某罕见事件发生次数的分布,如分析在单位面积或容积内细菌数的分布,在单位空间中某种昆虫或野生动物数的分布,粉尘在观察容积内的分布,放射性物质在单位时间内放射出质点数的分布等。Poisson分布一般记作

Poisson分布作为二项分布的一种极限情况

Poisson分布可以看作是发生的概率π 很小,而观察例数很大时的二项分布。除要符合二项分布的三个基本条件外,Poisson分布还要求π或1-π接近于0和1。有些情况π和n都难以确定,只能以观察单位(时间、空间、容积、面积)内某种稀有事件的发生数X等来表示,如每毫升水中大肠杆菌数,每个观察单位中粉尘的记数,单位时间内放射性质点数等,只要细菌、粉尘、放射性脉冲在观察时间内满足以上条件,就可以近似看为Poisson分布。

二、Poisson分布的特征

1.Poisson分布的概率函数为: 

式中 为Poisson分布的总体均数,X为观察单位时间内某稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。

如某地20年间共出生短肢畸形儿10名,平均每年0.5名。就可用   代入Poisson分布的概率函数来估计该地每年出生此类短肢畸形儿的人数为0,1,2…的概率P(X)。

2.Poisson分布的特性:

(1)Poisson分布的的总体均数与总体方差相等,均为

(2)Poisson分布的观察结果有可加性。即对于服从Poisson分布的m个互相独立的随机变量X1,X2…XM,它们之和也服从Poisson分布,其均数为这m个随机变量的均数之和。

从总体均数为的服从Poisson分布总体中随机抽出一份样本,其中稀有事件的发生次数为X1,再独立地从总体均数为的Poisson分布总体中随机抽出另一份样本,其中稀有事件的发生次数为X2,则他们的合计发生数T=X1+X2也服从Poisson分布,总体均数为

Poisson分布的这些性质还可以推广到多个Poisson分布的情形。例如,从同一水源独立地取水样5次,进行细菌培养,每次水样中的菌落数分别为,均服从Poisson分布,分别记为,把5份水样混合,其合计菌落数也服从Poisson分布,记为,其均数为

医学研究中常利用Poisson分布的可加性,将小的观察单位合并以增大发生次数X,以便用正态近似法进行统计推断。

二、 Poisson分布的应用

(一)   概率估计

例4-7 如果某地新生儿先天性心脏病的发病概率为80/00,那么该地120名新生儿中有4人患先天性心脏病的概率有多大?

(二)单侧累计概率计算

Poisson分布出现阳性次数至多为K次的概率为

阳性次数至少为K次的概率为

例4-8 如果某地新生儿先天性心脏病的发病概率为80/00,那么该地120名新生儿中至多有4人患先天性心脏病的概率有多大?至少有5人患先天性心脏病的概率有多大?

至多有4人患先天性心脏病的概率:

至少有5人患先天性心脏病的概率

例4-9  实验显示某100cm2培养皿平均菌落数为6个,试估计该培养皿菌落数小于3个的概率,大于1个的概率。

该培养皿菌落数小于3个的概率

该培养皿菌落数大于1个的概率

三、二项分布、Poisson分布的的正态近似

1.二项分布的正态近似  

  二项分布的形状取决于n,π,当π=0.5时分布对称,当π≠0.5时,分布呈偏态,特别是n较小时, π偏离0.5越远,分布的对称性越差,随着n的增大,分布逐渐趋向于对称。理论上可以证明,不管π如何,当n相当大时,只要π不接近1和0时,特别是当nπ或n(1- π )都大于5时,二项分布B(X;n,π)近似正态分布N(nπ,nπ(1-π))。

二项分布累积概率的正态近似公式为:

为标准正态分布的分布函数

例4-14  如果某地钩虫感染率为13%,随机观察当地150人, 其中至少有20人感染钩虫的概率有多大?

n π=150×0.13=19.5

n(1- π)=150×(1-0.13)=130.5

至少有20人感染钩虫的概率为50%。

2.  Poisson分布的正态近似

  Poisson分布,当总体均数小于5时, 越小,分布越呈偏态,随着的增大,分布逐渐趋向于对称。理论上可以证明,随着Poisson分布也渐近为正态分布。当时,Poisson分布资料可按正态分布处理。

Poisson分布累积概率的正态近似公式为:

为标准正态分布的分布函数

例4-15  实验显示某放射性物质半小时内发出的脉冲数服从Poisson分布,平均为360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。

试估计该放射性物质半小时内发出的脉冲数大于400个的概率为1.66%。

第三节   正态分布

一、正态分布的概念

正态分布是自然界最常见的一种分布,若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。

正态分布的密度函数,即正态曲线的方程为

  -∞<X<+∞

均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。

对于任意一个服从正态分布N(μ,σ2)的随机变量,可作如下的标准化变换,也称Z变换,

标准正态分布的密度函数:

  -∞<Z<+∞

为标准正态分布的密度函数,即纵坐标的高度。

(二)、正态分布的特征

1.   关于对称。即正态分布以均数为中心,左右对称。

2. 在处取得概率密度函数的最大值,在 处有拐点,表现为 钟形曲线。即正态曲线在横轴上方均数处最高。

3. 正态分布有两个参数,即均数µ和标准差σ。

µ是位置参数,σ是变异度参数(形状参数)。常用N(µ,σ2)表示均数为μ  ,标准差为σ的正态分布;用N(0,1)表示标准正态分布。

4. 正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于100%或1。

二、正态曲线下面积的分布规律

正态方程的积分式(分布函数):

F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自-∞到X的面积,即下侧累计面积 。

标准正态分布方程积分式(分布函数):

Φ(Z)为标准正态变量 u的累计分布函数,反映标准正态曲线下,横轴尺度自-∞到Z的面积,即下侧累计面积 。

三、标准正态分布表

用查表代替计算必须注意:

1)表中曲线下面积为-∞到Z的面积。

2)当µ,σ和X已知时,先求出Z值,再用Z值查表,得所求区间占总面积的比例。当µ和σ未知时,要用样本均数和样本标准差S来估计Z值。

3)曲线下对称于0的区间,面积相等。

4)曲线下横轴上的面积为100%或1。

正态分布是一种对称分布,其对称轴为直线X=µ,即均数位置,理论上:

   µ±1σ范围内曲线下的面积占总面积的68.27%

   µ±1.96σ范围内曲线下的面积占总面积的95%

   µ±2.58σ范围内曲线下的面积占总面积的99%

实际应用中:

   ±1 S范围内曲线下的面积占总面积的68.27%

   ±1.96 S范围内曲线下的面积占总面积的95%

   ±2.58 S范围内曲线下的面积占总面积的99%

标准正态分布的µ=0,σ=1,则

µ±σ相当于区间(-1,1),

µ±1.96σ相当于区间(-1.96,1.96),

µ±2.58σ的区间相当于区间(-2.58,2.58)。

区间(-1,1)的面积:1-2Φ(-1)=1-2×0.1587=0.6826=68.26%
区间(-1.96,1.96)的面积:1-2Φ(-1.96)=1-2×0.0250=0.9500=95%
区间(-2.58,2.58)的面积:1-2Φ(-2.58)=1-2×0.0049=0.9902=99.02%

例 4-10 X服从均数为,标准差为的正态分布,,试估计(1)X取值在区间上的概率;(2)X取值在区间上的概率;

先做标准化变化:

 

正态曲线下面积对称,则区间(1.96,∞)的面积也是0.025。Z取值于(-1.96,1.96)的概率为1-2×0.025=0.95,即X取值在区间上的概率为95%。

例 4-11   已知某地1986年120名8岁男童身高均数医学检验网,S=4.79 cm  ,估计(1)该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的百分比;(2)身高界于120cm~128cm者占该地8岁男孩总数的比例;(3)该地80%男孩身高集中在哪个范围?

(1)先做标准化变化:

理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的7.21%。

(2)

(3)

查附表1,标准正态分布曲线下左侧面积为0.10所对应的Z值为-1.28,所以80%的8岁男孩身高值集中在区间内,即116.9cm~129.2cm

四、正态分布的应用

(一)制定医学参考值范围

参考值范围:指特定的“正常”人群的解剖、生理、生化、免疫等各种数据的波动范围。

制定参考值范围的步骤:
 1.  选择足够数量的正常人作为调查对象。
 2.  样本含量足够大。
 3.  确定取单侧还是取双侧正常值范围。
 4.  选择适当的百分界限。
 5.  选择适当的方法。

估计医学参考值范围的方法:
  1.  正态近似法:适用于正态分布或近似正态分布的资料。 
  2.  百分位数法:适用于偏态分布资料。

例4-12  某地调查120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为117.4g/L,标准差为10.2g/L ,试估计该地正常女性血红蛋白的95%医学参考值范围。

分析:正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。

该指标的95%医学参考值范围为

例3.6 某地调查110名正常成年男子的第一秒肺通气量,得均数为4.2 L,标准差为0.7 L ,试估计该地正常成年男子第一秒肺通气量的95%参考值范围。

分析:正常人的第一秒肺通气量近似正态分布,且只以过低为异常,要制定单侧下限。

该地正常成年男子第一秒肺通气量的95%参考值范围为:不低于3.052L。

例 3 某年某市调查了 200例正常成人血含量(μg/100g)如下,试估计该市成人血铅含量的95%医学参考值范围。

分析:血铅的分布为偏态分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。

二、质量控制
   为了控制实验中的检测误差,常用±2S作上下警戒线,以±3S作为上下控制线。这里的2S和3S可视为1.96S 和2.58S的约数。其依据是正常情况下检测误差是服从正态分布的。

判断异常的8种情况是:

v 有一个点距中心线的距离超过3个标准差(控制限以外)

v 在中心线的一侧连续有9个点

v 连续6个点稳定地增加或减少

v 连续14个点交替上下

v 连续3个点中有两个点距中心线距离超过2个标准差(警戒限以外)

v 连续5个点中有4个点距中心线距离超过1个标准差

v 中心线一侧或两侧连续15个点距中心线距离都超出1个标准差以内

v 中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围。

三、统计处理方法的理论基础

如  统计描述中计算算术平均数、标准差、

   统计推断中进行总体均数置信区间估计、t 检验、F 检验、相关与回归等分析

1.标准正态分布的均数与标准差是( )

A 0,1   B 1,0  C  0,0   D 1,1

2.正态分布的两个参数μ与σ,( )对应的正态曲线愈趋扁平。

A μ愈大   B μ愈小 C σ愈大  D σ愈小

3.正态分布的两个参数μ与σ,( )对应的正态曲线平行右移。

A 增大μB 减小μ   C 增大σ  D 减小σ

4. 随机变量X服从正态分布N(μ1,σ12),随机变量Y服从正态分布N(μ2,σ22),X与Y独立,则X-Y服从( )

A  N(μ1+ μ2,σ12- σ22)  B  N(μ1- μ2,σ12- σ22)   C  N(μ1-μ2,σ12+σ22)D  N(0σ12+σ22)

5. 二项分布的概率分布图在(  )条件下为对称图形。

A n>50  B π=0.5 C=1   D   nπ>5

6. ( )的均数等于方差。

A  正态分布B  二项分布  

C  Poisson分布  D  对称分布

7. 设X1,X2分别服从以λ1,λ2为均数的Poisson分布,且X1,X2独立,侧X1,X2服从以(  )为方差的Poisson分布。

A λ12+λ22  B λ1+λ2  C(λ1+λ2)2   D (λ1+λ2) -1/2

8. 满足(  )时,二项分布B(n ,π)近似正态分布。

A nπ 和n(1-π) 均大于等于5 B nπ 或n(1-π) 均大于等于5

C n>50D   nπ足够大

9. 满足(  )时,Poisson分布P(λ)近似正态分布。

A λ无限大B λ>20

C λ =1 D λ =0.5

10. 满足( )时,二项分布B(n ,π)近似Poisson分布。

A nπ 和n(1-π) 均大于等于5  B n~∞

C n很大且π接近0.5D n很大且π接近0

11. 观察某地100名12岁男孩身高,均数为138.00cm,标准差为4.12cm,Z=(128.00-138.00)/4.12。Φ(Z)是标准正态分布的分布函数,1- Φ(Z)=1- Φ(-2.43)=0.9925,结论是( )

A 理论上身高低于138.00cm的12岁男孩占99.25%

B 理论上身高高于138.00cm的12岁男孩占99.25%

C 理论上身高低于128.00cm的12岁男孩占99.25%

D 理论上身高高于128.00cm的12岁男孩占99.25%

...
关于我们 - 联系我们 -版权申明 -诚聘英才 - 网站地图 - 医学论坛 - 医学博客 - 网络课程 - 帮助
医学全在线 版权所有© CopyRight 2006-2046, MED126.COM, All Rights Reserved
皖ICP备06007007号
百度大联盟认证绿色会员可信网站 中网验证