正态分布

(重定向自高斯分配
跳转到: 导航, 搜索

正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。

目录

正态分布

正态分布的由来

normal distribution

正态分布

一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。

生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。

附:这种分布的概率密度函数为:(如右图)

正态分布公式

  

正态分布

1.正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~ 。其中μ、σ2 是两个不确定常数,是正态分布的参数,不同的μ、不同的σ2对应不同的正态分布。

正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。

2.正态分布的特征:服从正态分布的变量的频数分布由μ、σ完全决定。

(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。

(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。 也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。  

正态曲线下面积分布

1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。

2.几个重要的面积比例 轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。  

标准正态曲线

1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,通常用ξ(或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。

2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。

3. 标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例 。  

一般正态分布与标准正态分布的转化

由于一般的正态总体 其图像不一定关于y轴对称,对于任一正态总体 ,其取值小于x的概率 。只要会用它求正态总体 在某个特定区间的概率即可。 “小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。  

一般正态分布与标准正态分布的区别与联系

正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。

两者特点比较:

(1)正态分布的形式是对称的,对称轴是经过平均数点的垂线。

(2)中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。

(3)正态曲线下的面积为1。正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。

(4)正态分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过Z分数公式转换成标准正态分布。  

主要特征

1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。

2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

5、u变换:为了便于描述和应用,常将正态变量作数据转换。  

发展

正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。

其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。  

应用

综述

1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2. 制定参考值范围

(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

3. 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。  

估计正态分布资料的频数分布

例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。

本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3。

表3 100名18岁男大学生身高的实际分布与理论分布

分布 x+-s 身高范围(cm) 实际分布 人数 实际分布 百分数(%) 理论分布(%)
X+-1s 168.69~176.71 67 67.00 68.27
X +-1.96s 164.84~180.56 95 95.00 95.00
X+-2.58s 162.35~183.05 99 99.00 99.00

  

制定医学参考值范围

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:

(1)正态分布法:适用于正态或近似正态分布的资料。

双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S

(2)对数正态分布法:适用于对数正态分布资料。

双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。

常用u值可根据要求由表4查出。

(3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。

双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。

表4常用u值表

参考值范围(%) 单侧 双侧
80 0.842 1.282
90 1.282 1.645
95 1.645 1.960
99 2.326 2.576

  

统计方法的理论基础

如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。  

概率论中最重要的分布

正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。  

主要内涵

在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下:  

整体论

正态分布启示我们,要用整体的观点来看事物。“系统的整体观念或总体观念是系统概念的精髓。” 正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。  

重点论

正态分布曲线及面积分布图非常清晰的展示了重点,那就是基区占68.27%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合20/80法则,我们更可以大胆的把正区也可以看做是重点。  

发展论

联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。

总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。  

研究过程

正态分布的概念及特征:

一、正态分布的概念

由一般分布的频数表资料所绘制的直方图,图(1)可以看出,高峰位于中部,左右两侧大致对称。我们

正态分布研究图1

设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。

为了应用方便,常对正态分布变量X作变量变换。

Bki3b.jpg

该变换使原来的正态分布转化为标准正态分布 (standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。

正态分布研究图2

二、正态分布的特征:

1.正态曲线(normal curve)在横轴上方均数处最高。

2.正态分布以均数为中心,左右对称。

3.正态分布有两个参数,即均数μ和标准差σ。μ是位置参数,当σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。通常用N~(μ,σ2)表示均数为μ,方差为σ2的正态分布。用N(0,1)表示标准正态分布。

4.正态曲线下面积的分布有一定规律。

正态分布研究图3

实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。

查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴

正态分布面积图1

上的总面积为100%或1。

图2 正态曲线与标准正态曲线的面积分布

第二节 正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。

正态分布面积图2

  

人格

人格(personality)或称个性,是用来描述个体心理差异的,指个体总的精神面貌,是人体心理特征的总和。由于人格差异,个体在各种不同的环境中表现出各自不同的稳定而持久的行为模式。或者说,人格给个体的行为打上了独特的烙印。人格包含性格、气质、能力、兴趣、爱好等成分。其中性格为表现在人的态度和行为方面的特征,主要由于后天学习和生活锻炼而形成的,是人格重要组成部分。气质俗称“脾气”,主要指由于先天遗传,加上后天影响,形成一般较小的特征,如情绪体验的快慢、强弱以及动作反应的敏感迟钝,就属于气质范畴。它不能决定人格特征的内容,只能使人的人格带上一定的色彩。

了解个体的人格特征,不但可以预测个体在特殊情况下的行为反应,而且,不同的人格可能表现出不同的患病倾向。例如,近代研究表明,A型行为与冠心病明显相关,被认为是易患冠心病的危险因素。在精神病学临床上,病人的人格不仅决定了他患病后的行为,而且为某种精神疾病的发生准备了基础。例如,强迫症病人常有某种焦虑、刻板、固执、自信不足的精神衰弱人格,癔症病人常有情感不稳、易受暗示、自我中心的表演性格。有时,人格所表现的独特行为方式可能和精神疾病混淆起来,导致论断错误。

人格的差异有不同的程度。有些人的人格较为健全,在面对应激性事件时,依然能够很好应对。有些人的人格较为脆弱,在应激性事件作用下,易于发生神经症性障碍。对于细小的事情总是忧虑的人,在困难的情境中更容易产生焦虑障碍,而相同的情境对其他人却没有这种影响。如果人格更为脆弱,那么,异常行为可能在没有应激性事件的情况下出现。有时,这种异常行为表现非常明显,以致难以判断这些行为是由于人格还是由于精神疾病所致。(注A型行为:美国心脏病医生梅伊&弗瑞德曼在诊室里接待了一位来家具的修家具商。家具商说他一定是接待了许多焦虑不安的人,医生问他为什么?他说办公室里沙发和椅子的手柄磨损得特别快,这表明医生的许多病人坐下以后都必定是焦虑不安地握住扶手。根据这一灵感,弗瑞德曼和他的同事瑞.罗森曼开始了他们的研究工作,最后形成了A型行为类型的理论。

在现实生活中,有这么一种人,做一件事总想一下子干完,不干完不踏实。他总觉得时间紧张,不够用;走起路来风风火火,上楼梯也是三步并两步;坐公共汽车,遇到交通拥挤车开得慢,他坐立不安,恨不得把司机换下来,自己开;若要排长队买东西,他宁可不买;做工作总要尽善尽美,比别人好,让领导说不出什么;也不喜欢别人插手的工作,总觉得不如自己干得好;他有很强的竞争欲,也有很强的嫉妒心,人际关系也比较紧张。这种行为方式被称为:“A 型行为”。与之相对的行为方式则被称为 “B型行为”。

弗瑞德曼和罗森曼通过近十年的研究,发现A型行为被试者冠心病的发病率是B型被试者发病率的2倍以上。

A型行为类型并不是一种单一的心理素质和行为表现方式,而是包含了以人格为基础 的行为,性格和情感元素的一个复合因素群或行为群。是不同的人格由相应的竞争和挑战性环境塑造的一整套的外显行为,是介于典型的A型行为到典型的非A型行为之间的行为连续体。目前把行为类型分为五型:A、mA、M、mB、B。A型是A型行为人的极端型,有强烈的进取心和竞争欲。有时间紧迫感,人际关系不协调,有敌意倾向。mA是一种不那么明朗和极端的A型人。B是B型行为人中的极端型,是与A型行为相反的一种类型,缺乏竞争性,喜欢不紧张的工作,喜欢过松散的生活,无时间紧迫感,有耐心,无主动的敌意。mB不像B型表现得那么明朗和极端。M是介于A型和B型之间的一种混合型。)

人格和疾病在概念上的区分,在临床上具有重要价值,但这种区分并不都容易。核心在于能否确定行为异常的病程。如果一个人以前行为正常,以后产生了异常行为,他被认为有病。如果他的行为以往和现在一样反常,他被认为可能有人格障碍(personality disorder)。这种区分在行为改变急速显著时容易做到,如急性躁狂症。但在行为改变缓慢不显著时,这种区分就有困难,例如,某些精神分裂症

由于人们的人格特征存在许多差异,于是就产生了人格类型的概念。C.G.Jung把人格分为“内倾”和“外倾”两类。孤僻好静,自负清高、不苟言笑、不善交友、不爱劳动、不肯合群、不喜欢参加集体活动 、对人冷淡、胆小怕羞、生性多疑、多思多虑、怕负责任、有时想入非非、脱离现实,是“内倾”人格的典型特征。而“外倾”的人格特征则与此相反。Kretschmer曾将病人的人格、体型与所患的精神病联系起来研究,提出了所谓“分裂症型”和“情感性循环型”两种。实际上“分裂症型”类似Jung的“内倾型”,“情感性循环型”类似“外倾型”。他认为内倾人格患病多为精神分裂症,而外倾人格多为躁狂抑郁症。

有些人的人格是明显异常的,例如,反复伤害人而从无悔恨之心的狂暴冷酷的人。但人格障碍的概念却不易说明,因为对人格的正常或异常并无明确的划分标准。有两种标准对确定这个问题有帮助。其一是统计学标准,假定人格的每一种心理特征也像身高、体重、智能一样在人群中呈近似正态分布。那么,变态人格(abnormal personality)是正常人格的量的变异,其界线由统计学评分结果人为地规定。如果一个人的某些心理特征发展到变动的极端,就可以认为他有人格障碍。

正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

应用正态分布的具体研究实例智力研究

理查德.赫恩斯坦 [(Richard J. Herrnstein 1930.05.20-1994.09.13),美国比较心理学家]和默瑞(Charles Murray)合著《正态曲线》一书而闻名,在该书中他们指出人们的智力呈正态分布。智力主要是遗传的并因种族的不同而不同,犹太人、东亚人的智商最高,其次为白人,表现最差的是黑人、西班牙裔人。他们检讨了数十年来心理计量学与政策学的研究成果,发现美国社会轻忽了智商的影响愈变愈大的趋势。他们力图证明,美国现行的偏向于以非洲裔和南美裔为主的低收入阶层的社会政策,如职业培训、大学教育等,完全是在浪费资源。他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和黄种人;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。  

能力研究

弗朗西斯.高尔顿 弗朗西斯.高尔顿 [Francis Galton 1822.02.16-1911.01.17],英国探险家、优生学家、心理学家,差异心理学之父,也是心理测量学生理计量法的创始人。 高而顿对心理学的贡献,大概可以归纳未差异心理学、心理测量的量化和实验心理学三方面:

1.他率先研究个体差异。他在伦敦南肯辛顿博物馆他的人类测量实验室内,利用仪器作人类学测量及心理测量。测量项目有身高、体重、肺活量、拉力和握力、扣击的速率、听力、视力、色觉等,以研究能力的个体差异。又用问答法研究意象的个体差异。要求被试先确定一件事,如早餐的情境,然后被试回忆心目中出现餐桌上实物的意象,即食物的鲜明度、确定度等。对答案整理后,他发现被试的意象有很大的个体差异:有的人以肌肉运动觉意象为主,有的人以听觉意象为主,有的人以视觉意象为主。 他强调遗传是形成个体差异的原因。他通过谱系调查,论证遗传因素与个体差异的关系。

他是第一个明确提出普通能力和特殊能力主张的人。他在调查 1768-1868 年这 1OO 年间英国的首相、将军、文学家和科学家共 977 名获得智力成熟的人的家谱后发现,其中有 89 个父亲、129 个儿子、114 个兄弟,共 332 名杰出人士。而在一般老百姓中 4000 人才产生一名杰出人士。因此断言“普通能力”是遗传的。在调查 30 家有艺术能力的家庭中,他发现这些家庭中的子女也有艺术能力的占 64%;而 15O 家无艺术能力的家庭,其子女中只有 21% 有艺术能力,因此断言艺术能力 - “特殊能力”也是遗传的。他发现,遗传亲属关系程度的降低,杰出亲属的比例也显著地下降。

他还用 80 对双生子的资料,以双生子比其他亲兄弟、亲姐妹在心理特点上更为相像的事例,证明人的心理完全是遗传的。由此也使他第一个注意到同卵双生异卵双生在估计遗传和环境因素在人的变异方面的相对作用的方法论的重要性。高尔顿根据遗传与个体差异的关系倡导善择配偶,改良人种,并再 1883 年《人类才能及其发展的研究》一书中首创“优生学”这一术语。

2.心理学研究之量化,始自高尔顿。他发明了许多感官和运动的测试,并以数量代表所测得的心理特质之差异。他认为人的所有特质,不管是物质的还是精神的,最终都可以定量叙述,这是实现人类科学的必要条件,故最先应用统计法处理心理学研究资料,重视数据的平均数与高中差数。他收集了大量资料证明人的心理特质在人口中的分布如同身高、体重那样符合正态分布曲线。他在论及遗传对个体差异的影响时,为相关系数的概念作了初步提示。如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,父母的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与其父母略有差别,而呈现“回中”趋势,即离开其父母的身高数,而回到一般人身高的平均数。

3.1883 年,高尔顿出版了《人类才能及其发展的研究》,书中概括地表述了两项在实验心理学中极为重要的研究方法和成果。第一个是关于自由联想的实验:他事先在 75 张纸条上各写一个单词,每次只让受试者看一张纸条,再用一个精密的计时器测出由此引出的两个即兴到来的联想所需的时间,然后对这些联想在受试者的经验中的可能起源加以分析,他发现最经常的联想往往来自遥远的童年。在这项实验中,他还证实人类具有一种看到或听到某一数字就能联想到某一特定形状的能力,他称这种现象为“数目形”。第二个是关于心理意象的广泛调查:他要求受试者先想一件确定的东西,然后尽量注意自己的“心视”画面,并回答如明亮度,清晰度、色彩等一系列问题,并按其强度记分。

值得一提的是,在这些研究中,他首先在心理学中引进了调查表和评分办法。他对实验心理学的贡献还包括一系列他所发明的心理测验仪器和测验方法。有些仪器后来就以他的名字来命名,例如测量听觉阈的高尔顿笛和测量视觉范围的高尔顿棒,这些仪器直到 20 世纪 30 年代都是心理实验室的标准仪器。他还用盛有不同物质的瓶子来测验嗅觉,这一方法被后人沿用至今。除此之外,他又设计了测量肌肉感觉、反应力、触觉的仪器和方法。

注:美国心理学家特尔曼(L. M. Terman)曾根据有关文献的记载,用他自己设计的斯坦福 - 比纳标准对幼年的高尔顿的智力进行了估算,他认为高尔顿 3-8 岁间的智力年龄几乎等于实际年龄的 2 倍,其智商约为 200。  

考试成绩及学生综合素质研究

教育统计学 统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。

从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。现在许多教育专家(如上海顾泠沅 、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。 通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。

关于“正态分布”的留言: Feed-icon.png 订阅讨论RSS

目前暂无留言

添加留言

更多医学百科条目

个人工具
名字空间
动作
导航
推荐工具
功能菜单
工具箱