StatisticalandApplication统计学与应用,2015,4(4),319-334PublishedOnlineDecember2015inHans.
http://www.
hanspub.
org/journal/sahttp://dx.
doi.
org/10.
12677/sa.
2015.
44036文章引用:申小征,吴仍康.
t分布及其应用的探讨[J].
统计学与应用,2015,4(4):319-334.
http://dx.
doi.
org/10.
12677/sa.
2015.
44036Discussionont-DistributionandItsApplicationXiaozhengShen,RengkangWuSchoolofStatisticsandMathematics,YunnanUniversityofFinanceandEconomics,KunmingYunnanReceived:Dec.
9th,2015;accepted:Dec.
27th,2015;published:Dec.
30th,2015Copyright2015byauthorsandHansPublishersInc.
ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).
http://creativecommons.
org/licenses/by/4.
0/AbstractThet-distributionisanimportantdistributioninstatistics,ithasveryimportantapplicationintheintervalestimationandhypothesistest,includingt-testintheintervalestimationofsinglesam-ples,twosamplesofindependentintervalestimation,onesampleofthemeantest,twosamplemeandifference.
Thepaperintroducesthenatureoft-distributionanditsapplicationinreallife,suchasproductlife,fishery,agriculture,andalsoachievesasinglesampleandtwosamplet-testinthetestofhypothesiswiththehelpofthestatisticalsoftwareSPSS.
Keywordst-Distribution,IntervalEstimation,t-Text,SPSSSoftwaret分布及其应用的探讨申小征,吴仍康云南财经大学统计与数学学院,云南昆明收稿日期:2015年12月9日;录用日期:2015年12月27日;发布日期:2015年12月30日摘要t分布是统计学中的一类重要分布,它在区间估计和假设检验中有很重要的应用,具体包括单样本的区间申小征,吴仍康320估计、独立两样本的区间估计、单样本的均值检验、两样本均值差的t检验.
文中详细介绍了t分布定义性质及其在产品寿命、渔业、农业等实际生活中的应用,并借助统计软件SPSS实现单样本t检验和两样本t检验.
关键词t分布,区间估计,t检验,SPSS软件1.
引言t分布是统计学中的一类重要分布,英国统计学家哥塞特(Gosset)发现了它与标准正态分布的微小差别,在置信区间估计和显著性检验问题的计算中起到了重要作用.
从各种有关统计资料中可以发现很多有关t分布的应用,例如在渔业中、农业、工业等中的应用,为此可用t分布进行区间估计和假设检验来解决一些实际生活问题.
t检验是假设检验方法最常用方法之一,常用于正态总体均值的假设检验.
单边检验和双边检验的拒绝域在许多统计学和概率论的教材中都给出了明确的定义.
当样本数据比较多的时候,t检验方法虽然简单,但其计算量仍然比较大,因此我们可以使用SPSS软件来实现t检验.
本文用SPSS13.
0分别讨论了单样本与独立两样本两种情形的t检验.
2.
t分布2.
1.
t分布的定义[1]假设随机变量()()212~0,1,~,XNXnχ且变量1X与变量2X相互独立,则称12XtXn=的分布为自由度为n的t分布,记作()~ttn.
下面导出t分布的密度函数.
由标准正态密度函数的对称性可知,1X与1X相同分布相同,从而t与t有相同分布.
这说明:对任意实数y有000,PtyPtyPyt于是()()2210.
2PtyPty,我们计算概率()Pxε(3)的假设检验问题成为右边检验在单个正态总体()2,Nσ均值的检验中,当σ未知时,可选用t检验中(1)、(2)、(3).
σ未知时,()1,tnsxnα+∞是的一个置信水平为()1α的单侧置信区间,其中()1tnsxnα是置信下限,即对于任意的∈Θ,有申小征,吴仍康326()11tnsPxnαα.
(4)考虑右边检验0010:,:HH≤>,其拒绝为()1ttnα≥,等价于()()01xntnsα≥,(5)恒等变形得()01tnsxnα,即()01,tnsxnα+∞;同理如果()01,tnsxnα∈+∞,则()01tnsxnα>,恒等变形得()01xtnsnα,建立数据文件,然后点击软件SPSS13.
0中"Analyze→DescriptiveStatistics→Explore"[5]-[10]就能得出图2的结果,其中置信度设置为12120.
0590%α由图2可知,均值的置信度为10.
95α=的单侧置信区间为()182.
6487,+∞.
又因为()225182.
6487,∈+∞,所以在显著性水平0.
05α=下接受0H,故认为该产品的平均使用寿命小于等于225小时.
Table3.
Theservicelifeoftheproductismeasuredin16(unit:h)表3.
测得16只产品的使用寿命(单位:h)159280101212224379179264222362168250149260485170申小征,吴仍康327Figure2.
Asampleofasampleofaproduct图2.
某种产品抽样样本数据表2)单样本t检验在农业中的应用例3.
2有一种新型农药防治柑桔红蜘蛛,进行了9个校区的实验,其防治效果为:95%,92%,88%,92%,93%,95%,89%,98%,92%,与原用农药的防治效果90%比较,分析其效果是否高于原用农药.
解:在这里应用spss13.
0软件来分析,在数据编辑窗口输入分析数据,在软件spss13.
0主菜单中选中"Analyze→CompareMeans→One-SampleTTest",打开单一样本T检验主对话框,从左边的变量列表中选中"防治效果"变量之后,点击中部的右拉按钮,使得这个变量就进入到检验分析"TestVariable(s):"框里,用户可以从左边变量列表里选择一个或多个变量进行分析.
在"TestVariable(s)"输入栏里,输入用于比较检验的均值:在本例中为90.
单击"Options"按钮,打开设置检验的置信度和缺失值对话框.
在"ConfidenceInterval:"框输入置信度水平,系统默认为95%.
在"MissingValues"栏里选择缺失值处理方式:输入完成后,在过程主窗口中单击"OK"按钮,SPSS输出分析结果如图3.
从图3中读取数值,t值为2.
596,Sig.
(2-tailed)为单边t检验的显著性概率0.
032,小于0.
05,由此得出结论:新型农药和原用农药差异显著.
3)单样本t检验在材料中的应用例3.
3某种汽车配件的平均长度要求为12cm,高于或低于标准均被认为是不合格的.
汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供的样品进行检验,用来决定是否购进此汽车配件.
现在对一个配件提供商提供的10个样本进行了检验.
结果如表4.
假设该供货商生产的配件长度服从正态分布,在0.
05的显著性水平下,检验该供货商提供的配件长度符合标准要求解:依题意建立如下原假设与备择假设:01:12,:12HH=≠根据样本数据计算得:11.
89,0.
49322xs==由于30n,故与检验值151.
70没有显著性差异,这批牙膏的重量是符合质量要求.
从图5中可知经单样本双侧t检验得到的显著性水平0.
6510.
05P=>,故与检验值156.
50没有显著性差异,这批牙膏灌装后的管长符合质量要求.
对于牙膏来说重量明显大于或小于标准值,通常需要进行设备调整,重量太大,会增加相对的损耗,也容易在灌装过程中造成牙膏软管破损;重量太轻,就会损害消费者的权益.
故t检验在牙膏质量检测中起着非常重要的作用.
4.
2.
独立两样本t检验4.
2.
1.
独立两样本t检验定义[1]独立两样本t检验可用于两正态总体均值差的建设检验,设12,,,mxxx是来自正态总体()211,Nσ的样本,12,,,nyyy是来自正态总体()222,Nσ的样本,1122,,,σσ均未知.
两样本相互独立,即他们的样本均值分别为x和y,样本方差为21s和22s,考虑检验问题:()012112:,:,HHδδδ≤>为已知常数,(7)1.
当22212σσσ==时,选用检验统计量()()~211xyttmnsmnδ=++,()()22122112wmsnssmn+=+其中;One-SampleTest2.
59680.
0322.
666670.
29755.
0359防治结果tdfSig.
(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=90申小征,吴仍康329Table5.
Weighing30toothpaste(unit:g)表5.
30支牙膏的称重(单位:g)152.
50150.
80152.
68149.
96150.
52151.
45151.
50152.
03151.
57150.
78151.
75151.
71150.
87149.
68152.
75151.
87148.
86153.
01152.
27151.
95151.
58151.
78151.
89152.
11151.
45150.
78151.
79151.
65151.
68153.
02Table6.
30toothpastefillingtube(unit:mm)表6.
30支牙膏灌装后管长(单位:mm)156.
35155.
89157.
12156.
01156.
45156.
21156.
30157.
04155.
99157.
67156.
67156.
45156.
43156.
36156.
46156.
29156.
47156.
15155.
98156.
98156.
54156.
50155.
57157.
02157.
95156.
00156.
15156.
42155.
67156.
59Figure4.
Toothpastefillingweightttestresults图4.
牙膏灌装重量t检验结果Figure5.
Toothpastefillingtubeofttestresults图5.
牙膏灌装管长t检验结果2.
当2212σσ≠,用校正的t检验,此时()()2212~xyttnssmnδ=+,(8)One-SampleStatistics30151.
54130.
948860.
17324重量NMeanStd.
DeviationStd.
ErrorMeanOne-SampleTest-0.
916290.
367-0.
15867-0.
51300.
1956重量tdfSig.
(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=151.
70One-SampleStatistics30156.
45600.
526840.
09619管长NMeanStd.
DeviationStd.
ErrorMeanOne-SampleTest-0.
457290.
651-0.
04400-0.
24070.
1527管长tdfSig.
(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=156.
5申小征,吴仍康330其自由度n计算如下()222122121,11ksmknkmnsmsn=+=+.
与单边单样本t检验类似,在单边独立两样本t检验(7)中,也可先求出量总体均值差12的置信度为12α置信区间,从而可以求出12的置信度为1α单侧置信区间,再根据δ是否属于单侧置信区间,则接受0H;否则拒绝0H.
4.
2.
2.
独立两样本t检验的应用1)独立两样本t检验在啤酒业中的应用例3.
5[1]在20世纪70年代后期,在酿造啤酒的时候人们发现麦芽的干燥过程中容易形成对人体有伤害的致癌物质亚硝酸二甲胺(NDMA).
到了20世纪80年代初期为了避免酿造啤酒时麦芽干燥过程产生致癌物质亚硝酸二甲胺,研发了一种新型的麦芽干燥过程.
下面给出了新老两种麦芽在干燥过程中形成的亚硝酸二甲胺含量(以下数据以20亿份中的份数统计得到):假设该两样本分服从自正态总体分布,单参数均未知,且该两样本相互独立,分别以12,记对应于老、新过程两样本的总体均值、试检验假设()0.
05α=012112:2,:2HH≤>首先将新老两种麦芽在干燥过程中形成的亚硝酸二甲胺含量(表7)数据输入到SPSS13.
0中,点击"Analyze→CompareMeans→Independent-SamplesTtest[6][7][9]",设置好其中的检验变量和分组变量,在选项中设置其置信度为12120.
0595%α再点击"Continue→OK",得到图6,图7的分析结果.
从图6中可知,0.
8390.
05P=>,故可以认为新、老干燥过程的资料的方差齐,其中两样本均值差12的90%的置信区间为()3.
061,4.
439,因此()3.
061,+∞,是两样本均值差12的95%的单侧置信区间,由于()23.
061,δ=∈+∞,故在显著性水平0.
05α=下拒绝0H,即可认为老、新干燥过程的均值差大于2.
2)独立两样本t检验在农业中的应用例3.
6[2]在某个有小麦丛矮病的麦田里,调查了13株病株和11株健株的植株高度,分析健株高度是否比病株高.
其调查数据如表8.
解:应用SPSS分析,在SPSS中输入数据,在数据编辑窗口输入首先将上述数据输入到SPSS中,点击"Analyze"中的CompareMeans并点击Independent-SamplesTtest,设置好检验变量和分组变量,在Table7.
Nitritecontentintheformationofnewandoldtwomethylaminetwomaltdryingprocess[2]表7.
新老两种麦芽干燥过程中形成的亚硝酸二甲胺含量[2]老过程645565564674新过程212210321013Figure6.
StatisticresultoftheNitritecontentintheformationofnewandoldtwomethylamineinthedryingprocess图6.
新老干燥过程中形成的亚硝酸二甲胺含量的统计量结果GroupStatistics125.
25000.
965310.
27866121.
50001.
000000.
28868新老1.
002.
00NDMA含量NMeanStd.
DeviationStd.
ErrorMean申小征,吴仍康331Figure7.
Theresultsofttestofnitritecontentoftwomethylamineformingnewoldtwokindsofmaltinthedryingprocess图7.
新老两种麦芽干燥过程中形成的亚硝酸二甲胺含量的t检验结果Table8.
Theplantheightof11strainsand13strainsofplanthealth表8.
11株健株和13株病株的植株高度健株26.
032.
437.
337.
343.
247.
351.
855.
857.
864.
065.
3病株16.
719.
819.
823.
323.
425.
036.
037.
341.
441.
745.
748.
257.
8选项中设置置信度水平,设置为95%的置信度水平,输入完成,在过程主窗口中单击"OK"按钮,SPSS输出分析结果如下图8,图9.
分析:从图9可知t的值是2.
539,sig.
(2-tailed)是双边t检验的显著性概率为0.
019,小于0.
05,可以得出结论:健株与病株的株高差异显著.
3)独立两样本t检验在工业的应用例3.
7[4]某工厂铸造车间为了提高铸件的耐磨性,制造了一种镍合金铸件用来代铜合金铸件,从两种铸件中分别抽取一个容量分别为8和9的样本,分别测得其硬度(一种耐磨性指标)为(表9).
根据专业经验,硬度服从正态分布,且方差保持不变,试在显著性水平0.
05α=下判断镍合金的硬度是否有明显提高.
解:用X表示镍合金的硬度,Y表示铜合金的硬度,则有假设定,2212XNYNσσ,要检验的假设是012:H=vs112:H>.
由于两者方差未知但相等,所以采用两样本t检验,经计算,73.
39,68.
2756xy==,()821205.
7958iixx==∑()92191.
1552iiyy==∑从而()1205.
795891.
15524.
4494892ws=+=+,73.
3968.
27562.
3656114.
449489t==*+,查表知()0.
95151.
7531t=,由于()0.
9515tt>,故拒绝原假设,可判断镍合金硬度有显著提高.
应用SPSS分析,得出图10和图11:由图11可知t的值是2.
423,sig.
(2-tailed)是双边t检验的显著性概率为0.
028,小于0.
05,故也可判断镍合金硬度有显著提高.
IndependentSamplesTest0.
0420.
8399.
346220.
0003.
750000.
401232.
917904.
582109.
34621.
9730.
0003.
750000.
401232.
917844.
58216EqualvariancesassumedEqualvariancesnotassumedNDMA含量FSig.
Levene'sTestforEqualityofVariancestdfSig.
(2-tailed)MeanDifferenceStd.
ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeans申小征,吴仍康332Figure8.
Statisticresultsofhighlyhealthyandstrainplants图8.
健株病株高度的统计量结果Figure9.
ttestresultsofhighlyhealthyandstrainplants图9.
健株病株高度的t检验结果Table9.
Hardnessof8nickelalloyand9copperalloycastings表9.
8个镍合金和9个铜合金铸件的硬度镍合金76.
4376.
2173.
5869.
6965.
2970.
8382.
7572.
34铜合金73.
6664.
2769.
3471.
3769.
7768.
1267.
2768.
0762.
61Figure10.
Statisticalresultsofthehardnessofnickelalloy图10.
镍合金硬度的统计量结果Figure11.
ttestresultsofthehardnessofnickelalloy图11.
镍合金硬度的t检验结果例3.
8[10]甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布()()221122,,,NNσσ,并且有2212σσ=,为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到两台机床加工零件的样本直径数据如表10:在0.
05α=的显著性水平下,样本数据是否提供证据支持"两台机床加工的零件直径不一致"的看法解:提出的原假设和备择假设为:GroupStatistics1147.
109113.
029773.
928621333.
546213.
043683.
61767状态1.
002.
00株高NMeanStd.
DeviationStd.
ErrorMeanIndependentSamplesTest0.
0380.
8472.
539220.
01913.
562945.
341062.
4862624.
639612.
54021.
3540.
01913.
562945.
340562.
4678424.
65804EqualvariancesassumedEqualvariancesnotassumed株高FSig.
Levene'sTestforEqualityofVariancestdfSig.
(2-tailed)MeanDifferenceStd.
ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeansGroupStatistics873.
39005.
234441.
85066968.
27563.
375551.
12518材料1.
002.
00硬度NMeanStd.
DeviationStd.
ErrorMeanIndependentSamplesTest1.
1310.
3042.
423150.
0285.
114442.
110420.
616209.
612692.
36111.
7290.
0365.
114442.
165860.
383339.
84556EqualvariancesassumedEqualvariancesnotassumed硬度FSig.
Levene'sTestforEqualityofVariancestdfSig.
(2-tailed)MeanDifferenceStd.
ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeans申小征,吴仍康333012112:0,:0HH=≠两个独立样本的容量都小于30,两个总体方差未知但相等,根据样本数据计算得:22121219.
925,20.
143,0.
2164,0.
2729xxss====总体方差的合并估计量为:2212211810.
2164710.
27290.
24252872pmsnssmn===++计算的检验的统计量为:()()1219.
92520.
1430.
85511110.
242587pxxtsmn===++*根据自由度()289213,0.
05mnα对应的t分布临界值分别是2.
160,2.
160检验统计量的值没有落入拒绝域.
一次不拒绝原假设.
故在0.
05的显著性水平下,没有理由认为甲,乙两台机床加工的零件直径不一致.
应用SPSS分析,得出图12和图13.
由图13可知t的值是0.
855,sig.
(2-tailed)是双边t检验的显著性概率为0.
408,大于0.
05,故没有理由认为甲,乙两台机床加工的零件直径不一致.
5.
结论及建议文中用t分布分析了单样本区间估计中渔获物的样本、轮胎平均寿命的0.
95置信区间以及某批灯泡Table10.
Samplediameterdataoftwomachinetoolmachiningparts(unit:cm)表10.
两台机床加工零件的样本直径数据(单位:cm)甲机床20.
519.
819.
720.
420.
120.
019.
019.
9乙机床20.
719.
819.
520.
820.
419.
620.
2Figure12.
StatisticresultofA,Btwomachinetoolforthemachiningofpartsdiameter图12.
甲、乙两台机床加工的零件直径的统计量结果Figure13.
ttestresultsofA,Btwomachinetoolforthemachiningofpartsdiameter图13.
甲、乙两台机床加工的零件直径的t检验结果GroupStatistics819.
92500.
465220.
16448720.
14290.
522360.
19743种类1.
002.
00直径NMeanStd.
DeviationStd.
ErrorMeanIndependentSamplesTest0.
6230.
444-0.
855130.
408-0.
217860.
25485-0.
768420.
33271-0.
84812.
1870.
413-0.
217860.
25697-0.
776790.
34108EqualvariancesassumedEqualvariancesnotassumed直径FSig.
Levene'sTestforEqualityofVariancestdfSig.
(2-tailed)MeanDifferenceStd.
ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeans申小征,吴仍康334平均使用寿命95%的置信区间,也详细分析了两种型号步枪子弹的枪口速度均值差的一个置信水平位95%的置信区间,通过t分布进行区间估计在实际中的重要应用,体现了t分布的重要作用.
在假设检验中,通过在单样本t检验,判断了元件的平均寿命时常是否大于某一定值,新旧农药在效果上的差异是否显著以及判断了铝材的长度是否满足设定要求.
也通过两样本t检验在农业、工业和啤酒业中都得到了应用.
在应用分析中,对一些应用借用了SPSS软件进行了分析,得出同样的结论.
t检验的SPSS实现不仅能提高对t检验方法的使用技巧,而且能加深了对统计软件的使用和掌握,从而提高实践技能.
参考文献(References)[1]茆师松,程依明,濮晓龙.
概率论与数理统计教程[M].
北京:高等教育出版社,2011.
[2]袁卫.
统计学[M].
第2版.
北京:高等教育出版社,2005.
[3]盛骤,谢式千,潘承毅.
概率论与数理统计[M].
第4版.
北京:高等教育出版社,2008.
[4]王向飞,王玉柱,沈宇军.
军品质量管理中的统计技术与SPSS软件的应用[J].
火力与指挥控制,2006.
[5]宇传华.
SPSS与统计分析[M].
北京:电子工业出版社,2007.
[6]张红兵,贾来喜,李潞.
SPSS宝典[M].
北京:电子工业出版社,2007.
[7]张文彤,闫洁.
SPSS统计分析基础教程[M].
北京:高等教育出版社,2006.
[8]丁国盛,李涛.
SPSS统计教程——从研究设计到数据分析[M].
北京:机械公业出版社,2007.
[9]罗应婷.
SPSS统计软件分析——从基础到实践[M].
第2版.
北京:电子工业出版社,2010.
[10]程莹,陈希镇.
巧用SPSS进行均值的假设检验[J].
统计与决策,2008.
前天,还有在"Hostodo商家提供两款大流量美国VPS主机 可选拉斯维加斯和迈阿密"文章中提到有提供两款流量较大的套餐,这里今天看到有发布四款庆祝独立日的七月份的活动,最低年付VPS主机13.99美元,如果有需要年付便宜VPS主机的可以选择商家。目前,Hostodo机房可选拉斯维加斯和迈阿密两个数据中心,且都是基于KVM虚拟+NVMe整列,年付送DirectAdmin授权,需要发工单申请。(如何...
Central美国独立日活动正在进行中,旗下美国达拉斯机房VPS 65折优惠,季付赠送双倍内存(需要发工单),Central租用的Hivelocity的机房,只支持信用卡和加密货币付款,不支持paypal,需要美国独服的可以谨慎入手试试。Central怎么样?Central便宜服务器,Central自称成立于2019年,主营美国达拉斯机房Linux vps、Windows vps、专用服务器和托管...
Hostiger商家我们可能以前也是有见过的,以前他们的域名是Hostigger,后来进行微调后包装成现在的。而且推出Columbus Day哥伦布日优惠活动,提供全场的VPS主机首月7折月付2.79美元起的优惠。这里我们普及一下基础知识,Columbus Day ,即为每年10月12日,是一些美洲国家的节日,纪念克里斯托弗·哥伦布在北美登陆,为美国的联邦假日。Hostiger 商家是一个成立于2...
蜘蛛统计为你推荐
newlyrouteincludingandroid支持ipaditunes备份itunes就是备份不了怎么办啊127.0.0.1为什么输入127.0.0.1无法打开页面x-routerX-TRAlL是什么意思iphonewifi苹果手机突然用不了Wi-Fi了360chrome360的chrome浏览器进程有点多哦???谷歌sbgoogle一下"SB",虽然显示的是baidu排第一,链接的不是baidu.googleadsense10分钟申请Google Adsense是一种怎样的体验
域名备案中心 2014年感恩节 wdcp 双12活动 godaddy 免费smtp服务器 panel1 150邮箱 合租空间 七夕快乐英文 河南移动网 100mbps 爱奇艺vip免费领取 Updog 免费外链相册 主机管理系统 lamp什么意思 阿里云手机官网 阵亡将士纪念日 带宽测试 更多