奚潭(南京财经大学统计系2006级)主要内容1.
统计模拟的基本概念2.
赶火车问题3.
R软件的统计模拟功能4.
应用R软件模拟验证大数定律5.
应用R软件模拟验证中心极限定理一、统计模拟的基本概念(一)统计模拟的定义统计模拟即是计算机统计模拟,它实质上是计算机建模,而这里的计算机模型就是计算机方法、统计模型(如程序、流程图、算法等),它是架于计算机理论和实际问题之间的桥梁.
它与统计建模的关系如下图.
实际问题统计、逻辑模型计算机模拟(程序、算法)统计、计算机解实际解一、统计模拟的基本概念(二)统计模拟方法一般地,统计模拟分类如下:若按状态变量的变化性质分为连续随机模拟和离散随机模拟.
而按变量是否随时间变化又可分为动态随机模拟和静态随机模拟.
常用的统计模拟方法主要有以下几种:1.
蒙特卡罗法2.
系统模拟方法3.
其它方法:包括Bootstrap(自助法)、MCMC(马氏链蒙特卡罗法)等.
一、统计模拟的基本概念(三)统计模拟的一般步骤二、赶火车问题0.
10.
20.
7概率13:1013:0513:00火车离站时刻一列列车从A站开往B站,某人每天赶往B站上车.
他已经了解到火车从A站到B站的运行时间是服从均值为30min,标准差为2min的正态随机变量.
火车大约下午13:00离开A站,此人大约13:30到达B站.
火车离开A站的时刻及概率如表1所示,此人到达B站的时刻及概率如表2所示.
问此人能赶上火车的概率有多大表1:火车离开A站的时刻及概率表2:某人到达B站的时刻及概率0.
10.
20.
40.
3概率13:3413:3213:3013:28人到站时刻二、赶火车问题——问题的分析——这个问题用概率论的方法求解十分困难,它涉及此人到达时刻、火车离开站的时刻、火车运行时间几个随机变量,而且火车运行时间是服从正态分布的随机变量,没有有效的解析方法来进行概率计算.
在这种情况下可以用计算机模拟的方法来解决.
:火车从A站出发的时刻;:火车从A站到B站的运行时间;:某人到达B站的时刻;:随机变量服从正态分布的均值;:随机变量服从正态分布的标准差;二、赶火车问题进行计算机统计模拟的基础是抽象现实系统的数学模型为了便于建模,对模型中使用的变量作出如下假定:此人能及时赶上火车的充分必要条件为:所以此人能赶上火车的概率模型为:二、赶火车问题为了分析简化,假定13时为时刻t=0,则变量、的分布律为:0.
10.
20.
710500.
10.
20.
40.
334323028二、赶火车问题R软件求解的总算法:关系式成立产生随机数验证模型成立次数k=k+1否是计算估计结果k/n成立次数不变试验次数是否达到n次是否编写R程序①借助区间(0,1)分布产生的随机数,对变量、概率分布进行统计模拟;②根据变量、、概率分布及模拟程序、命令产生n个随机分布数;③使用随机产生的n组随机数验证模型中的关系表达式是否成立;④计算n次模拟实验中,使得关系表达式成立的次数k;⑤当时,以作为此人能赶上火车的概率p的近似估计;进入演示windows(7,3)prb=replicate(100,括号内程序重复100次x=sample(c(0,5,10),1,prob=c(0.
7,0.
2,0.
1))y=sample(c(28,30,32,34),1,prob=c(0.
3,0.
4,0.
2,0.
1))plot(0:40,rep(1,41),type="n",xlab="time",ylabaxes=FALSE)axis(1,0:40)r=rnorm(1,30,2)points(x,1,pch=15)i=0while(i=y)points(y,1,pch=19)Sys.
sleep(0.
1)points(y,1,pch=19)title(ifelse(x+ry})mean(prb)进入模拟三、R软件的统计模拟功能1、R软件优秀的随机数模拟功能n,min,maxunif()unifomn,df,ncpt()Student'stn,lambdapois()Poissonn,mean,sdnorm()normaln,df1,df2,ncpF()Fn,rateexp()exponentialn,df,ncprchisq()chi-squaredn,size,probrbinom()binomial参数设置产生随机数序列命令分布生产某概率分布的随机数是实现统计模拟的前提条件,而使用R命令可以生成以下常用分布的随机数:三、R软件的统计模拟功能2、优良的编程环境和编程语言R所拥有的好的兼容性、拓展性和强大的内置函数有利于统计模拟的实现.
3、高效率的向量运算功能使用R拥有的向量运算功能可以大大减少程序运行的时间,提高程序运行的效率.
下面以求解Pi的程序为例加以说明未采用R向量运算功能的程序为:mc1下面用R软件分别执行两个程序,看看有什么差异程序1.
.
.
.
.
.
程序2三、R软件的统计模拟功能四、应用R软件模拟验证大数定律1、验证的大数定律有:(1)伯努利大数定理——设是次独立重复试验中事件发生的次数.
是事件在每次试验中发生的概率,则对于任意正数>0,有(2)辛钦定理:设随机变量相互独立,服从同一分布,且具有数学期望则对于任意正数,有四、应用R软件模拟验证大数定律2、在R软件实现的算法思想:由大数定律可知,当,样本的均值趋向与理论分布的期望,因此利用样本容量逐渐增大这一趋势来模拟这一趋势,在这种趋势下,样本的均值与理论分布期望的误差应该呈现出越来越小的趋势,同时,根据上述思想,分别对五种常用分布下的大数定律进行验证.
商家介绍:星梦云怎么样,星梦云好不好,资质齐全,IDC/ISP均有,从星梦云这边租的服务器均可以备案,属于一手资源,高防机柜、大带宽、高防IP业务,一手整C IP段,四川电信,星梦云专注四川高防服务器,成都服务器,雅安服务器,。活动优惠促销:1、成都电信夏日激情大宽带活动机(封锁UDP,不可解封):机房CPU内存硬盘带宽IP防护流量原价活动价开通方式成都电信优化线路2vCPU2G40G+60G21...
LOCVPS发来了新的洛杉矶CN2线路主机上线通知,基于KVM架构,目前可与香港云地、香港邦联机房XEN架构主机一起适用7折优惠码,优惠后最低美国洛杉矶CN2线路KVM架构2GB内存套餐月付38.5元起。LOCPVS是一家成立较早的国人VPS服务商,目前提供洛杉矶MC、洛杉矶C3、和香港邦联、香港沙田电信、香港大埔、日本东京、日本大阪、新加坡、德国和荷兰等机房VPS主机,基于KVM或者XEN架构。...
RepriseHosting是成立于2012年的国外主机商,提供独立服务器租用和VPS主机等产品,数据中心在美国西雅图和拉斯维加斯机房。商家提供的独立服务器以较低的价格为主,目前针对西雅图机房部分独立服务器提供的优惠仍然有效,除了价格折扣外,还免费升级内存和带宽,商家支持使用支付宝或者PayPal、信用卡等付款方式。配置一 $27.97/月CPU:Intel Xeon L5640内存:16GB(原...