拉丁超立方抽样

时间:2007-04-29

从蒙特卡罗误差估计中,我们可以看到,大多数统计量的估计值的敛散性都与

有关。特别的,对于均值的估计量,我们发现:


而问题在于

是否能被改善。值得注意的是蒙特卡罗方法的一个主要优点就是他的敛散性依赖于独立的随机参数个数,而接下来我们将要看到的是一种完全不同的抽样方式:拉丁超立方抽样(LHS)。但首先,我们要先了解一下分层抽样的相关内容。
分层抽样
我们考虑一维的单个变量输入问题:y=f(x),x是一个随机变量。分层抽样通过如下的步骤来进行:
1) 定义参与计算机运行的抽样数目N;
2) 将x等概率地分成若干个区域——“bin”,


3) 样本落入哪一个bin中取决于该bin的概率密
度函数,样本


此时,均值的估计量可表示为:

等等
分层抽样的误差估计
我们只考虑均值y的标准误差,有:

这里,iμ等于第i个bin中 y的均值。


等式右边项同蒙特卡罗方法的标准误差一样,第二项为附加项,它使方差变小。所以,较之基于随机抽样的蒙特卡罗方法,分层抽样降低了误差的方差。
多维分层抽样
对于有多个随机变量的输入,分层抽样需要将输入的样本空间等概率地化为N个区域,而这操作起来是很困难的。(注意:仅仅在每一维上等概划分是不行的)考虑一个二维的情形:



假设X1,X2是均匀分布的(即二向同性的),则有:


N=2*2=4bins


对于一般 个bins, 考虑一个d维输入问题,我们发现有: bN



举个例子,对于8维输入且每维上有2个bins,
N=2^8=256bins
或者,每维有3个bins,
N=3^8=6561bins
显然,抽样数目随着每维bins的数目的增加而迅速增加。
拉丁超立方抽样
拉丁超立方抽样是另一种多维分层抽样方法,下面我们介绍它的工作原理:
1) 定义参与计算机运行的抽样数目N;
2) 把每输入等概率地分成N列,


且有



3) 对每一列仅抽取一个样本, 各列中样本bin的位置是随机的。


相对于单纯的分层抽样,拉丁超立方抽样的优势就在于任何大小的抽样数目都能容易地产生。
至于估计均值,通常的做法是:


一般情况下,这种估计的标准误差不能认为是对标准蒙特卡洛抽样方法的改进。但实际上,拉丁超立方抽样对均值和方差的估计和蒙特卡罗方法相比,在效果上至少是一样的,且常常会显著改善。
问题:因为拉丁超立方抽样标准误差的理论估计并不是“贴紧”的,(例如:实际的均值远好于由误差估计得到的值),边界必然是很悲观的。尽管一般来讲误差
估计对于拉丁超立方抽样不是很理想,但有个特别的例子表明拉丁超立方抽样较之蒙特卡罗方法有潜在的改进。
我们来看看这个例子:
假设y是关于输入变量的线性函数


分别利用蒙特卡罗抽样和拉丁超立方抽样方法,再对均值进行估计,结果都是:



而标准误差分别是:


拉丁超立方抽样的标准误差蒙特卡洛抽样的标准误差
我们可以看到,拉丁超立方抽样对样本数量的节省非常显著。
因此,对于输出结果能用一个线性函数很好的逼近的情况下,我们认为拉丁超立方抽样比蒙特卡洛抽样更好。


  
上一篇:什么是DSMC?什么是蒙特卡洛直接模拟方法?
下一篇:常见问题- DOE的一些术语到底是什么意思?

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料