概率统计随机过程之统计实验设计

概率统计随机过程之统计实验设计

实验是现代科学中不可缺少的一环,随着科学的发展,科学实验的成本也越来越高,例如现在大型强子对撞机的建设成本需要几十亿,甚至上百亿美元。此外,合理的实验也能让我们减少实验误差,提高数据精度。因此每次我们进行实验前都需要合理的设计实验(Design of Experiments)。目前,设计实验是数理统计学的一个分支,科学探究的一部分,涉及“用何方法可更好的设计一个实验”,属于方法论的范畴。由于任何实验都会受到外来环境影响,如何设计实验,使外来环境的变化能够对实验造成最小的影响,就是实验规划的目的。实验设计法广泛用于自然科学、社会科学、医学等各学科的实验设计里。

经常使用的实验设计方法有完全随机设计、随机区组设计、交叉设计、析因设计、拉丁方设计、正交设计、嵌套设计、重复测量设计、裂区设计以及均匀设计等。不同的实验设计方法适用不同的情况。

实验设计总述

实验设计原则:随机、对照、可重复、区域化(即尽量保证其他影响因素一致)。

因素:实验中会影响最终结果的变量。

水平:实验中一个因素所能取的值。不一定是数字,也可包含符号、文本性描述。因为实验中我们不能无限地取值,只能选取有代表性的值,因此水平必须是有限个。

处理组:接受因素不同水平处理的实验组。比如在医学实验中,处理组A使用新的药剂,处理组B接受安慰剂。因素为用药,该因素水平为:用新药和用安慰剂两种。

根据考虑变化因素对实验结果的影响,可以分为单因素实验设计、多因素实验设计。

单因素实验设计

当我们只考虑单个因素的影响时,可采用的设计方式。

完全随机设计

完全随机设计只涉及一个处理因素的两个或多个水平,所以也称单因素设计。它的核心就是将样本中的样品随机地分配到各处理组,分别接受不同的处理,然后得出实验结论。

按照各处理组样本容量是否大体相等(个别处理组多或少一个样品,问题也不大)可分为平衡设计:各组样本含量相等 (样本含量相等时检验效率较高)和非平衡设计:各组样本含量不相等。

由于分的处理组数和因素的水平个数相同,当水平数为2时为二组比较的完全随机设计,当水平数有三个及以上时为多组比较的完全随机设计。通常多组比较的实验比两组比较的实验要复杂一些,数据使用的检验方法也不一样。

完全随时实验是实验设计最基础的方式,也体现了实验设计的几大原则。不过其缺点也不少例如样品个体客观上是存在个体差异的,这会导致组间样品的不平衡,尤其是在小样本场景下;其次,这种完全随机设计效率不算高;并且只能分析单因素。

配对实验设计

配对实验设计的核心思想是控制变量

配对设计是将受试对象按配对条件配成对子,每对中的个体接受不同的处理配对设计的最主要动因是排除非考察因素的干扰,因此我们需要将非常接近的两个样品配成一对,然后每一对的两个个体分别接受不同的处理。比如动物实验中,常将同性别、同窝别、体重相近的两个动物配成一对,然后将每一对的样品分别进行两种因素水平的处理。

配对实验的优点就是组间均衡性好,由于人为的控制了非处理因素的干扰,组间误差小需要的例数少,提高了检验效率。但是欠妥的配对方案会导致实验出现难以察觉的错误。

随机区组设计

随机区组设计是配对实验设计的推广,因为配对实验设计只能处理因素的两个水平,而区组设计是针对因素多个水平而提出的。

其处理手法和配对实验设计是共通的,首先是将样品按照性质分成N组,组内的样品性质要求接近,组件样品是有性质差异的,例如如病人的性别、年龄、体重和病情等非实验因素差异分成N个区组。然后将组内样品随机分配到同一因素不同水平的处理组。

其优点和配对实验一样:每个区组内的受试对象有较好的同质性,排除了非实验因素对分析结果的影响,提高了分析效率。但是,这样也要求每个处理组至少分到一个受试对象,实验结果中若有数据缺失,统计分析较麻烦。

双/多因素实验设计

当我们考虑的因素增多时,不仅要考虑每个因素对实验结果的影响,还要考虑存在因素之间的交互作用。

对于无相互影响的多因素实验,有交叉设计和拉丁方设计;适用于有交互作用的实验设计方法有析因设计、正交设计和均匀设计。

交叉设计

交叉设计是一种特殊的自身对照设计,常用在临床试验中,在同一病人身上观察两种或多种处理水平的效应,消除不同病人之间的差异,减少误差。我们以两个阶段、两种处理水平为例说明操作步骤。首先将条件相近的观察对象进行配对,随机分配到两个实验组中。第一组先用处理方法A处理,然后再用处理方法B处理,处理顺序是AB;另一组则相反,先用处理方法B处理,再用处理方法A处理,处理顺序是BA。两种处理水平在全部实验过程中“交叉”进行。

使用注意:交叉设计的两个实验阶段之间需要留出足够的“衰减时间”。为了减除前一实验阶段对后一实验阶段的影响,需要设置“衰减时间”。如果是新药实验,那么衰减时间可以根据药物半衰期确定。

交叉设计实际上就是自身对照实验设计,通过“交叉”的方式将时间因素的影响分解出来,避免了时间因素对研究结果的干扰。因此该设计的最大优点是可控制时间因素及个体差异对处理方式的影响,故节约样本含量,效率较高。但是交叉设计一般只用于两个因素之间的比较,如果因素多的话,就会因时间太长产生更多不可控的变量。

拉丁方设计

拉丁方设计用于研究三个因素,各因素间无交互作用且每个因素的水平数相同的情况。其中有一个最重要的因素称之为处理因素,另外两个是需要加以控制的因素。此外,拉丁方设计还要求处理具有方差齐性。

因素之间没有交互作用的情况毕竟是少数,更多的情况是存在因素之间的交互作用。下面几种实验设计方法适用于有交互作用的情况。

析因设计

析因设计是单因素完全随机实验在多因素场景下的推广,其需要将两个或两个以上因素及其各种水平进行排列组合、交叉分组的试验设计。它可以研究单个因素多个水平的效应,也可以研究因素之间是否有交互作用,同时找到最佳组合。

例如,现在有两个处理因素,一个因素有2个水平,另一个因素有三个水平,那么就进行\(2\times 3=6\)次实验;如果有三个处理因素,每个因素都有5个处理水平,那么就进行\(5×5×5=125\)次实验。析因分析的原理就是对每个因素的每个水平都进行实验,这样能够照顾到所有的因素和水平。

显然析因设计是非常消耗资源的设计,需要进行大量实验,当因素或水平增加时,实验次数需要几何倍数增长,这在很多实验中是难以实施的。

正交设计

为了降低析因设计的试验次数,后人提出了正交设计。正交设计是析因设计的高效化。当析因设计要求的实验次数太多时,一个非常自然的想法就是从析因设计的水平组合中,选择一部分有代表性水平组合进行试验,而正交设计就能满足这个要求。

正交试验设计一般包括以下几步:

  1. 确定研究因素和指标水平;
  2. 制作成正交试验表格;
  3. 实施试验;
  4. 试验结果分析

其中制作正交试验表格是关键步骤,也是正交设计的核心所在,不过我看网上大多数教程都是用软件或者直接查的正交表。

均匀设计

均匀设计是一种多因素多水平的试验设计,它放弃了正交表的整齐可比性,是在正交设计的基础上进一步发展而成的。均匀设计进一步提高了试验点的“均匀分散性”。均匀设计的最大优点是可以使因素的水平数很大,而试验次数又最节省。与正交设计一样,可以通过均匀设计表设计实验。

正交设计和均匀设计都是设计实验需要系统学习的方法,这里我们不再赘述。

特殊实验设计方法

嵌套设计

如果处理因素之间存在层次性结构,或处理因素之间有主次之分,这时就需要用到嵌套设计。例如,研究催化剂和温度两个处理因素对化学反应速度的影响就是典型的例子。

重复测量设计

重复测量设计广泛应用于各种科学研究中,它的显著特点就是在不同的实验条件下,从同一个受试对象身上采集到多个数据,也就是同一个受试者在不同实验条件下进行数次实验,以获得更多信息。这里的数次实验需要考虑的就是“时间因素”。最常见的重复测量设计是在药物的临床试验中,例如,比较两种不同药物的疗效,将病人随机分成两组,分别给予不同的药物,然后在不同时间作病人的动态观察。

裂区设计

裂区试验设计(split-plot experiment design):又称为分割试验设计,把一个或多个完全随机设计、随机区组设计或拉丁方设计结合起来的试验方法。其原理为先将受试对象作一级实验单位,再分为二级实验单位,分别施以不同的处理。实验单位分级是指当实验单位具有隶属关系时,高级实验单位包含低级实验单位。如小鼠接种不同的瘤株后,观察不同浓度的某注射液的抑瘤效果,这时接种瘤株的小鼠为一级单位,相应因素为一级处理,注射浓度为二级单位,相应因素为二级处理。当试验单位不存在明显的隶属关系时,实验单位分级可按因素的主次确定。在裂区试验中一级处理与一级单位混杂,而二级处理与二级单位不混杂。因此,设计时将最感兴趣或最主要的因素,差异较小、要求精度较高、试验条件较少、工序较易改变的因素作为二级因素。