【原创】浅谈正交试验设计
今天没有开场白,直奔主题,谈谈正交试验设计。在解释正交试验设计之前,你要先理解试验设计的概念。
按照因循守旧、行之有效的惯例,先说定义:
试验设计(Design Of Experiment) :主动控制因变量的变化,评估自变量对因变量的影响程度。
因变量(Response):试验输出的结果。
因素(Factor): 试验过程中的不同输入变量如压力、转速等。
水平(Level): 试验中对因子的不同设定值如压力:10Pa、20Pa、30Pa等。
在进行制药工艺设计时,试验设计的作用:
1.找出关键工艺参数。
2.确定关键工艺参数设定值和取值范围。
3.找出非关键工艺参数。
4.发现低成本的解决方案。
试验设计纷繁复杂,哥这里是介绍典型的三个试验方法,分别是一次一因素试验、全阶乘因素试验、正交试验设计。花开三朵,一个一个摧残。
第一朵
一次一因素试验:指其它因子保持固定,然后每次改变一个条件,将相邻的两次实验结果进行比较,以估计两个条件的效果差异。
特点:该方法效率低,且不能发现各因素之间的组合效果。
第二朵
全阶乘因素试验:指所有因子所有水平的所有组合都至少进行一次试验。
特点:包含所有交互作用的信息。一般因素数≤4时才用全阶乘实验设计。增加一个水平要大幅度增加实验次数,效率低。
第三朵
注意,睡觉的醒醒,擦亮眼睛,主角登场了。
正交试验设计(Orthogonal experimental design):是研究多因素多水平的又一种设计方法,它是从全面试验中挑选出部分有代表性的点进行试验。
特点:代表性的点具备“均匀分散,齐整可比”的特点,是一种高效率、快速、经济的实验设计方法。总之,就是高富帅、纯男神、屌爆了的节奏,绞尽脑汁、硬着头皮也要用这个提高逼格,用了就开启360度装逼无死角光环,可以与老师正面硬刚一波。
正交试验选择的水平组合列成表格,称为正交试验表。
正交试验表有专门的算法,对各位童鞋来说,不必深究,拿来主义,直接用。至于表格来源那是统计学家的事情,你不用管。
正交试验表的符号表示如下图,没啥可说的,记住就行了。
举例正交试验表如下,先混个脸熟
3列表示3个因素,A、B、C。
4行表示不同因素水平的组合。
1和2表示各因子的两种水平。
L4(23)按照全阶乘因素试验需要做2*2*2=8次,而用正交试验只需要做4次。效率提高了,试验效果会不会变差?不用担心,统计专家做了大量分析和试验,事实证明,效果不会有显著性差异。
下面我们说说正交试验设计怎么用?库里哥不举工艺设计的例子,举一个简单易懂,又是库里哥擅长领域的例子。
通过正交试验设计并试验,根据数据评估谁是勇士队取胜最重要的球员,用试验数据说话,证明库里哥不是靠脸吸女粉的,而是靠实力成为巨星的。
试验设计思路如下:
勇士队比较重要的基石球员,球迷公认的球星库里(萌神)、汤姆森(汤神)、格林是球队取胜的三个因素,定为试验的三个因素。
受心理、体能等因素的影响,球员在主客场比赛的表现差异很大,将主场、客场定为试验的两个水平。
设计正交试验表格如下:
统计并记录三个球员同时在场上时球队的净胜分,每次试验统计三个时间段的数据。
收集到足够的数据后就可以拿来说明问题了,库里哥认为通过数据分析计算可以回答以下三个问题:
1.推断以上三名球员中,哪一个球员对球队比赛获胜的贡献最大。
2.评估三名球员在主场和客场比赛的竞技水平是否有显著性差异。
3.评估三名球员之间的交互作用,篮球术语叫“化学反应”。
得出结论后,勇士队教练就可以运筹帷幄,决胜于千里之外了。