Pottaの錬金術バンザイ

実験計画法

最終更新:

chem-ota

- view
管理者のみ編集可
1925年頃、イギリスのR.A.Fisherがやりだした手法。
統計データ解析に基づいた多くの情報を効率よく知るための統計手法。
通常、下記の3段階の手順を踏んで実施される。

①効率的に要因効果を把握するための実験方法を計画する。(実験の計画)
②本当に効果があるのかを調べる。(分散分析による検定)
③特定の水準の組み合わせにおける母平均の大きさを見積もる。(推定)

ここで、全体の流れをまとめてみた。

フィッシャーの3原則
①ランダム化
 実験順序によって生じる、慣れなどの系統誤差を偶然誤差に転化させる。
 データ収集時の順番をバラバラにして実験結果をかたよらせない。

②局所管理
 実験誤差が大きくなるような場合、実験の場を小分けにして水準間を精度よく比較できる様にすること。小分けの原則とも言う。

③反復
 実験の誤差の大きさを評価するために行う。同一条件で2回以上実験を行うこと。(「繰り返し」は同一条件で複数回「測定」を行うことであり、反復と意味がことなる。)

用いられる単語
「偶然誤差と系統誤差」

 偶然誤差
  目盛りの読み取りミスなど「誤差の大きさが偶然によって決まる誤差」

 系統誤差
  暑さによってものさしが伸びてでる誤差など、「偶然によらず一定の傾向を持つ誤差」

「因子の種類」
 大きく2つに分けられる

 1、母数因子
   水準(規格)を技術的に指定でき、その水準効果が再現可能な因子
   ほとんどがこれ。

   例)加熱温度、保持時間

 2、変量因子
   水準を指定できず、次回の実験では同じ水準を再現できない因子

   例)原料鉱石のロット番号、農場の土壌条件など


「使用例」
  (ブロック因子)
   変量因子のような水準を指定できない条件の場合、
   適当な「ブロック」に区分けして、
   できるだけ均一な実験条件の場を作る。

   例)日間の違いの比較、土壌条件を均質化した農場の区画など
    →【乱塊法】ともいう

  (制御因子)
    生産の場において、水準の指定も選択も可能なもの。
    実験のほとんどはこの因子。

    例)反応温度、処理時間、材料の種類、仕上げ方法など

  (標示因子)
    生産の場において、水準の指定はできるが選択はできないもの
    水準の違いを知りたいときに取り上げる因子

  (誤差因子)
    生産の場において、水準の選択も指定も不可能なもので
    生産側でコントロールできない因子

「一元配置実験と二元配置実験」
  取り上げた因子の数が1つの実験:一元配置実験
           2つの実験:二元配置実験 → 分散分析表の作成


「交絡」→分離できない状態のこと。

 実験計画法の準備
①データを取得し、下記内容をチェックする。

「外れ値の有無」
「等分散性の検討」
  →R管理図で範囲を比較してチェック
「要因効果の有無」
「最適水準の推定」

 *分散分析の結果、交互作用がない場合は、その平方和を誤差の平方和に加えて新たな誤差分散の推定値をつくる。
 →「プーリング」という。

分散分析表の解析(F検定)
(手順:要因A-B間に交互作用がある場合)
①n個の繰り返しデータを合計して、補助表を作成する。

②データの総計から修正項CTを求める。

   CT=(総計の二乗)/総データ数

  *要は平方和Sxx=Σ X^2 - (Σ X)^2/n の (Σ X)^2/n 項を計算しているだけ。

③各平方和Sを求める

 総平方和:St = Σ(個々のデータの二乗)-  CT
 Aの水準間平方和:Sa = Σ {(Aiのデータの合計の二乗)/Aiのデータ数} -  CT
 Bの水準間平方和:Sb = Σ {(Biのデータの合計の二乗)/Biのデータ数} -  CT
 ABの水準間平方和:
  Sab = Σ {(Ai*Biのデータの合計の二乗)/Ai*Biのデータ数} -  CT

 交互作用平方和: Sa×b = Sab -  Sa -  Sb
 誤差平方和:     Se = St -  Sa -  Sb -  Sa×b
           =St -  Sab

④各平方和の自由度を求める。

 総平方和の自由度: 総データ数 -  1
 Aの水準間の自由度: Aの水準数 -  1
 Bの水準間の自由度: Bの水準数 -  1
 AB間平方和の自由度: Aの水準数×Bの水準数 -  1
 交互作用平方和の自由度: AB間平方和の自由度 -  Aの水準間の自由度 -  Bの水準間の自由度
 誤差平方和の自由度: 総平方和の自由度 -  AB間平方和の自由度

⑤各分散V(平方和/自由度:平均平方)と分散比F0(各々の分散/誤差平方和の分散)を求める。

⑥分散分析表を作成する。
 F表による検定
  →数値が高ければ有意であるとする。
   1%(信頼区間99%)の場合、「高度に有意である」と表現。

⑦最適な組み合わせ条件を選定する。

⑧最適条件での母平均μを推定する。
 A、Bの最適な水準を決め、その水準の和、データの総和を算出し点推定する。

 (点推定)
   μ(AB)=A水準の平均値+B水準の平均値 - データの平均値

 (有効繰り返し数)
   点推定に用いられる係数の和(伊奈の式)から求める。
   A、Bのサンプル数が6、8 総サンプル数が24個の場合、

   1/Ne=1/6+1/8- 1/24=1/4


⑨有意な要因について各水準の母平均μを推定する(t 検定)。

μ(AB)±t(Φe、α)√(Ve/n)


  Φe:誤差eの自由度
  α:棄却率(5% or 1%)
  Ve:誤差の分散(=Se/Φe)
  n:有効繰り返し数(一元配置実験ではデータ数)


 例)
  Aの水準(3種×繰り返し2回):和197
  Bの水準(4種×繰り返し2回):和270
  データの総和(A-3種とB-4種の組み合わせ×繰り返し2回):686

 最適条件での点推定値
  μ(AB)=A水準の平均値+B水準の平均値 - データの平均値
      =(197/6)+(270/8)- (686/24)
      =38.0

 区間推定(信頼率95%)
  有効繰り返し数を点推定に用いられる係数の和(伊奈の式)から求めると
   1/Ne=1/6+1/8- 1/24=1/4

   μ(AB)±t(Φe、α)√(Ve/n)
    =38.0±t(18, 0.05)√(13.2/4)
    =38.0±2.101×√(13.2/4)
    =34.2, 41.8

となる。


めっちゃ適当なメモなので気が向いたらまた書き足します。。。

記事メニュー
目安箱バナー