[確率・統計]標本サイズの決定(想定した比率の結果を得るのに必要なサンプル数の計算方法)

 想定した比率の結果を得るのに必要なサンプル数の計算は母比率の信頼区間の不等式から得られます。

各文字を以下のように定義します。

:標本の比率
p:母平均の比率
ζ:期待する標本比率を母平均の誤差

このときζは以下にように表せます。

母比率の信頼区間は以下のように表せる。
(Nは、信頼度xのときの標準正規分布の値)

この式を、標本比率を母平均の誤差を想定値以下にしたいことから、以下の変形を行い必要なサンプル数nを求める。

MathNet.Numericsを使いC#でこの式を解くと以下のようになる。

//指定した信頼区間に必要なサンプル数を得る
//@param in confidenceInterval 信頼係数 0~1.0
//@oaram in sampleRate 標本比率 0.0~1.0
//@param in confidenceIntervalWidth 信頼区間の幅 0.0~1.0
public static double calculateSampleCount(double confidenceCoefficient, double sampleRatio, double confidenceIntervalWidth) {
    
    //指定した確率の正規分布の位置を得る
    double normX = MathNet.Numerics.Distributions.Normal.InvCDF(0, 1.0, 0.5 + (confidenceCoefficient / 2.0));

    //必要サンプル数の二乗を計算する
    double tmp =  2.0 * normX * Math.Sqrt(sampleRatio * (1.0 - sampleRatio)) / confidenceIntervalWidth;

    //サンプル数を得る
    return Math.Pow(tmp, 2.0);
}

0 件のコメント :

コメントを投稿