上記の「推定」の項で述べたように、統計的推論とは、標本のデータを用いて母集団の推定や仮説の検証を行うことである。 標本調査法の分野は、標本データを得るための効果的な方法に関するものである。 最も一般的な標本調査の種類は、郵便調査、電話調査、個人面接調査の3つである。 これらはすべて質問票を使用するもので、質問の言い回し、順序、グループ分けについては多くの知識が存在する。 サンプル調査には、質問票を用いないものもある。 例えば、監査のための会計記録のサンプリングや、大規模なデータベースをサンプリングするためのコンピュータの使用は、データを収集するためにサンプリングされたユニットの直接観察を使用するサンプル調査です

サンプル調査の設計における目標は、正確な推論ができるように、人口を代表しているサンプルを得ることである。 標本誤差とは、母集団のパラメータとそれを推定するために使用する標本統計量との差のことである。 例えば、母集団の平均と標本の平均の差がサンプリングエラーです。 標本誤差は、母集団全体ではなく、一部を調査したために発生します。 確率的サンプリング法では、各単位が標本に含まれる確率が分かっているので、統計学者はサンプリング誤差の大きさについて確率的な記述を行うことができます。 非確率サンプリング法は、確率よりも利便性や判断に基づくもので、コストや時間の点から頻繁に利用されています。 しかし、非確率標本からの推論には細心の注意が必要です。標本が代表的かどうかは、健全な統計的原理ではなく、調査を設計し実施する個人の判断に依存します。 さらに、非確率サンプルを使用した場合のサンプリング誤差の境界線を確立するための客観的な根拠は存在しません。 一般に、プラスかマイナスの誤差を報告している調査は、確率的サンプリングを用いて実施されたと考えることができる。 統計学者は確率的サンプリングの方法を好み、可能な限り使用することを推奨しています。 様々な確率的サンプリング方法があります。 ここでは、より一般的なものをいくつか紹介します。 単純無作為抽出では、サイズnのすべての可能なサンプルが同じ確率で選択されます。 この方法は推定の項で述べた。

層化単純無作為抽出は単純無作為抽出の変形で、母集団を層という比較的均質なグループに分け、各層から単純無作為標本を選択する方法である。 層からの結果は、母集団についての推論を行うために集計される。 この方法の副次的な利点は、各層で表される部分集団についての推論も行うことができることです。

クラスターサンプリングは、クラスターという別々のグループに集団を分割することを含んでいます。 層別単純無作為抽出の場合とは異なり、クラスターは異質な単位で構成されていることが望ましい。 単段階クラスター標本では、クラスターから単純無作為標本を選択し、標本化されたクラスター内のすべてのユニットからデータを収集する。 二段階クラスターサンプリングでは、クラスターの単純無作為標本を選択し、次に各標本化されたクラスター内のユニットから単純無作為標本を選択する。 クラスター・サンプリングの主な用途の1つはエリア・サンプリングと呼ばれ、クラスターは郡、町、市街地、または人口の他の明確に定義された地理的セクションである

コメントを残す

メールアドレスが公開されることはありません。