アンケート調査の必要サンプル数計算ツール

統計学的に充分となるアンケート調査人数をブラウザ上で計算できます。「全体数」に全対象者人数を入れ、「計算」ボタンをクリックして下さい。

「許容誤差」「信頼度」「回答比率」について特にこだわりがない or 良く分からなければデフォルトの値を用いて下さい。（詳細は後述します。）

解説

社内アンケート調査などでデータを収集する際に何人からデータを集めれば充分な量になるのでしょう。

例えば10,000人の会社で100人からしか回答を集めなかった（集まらなかった）場合、その集計結果を「全社員の傾向」と見てしまうのは流石にマズそうです。では、何人から回答があったら、「全社員の傾向」と考えても差し支えないのでしょうか。これには「許容誤差」「信頼度」「回答比率」を決めれば、統計学的に計算することができます。

許容誤差

「アンケート回答者のみの結果」を「全社員の回答結果」だと見なす以上、どうしても結果のブレが発生します。例えば「アンケート回答者の中で会社が好きな人の割合は80%」だったとしても、「全社員で会社が好きな人の割合は約80%だろう」と推測する事しか出来ません。この「約」の範囲をどこまで許すのかを「許容誤差」と言います。

つまり、前後5%程度のブレならば問題ないと見なすのか、それとも厳密に前後1%程度しかブレて欲しくないのか。（先の例で言えば、「75%～85%」に入っていれば問題ないと考えるのか、「79%～81%」に入っていなければ困るのか）よって許容誤差が小さければ小さいほど「必要な回答数」は多くなります。（許容誤差を0%にしたいのであれば全社員からアンケートを募るしかありません。）ここはアンケートの内容によって違ってくるでしょうが、慣例的に許容誤差は5%（前後5%のブレは許容する）と設定する事が多いです。

信頼度

「許容誤差」を設定しても、「必ずその指定した範囲内に収まる」という事もありません。つまり、許容誤差5%で「アンケート回答者の会社満足度は80%」という結果が出たからと言って、「必ず全社員の会社満足度は75%～85%に収まる」訳ではないという事です。実際は、「全社員の会社満足度が75%～85%に収まる可能性は○○%」という事になります。そして、この○○%の部分が信頼度と言われるものです。慣例的に信頼度は95%という値が使われることが多いですが、もっと信頼性が欲しければ99%にしますし、ざっとしたアンケートであれば90%で良いと考えることもあります。

回答比率

最後は回答比率です。ここは事前にアンケート結果が「70%程度」など分かっている場合に設定します。事前におおよその傾向が分かっていれば、サンプル数は少なくて済みます。ただし、一般的には結果が分からないからこそアンケートを取るはずですので、基本的には数値が最大になる50%を用いればOKです。

計算方法

以上の情報が決まると、あとは以下の公式を使って簡単に必要サンプル数を求めることができます。

必要サンプル数の計算式

n=\lambda^2\frac{p(1-p)}{d^2}

d は許容誤差、p は回答比率です。\lambda は信頼度ですが、そのままの値ではなくその値に対応するZ値を代入します。

Z値とは、データを「平均が0、標準偏差が1」になるように変換した際の数値の事で、許容誤差=95%なら1.96、許容誤差=99%なら2.58というように、許容誤差が決まれば一意に決まります。

ちなみに、全てデフォルトの値を入れるとnは約384.146となります。つまり、全体の人数が1万人でも1億人でも、385人にアンケートを取れば充分と考えられるのです。なかなか面白い結果では無いでしょうか。（もちろん、データは偏りなく無作為に抽出しているという前提が必要です。）

逆に全体人数が少なかったらどうでしょう。例えば全体人数が300人しかいないのに、対象者数が385人だったらおかしな事になってしまいます。このため、全体人数が少なかった場合を考えて、この式に修正を加える必要があります。

必要サンプル数の計算式の修正式

n'=\frac{nN}{N+n-1}

Nは全体数です。このように全体数の大きさによって結果を修正することを「有限修正」と呼びます。

全体数が多くなれば自動的にn'はnに近づいていきますので、全体数が何人でも一律でこの式を適用して問題ありません。最終的にこのn'が必要なサンプル数となります。

この式を通すと、全体数が100人なら必要サンプル数は80、1000人なら278と計算されます。上部のツールではこの通りに計算を行い、最後に切り上げて整数にしたものを結果として返しています。