いまだに現場で、「たかが600世帯で本当の視聴率なんてわかるわけない」と言っているプロデューサーがいます。そこで、このページでは600世帯でもある程度正確な推測ができる理由を、できるだけわかり易く説明したいと思います。
平成27年1月時点で、関東一都六県の世帯数がおよそ19000000。
実際に測定器を設置しているのがおよそ600世帯なので、その割合は600/19000000。
0.0000315=0.003%、つまり関東圏全世帯の0.003%しか調べていない計算になります。
恐らく、600世帯で視聴率を出すのは信憑性が低いと皆さんが思うのは、0.003%にその番組を見ている人、見ていない人が「たまたま偏ること」が十分に起こりえる、と思えてしまうからではないでしょうか。
例えば、関東圏で30%の世帯が見ている番組があったとします。
(この30%はビデオリサーチの出す30%ではなく、本当に30%の世帯が見ている、という数字)
そして、関東圏から10世帯だけを無作為に抽出したとします。(完全な規則性の無い抽出)本来であれば、30%つまり10世帯あれば3世帯みている可能性が高い、ということは簡単に理解できると思いますが、そんな状況で関東圏全世帯から、その番組をまったく見ていない10世帯を選んでしまう確率はどのくらいあるでしょうか。
計算式はは1×0.7^10=0.028247525になります。
本来30%の世帯が見ているはずですが、10世帯を選び、その10世帯のうち1世帯も見ていない
(つまり視聴率が0%と出てしまう)確率は2.8%になります。
また、同じ状態で無作為に10世帯を選び、その10世帯のうち3世帯が見ている確率120×0.3^3×0.7^7=0.266827932になります。(頭の120は10世帯のうち3世帯を選んだときの組合せのパターン数です)およそ27%の確率で、10世帯だけの調査でも本来の視聴率30%を的中できることになるのです。
10世帯のうち、見ている世帯と見ていない世帯の組み合わせは、以下の11パターンになります。また、括弧の中はそのパターンの発生する確立です。
左の状況が発生する確率 | ||
見ていない10世帯 | 見ていない0世帯 | (0.028) |
見ていない9世帯 | 見ていない1世帯 | (0.121) |
見ていない8世帯 | 見ていない2世帯 | (0.233) |
見ていない7世帯 | 見ていない3世帯 | (0.267) |
見ていない6世帯 | 見ていない4世帯 | (0.200) |
見ていない5世帯 | 見ていない5世帯 | (0.103) |
見ていない4世帯 | 見ていない6世帯 | (0.036) |
見ていない3世帯 | 見ていない7世帯 | (0.009) |
見ていない2世帯 | 見ていない8世帯 | (ほぼ0) |
見ていない1世帯 | 見ていない9世帯 | (ほぼ0) |
見ていない0世帯 | 見ていない10世帯 | (ほぼ0) |
上記合計=1 |
たった10世帯を調べただけでも、
・10%〜50%の確率を足すとおよそ92.4%なので、本来の世帯視聴率は92.4%の確率で30%±20%に入る。(=10%から50%の間に、92.4%の確率で入る、尚、一番確率が高いのは30%である)と表現することができます。
それでは、次に同じ状況で100世帯を無作為抽出した場合です。
見ていない80世帯 | 見ていない20世帯 | (ほぼ0) |
見ていない79世帯 | 見ていない21世帯 | (0.012) |
見ていない78世帯 | 見ていない22世帯 | (0.019) |
見ていない77世帯 | 見ていない23世帯 | (0.028) |
見ていない76世帯 | 見ていない24世帯 | (0.038) |
見ていない75世帯 | 見ていない25世帯 | (0.050) |
見ていない74世帯 | 見ていない26世帯 | (0.061) |
見ていない73世帯 | 見ていない27世帯 | (0.072) |
見ていない72世帯 | 見ていない28世帯 | (0.080) |
見ていない71世帯 | 見ていない29世帯 | (0.086) |
見ていない70世帯 | 見ていない30世帯 | (0.087) |
見ていない69世帯 | 見ていない31世帯 | (0.084) |
見ていない68世帯 | 見ていない32世帯 | (0.078) |
見ていない67世帯 | 見ていない33世帯 | (0.069) |
見ていない66世帯 | 見ていない34世帯 | (0.058) |
見ていない65世帯 | 見ていない35世帯 | (0.047) |
見ていない64世帯 | 見ていない36世帯 | (0.036) |
見ていない63世帯 | 見ていない37世帯 | (0.026) |
見ていない62世帯 | 見ていない38世帯 | (0.019) |
見ていない61世帯 | 見ていない39世帯 | (0.013) |
見ていない60世帯 | 見ていない40世帯 | (ほぼ0) |
・視聴率30%の番組を100世帯で調査した場合、100世帯のうち見ている世帯が20世帯、また見ている確率が40世帯含まれる確率は、ほぼゼロになります。つまり、30%の世帯が見ている番組の視聴率が20%や40%と出ることは、100世帯調査しただけでも、理論上まず無いことになります。
また、上記結果は
・21世帯〜39世帯の確率を足すとおよそ96.3%なので、本来の世帯視聴率は96.3%の確率で30%±9%に入る。(=21%から39%の間に、96.3%の確率で入る、尚、一番確率が高いのは30%である)と表現することができます。
とてもざっくり説明すると、100世帯の調査結果としては30%らへんに本当の視聴率はあるんじゃないか?となります。
現在ビデオリサーチから発表される視聴率は、(視聴率10%の番組の場合)95%の確率で10%を中心にして±2.4%(7.6%〜12.4%)に入ります。という数値です。また、当たり前ですが本当の視聴率が10%またはその近辺である確率が最も高いです。
ちなみに、誤差を今の半分、±1.2まで引上げるとすると、サンプル世帯は4倍の2400世帯が必要になります。この、2.4と1.2の誤差の違いに、4倍のコストが見合うかどうかという所がポイントで、今の視聴率調査の精度をどうしても高めて欲しいので誤差を半分に引上げてください、と民放各局がお願いした場合、当然ながらビデオリサーチ社に支払うコストは4倍になります。そういった意味でも、現在の600世帯という数字は妥当な線だと思います。
選挙速報も同じ理論で作られていますので興味のある方は是非ご覧下さい。
ITメディアビジネスオンライン
「なぜ開票1%で当確がでるのか?」
https://bizmakoto.jp/makoto/articles/1212/18/news010.html