視聴率(閲読率の場合も同じです。以下の文中でも同様)がPである 時点N個によって得られる視聴回数の分布は、 ・各時点の視聴率は全て等しくPである。 ・各時点間に関連性がなく全て独立の事象である。 という二つの仮説があれば、二項分布 で与えられます。 しかし通常この二つの条件は満たされませんので、二項分布により視聴回数分布の推定は精度が悪く、用いることができません。 メソリンガムモデル及び負の二項分布モデルは上の二つの仮説を修正することによって視聴回数分布の適合度を高くするわけですが、その修正に於ける基本的な発想は、 ・視聴率Pを単一の数字と見ず、異なる視聴確率を持った複数のグループが存在し、それらのグループの視聴率から合成されたものと見る。 という点にあります。そして各グループ内での視聴回数の分布は上記の二項分布に従うと考えるわけです。従って、この場合の最終的な視聴回数の分布は、二項分布を複数個合成したものになります。 二項分布を合成するために、視聴確率P(これは0から1まで変わる連続的な変数です)に対応するグループの大きさが必要になりますが、この各グループの大きさを与える方法という点でメソリンガムモデルと負の二項分布モデルの相異が出てきます。 ・<メソリンガムモデルの場合の仮説> 視聴確率Pに対応するグループの大きさw1(P)はβ分布で表される。 β分布の通常の形態は、下図に示されます。 負の二項分布の場合にはグループの大きさをPの関数としてではなく、 N×Pつまり各グループのGRPの関数と考えます。(この場合のGRPは視聴確率の合計という意味です。) ・<負の二項分布の場合の仮説> GRPがgであるグループの大きさw2(g)はГ分布で表される。 Г分布をウエイトとして二項分布を合成する場合には、二項分布の代りにポアッソン分布を用います。 メソリンガムモデル及び負の二項分布モデルが導出される仮説は以上ですから;両分布の公式は次のようになります。 (1)メソリンガムモデル (2)負の二項分布モデル
メソリンガムモデルも負の二項分布モデルも、その式の中に二つのパラメーターを含んでいます。この二つのパラメーターはデータとして与えられなければなりませんし、またもし与えられれば、数式は完全に決定されてしまいます。 パラメーターを決めるための手段として次の式を用いられます。 (1≦k≦N) <注1> ;N時点の中から取った任意のk時点の重複視聴率のあらゆる組合せについての平均 ;視聴回数i回の視聴者の割合 この式の左辺に実測値から算出したを入れ、右辺にパラメーターを含んだの式を入れれば、パラメーターについての方程式が得られますから、これを解いてパラメーターを決定するわけですが、パラメーターの数は二つだけですから実際には及びについての方程式を用いることになります。 メソリンガムモデルの場合のパラメーターを決定する方程式は、右辺 の和を計算すると、 になります。これを解いて、l,mは 負の二項分布モデルの場合のパラメーターを決定する方程式は、 になり、これを解くと、m、Ρは になります。 <注1> の証明 左辺はk時点重複視聴率をあらゆるk時点について合計したもとのと同じです。こういう合計をした場合、i(≧k)回視聴者はi時点の中の任意のk時点の重複視聴者ですからi時点からk時点をとり出す組合せの数だけ、この合計の中に算えこまれています。従って上の式が成立します。
パラメーター決定のためには及びが必要です (1) は平均視聴率に他なりませんから、とり上げているN時点の視聴率Piから作成されます (2) はN時点のうちの任意の2時点の重複視聴率の平均ですから、あらゆる2時点の組合せについて重複視聴率Pijを実測して下図のマトリックスを埋めれば作成できます。 (テレビ、ラジオの時点は膨大になり、その組合せについてPijをデータして用意しておくことは著しく不経済ですから、当社ではPijを実測によらないで、要因分析によって推定する方法をとっています。)
メソリンガムモデル又は負の二項分布モデルによって視聴回数の分布を推定するための作業ステップは、以上の説明を逆にたどってゆけばよいことになります。 (1) 時点の設定 (2) (i) 各時点の視聴率の設定 (ii)二時点間の重複視聴率の設定 (3) (i) 平均視聴率の算出 (ii)二時点間平均重複視聴率の算出 (4) モデルにインプットすべきパラメーターの算出 (5) 視聴回数分布のモデル計算