全数データとパネルデータはこう使い分ける! ~それぞれの特徴と活用方法~

  • 公開日:
生活者データ
#VR LINC #デジタル #効果検証 #用語解説
全数データとパネルデータはこう使い分ける! ~それぞれの特徴と活用方法~

皆さんも日頃の業務で様々なデータを扱っていると思いますが、データの特徴を把握した上で、目的に合ったデータを活用できているでしょうか。「ビッグデータ」などの言葉がテレビでよく聞かれるようになったことからわかるように、近年では生活のあらゆる事象がデータ化され、企業はその「ビッグデータ」と呼ばれるデータを効果的に活用することが求められています。一方で古くからビジネス上で用いられているデータと言えば、対象者から直接回答を得るアンケートデータというものもあります。活用できるデータの種類が増え、データから明らかにできることも増えていく一方、自分が知りたい情報を得るためにはどのデータを使うのが最適なのか、迷ってしまうという場面も多くなっています。今回は「全数データとパネルデータ」をテーマに、各データの特徴を明らかにしながら、それぞれのデータの活用シーンを紹介していきます。

記事の中でご紹介しているサービスはこちら 
【VR LINC】   

データには2種類ある!

ビジネス上よく耳にする「データ」ですが、みなさんは「データ」というものを正しく把握されているでしょうか。一言で「データ」といっても、その取得方法によって「全数データ」と「パネルデータ」の大きく2種類に分類することができます。はじめに、意外と認識されていない2つのデータの概要について説明します。

全数データ・・・ "集まるデータ"

社会のデジタル化が進み、近年ではあらゆる行動について、ログとしてデータが取得できる時代となっています。皆さんの会社でも、自社サイトへのアクセスログや自社商品の購買データなど、顧客の行動に関する様ざまなデータを取得・分析しているのではないでしょうか。このようにある行動をとった(上記の場合は「サイトにアクセスした」「商品を購入した」)人の情報をシステム的に取得できる場合に、そのようなデータを「全数データ」と呼ぶことがあります。デジタル化した現在の社会では生活の中の多くの行動がデジタルを介して行われているため、いわゆる計測タグの設置などを行うことで勝手にデータが集まってくる状況を作り出すことができ、誰でも簡単に「全数ログ=全数データ」を取得することが可能になっています。全数データは簡単な準備を行えば誰でも手軽にデータを手に入れることができるため、今では多くの企業で取得が進み、そのデータを活用してビジネスが行われるようになっています。

パネルデータ・・・ "集めるデータ"

ネットで「アンケートモニター」と調べると、数多くのアンケートサイトやアプリが紹介されています。このようなサイトに登録しアンケートに回答した経験がある方もいるかと思いますが、こうしたアンケートサイトなどで集めたデータのことを「パネルデータ」と言います。アンケートサイトでは、多くの場合ネットなどを通してモニターを募集しており、登録を希望したモニターをパネルとして囲い、彼らを対象に様々なアンケート調査を配信、モニターからの回答を収集することでデータを蓄積していきます。このように欲しい情報を意図的に集めるのが「パネルデータ」であり、調査会社にアンケート調査を依頼する形で、昔から多くの企業でこの「パネルデータ」が取り入れられています。



ここまで2つのデータの概要について説明しましたが、ごくシンプルに言うと全数データは"集まる"データパネルデータは"集める"データであり、データはその収集方法によって2種類に分けられるのです。

続いて、それぞれのデータの活用面での特徴を見ていきます。

全数データの特徴

◎大規模データを収集できる
パネル化したモニターからデータを取得するパネルデータとは異なり、全数データでは特定のアクション(サイトアクセスやアプリダウンロードなど)を行ったユーザーのデータを収集できるため、集まるデータ規模は大きなものとなります。10年ほど前から様ざまなところで言われるようになった、いわゆる「ビッグデータ」は全数データのひとつです。多くのデータを収集できるということは、分析時に複雑な統計解析が実施しやすい、出現率の低い詳細な条件がある場合や特殊なターゲットについて分析したい時にもターゲットごとに十分なユーザー数を確保することができる、などのメリットにつながっており、全数データがビジネスに活用されやすい要因のひとつとなっています。

○無意識行動についても可視化
一部の例外(※注)はあるものの、全数データではデジタルを介したほぼすべての行動をログとして取得するため、無意識の行動や本人の記憶にないような行動についても、その場でデータとして可視化することができます。例えば、デジタル広告の効果を分析したいという場合、アンケート調査を実施し「広告を見たか」「何のサイトで見たか」「実際に広告をクリックしたか」などを聴取することも可能ですが、この場合には回答者本人の記憶に残っている経験しかデータ化することができず、「見たことあるような気がするけどどこのサイトだったっけ?」「広告は見たことあるけどクリックしたかは覚えてない...」というようなケースでは正しいデータを取得することができません。それに比べてログとして全数データを収集しておけば、「誰が」・「いつ」・「どのサイトで」、「広告に接触した」のか「広告をクリックした」のかを確認することができます。しかしながら、ログデータからはその行動についての感情を読み取ることができないため、例えば「バナー広告のクリック」というログが発生している場合、本当にその広告に興味を持ってクリックしたのか、それともたまたま指が当たってクリックしたことになってしまったのかは判別することができない点には注意が必要です。

※注:ログデータは、例えば以下のような場合には取得ができません。

■インターネットにつながっていない
■インターネットにつながっていても、電波が悪くデータの送受信ができない
■計測の開始前に、本人の行動が終わってしまった(ウェブページのタグ発火前にブラウザを閉じた場合など)

△行動を起こした人のデータしか集まらない
メリットばかりのように思える全数データですが、もちろん全数データにも限界があります。先ほど述べた通り、全数データは"ある行動をとった人"の情報を収集します。言い換えると、"ある行動をとらなかった人"のデータについてはまったく取得できないということです。例えば、テレビメーカーや放送局が収集しているテレビ視聴ログについて考えてみると、前提としてデータを集められるのはネット結線しているテレビに限られます。つまり、ログとして測定できているのは「ネットに結線している」かつ「テレビを見ている」場合のみであり、ログが取得できていないテレビについては「テレビを見ていない」のか「そもそもテレビをネットにつないでいない」のかも判別することができません。そのため、「○○」というドラマを見ている人がその他にはどんな番組を見ているのか、という取得できたデータの中での分析は可能ですが、そのドラマを見ていた人が日本全国で何パーセントくらいいたのかという問いに対しては、全数データでは回答することができません。なぜなら、ログが取得できていないテレビも含めて状況を把握できなければ、視聴の割合を算出するための母数となる日本全国のテレビの台数がわかりませんし、視聴したテレビの台数についてもログの情報だけでは正しく把握することができないからです。このように、全数データは「全数」と言いつつも、「収集できる条件が限られている中での全数」のデータであり、かつ"ある行動をとった人"に関する分析はできるものの、それ以外の"ある行動をとらなかった人"を含めた全体的な事象について明らかにするには不足のあるデータとなります。

全数データの特徴
daikibo.png

パネルデータの特徴

◎行動の有無を判別できる
前述の通り、パネルデータはあらかじめパネル化しているサンプルに対して調査をかけることでデータを取得するので、あるアクションを起こした人のデータが集まるのはもちろん、アクションを起こさなかったという事実を確認することもできます。例えば、とある商品の「購買」についてのデータを分析する時、全数データでは「その商品を購入した人」のデータのみが集まっている状態なので、その商品がいつ・どこで買われたのか、どんな人が買っているのか、その商品と一緒に買われることの多い商品は何なのかといった、「その商品を購入した人」に関する分析しか行うことができません。一方で、同じくとある商品の「購買」についてパネルデータを用いて分析する場合には、商品を購入した人のデータと購入していない人のデータがどちらも揃っているので、全数データと同様に「その商品を購入した人」に関する分析ができるのはもちろん、逆にその商品を購入していない人にはどんな特徴があるのか、どうして購入しなかったのか、という「その商品を購入しなかった人」についても明らかにすることができます。また、その商品の購入者がどの程度の割合いるのか、店頭でその商品を見てから購入につながるのはどの程度の割合なのか、そもそもその商品を認知している人はどのくらいいるのかという、全数データでは算出できない全体から見た割合というものを確認することも可能となります。

○取得するデータの種類や内容を自由に決められる
全数データの場合には、アクセスやダウンロードといったアクションを伴うデータしか取得することができませんが、パネルデータはアンケートによるデータの取得が可能なため、聴取する項目を変更することであらゆるデータを収集することができます。そのため、収入や職業などといったデモグラフィック属性や性格・考え方などの個人特性、行動ログでは捕捉できない、商品への好意度・商品に対する気持ち(「自分に合っていると思う」「信頼できる」など)という意識ベースのデータなどの収集を得意としています。アンケート項目は都度変更可能ですし、商品カテゴリで聞くのか、それとも商品名まで詳細に聞くのかも自由ですので、その時必要な情報を必要な形式で取得できるのがパネルデータのメリットです。加えて、環境が整っていればパネルデータでもログによるデータの取得が可能です。アンケートデータとログデータの両方を収集・分析できるのもパネルデータの特徴と言えます。

△収集できるサンプル数に限りがある
パネルデータの課題点としてはサンプル数の問題が挙げられます。前述の通り、パネルデータはあらかじめパネル化しておいたサンプルに対して調査をかけてデータを取得するため、データを収集できるサンプル数はあまり多くありません。そのため、出現率の低い特殊なターゲットなどについては、後の分析に足るサンプル数のデータを取得できないことがあります。

パネルデータの特徴
action.png

icecoffe.png コーヒーブレイク ~パネルデータにも2パターンある~

ここまで「パネルデータ」と呼んでいるデータですが、実はこの中もパネルの集め方によってさらに2パターンに分けることができます。

①「手上げ式」
例えば一般的なアンケートサイトではモニターはインターネット上で募集され、希望者が自らモニターとして登録することでパネルができているため、このようなパネルの集め方を「手上げ式」といいます。募集の方法はネット以外にも、新聞に広告を出す、自社会員に対してDMを送付するなど様ざまあり、いわゆる調査会社にアンケート調査を依頼すると多くの場合、この手上げ式パネルにて収集したデータとなります。手上げ式パネルは比較的容易にモニターを集められるという利点がありますが、募集を見た人が自主的にモニターに登録することになるので、アンケートに興味がある・こうした取り組みに協力的といった特性の人がパネルに多く集まる傾向になります。パネル内のモニター特性の構成が世の中全体と比べて偏っている可能性もあるので、手上げ式パネルにて収集したデータを用いて分析した結果から傾向等を読み取ることはできますが、その結果が一般的な社会の状況を表しているとは必ずしも言えない点には注意が必要です。

②「サンプリング式」
手上げ式の特性の偏りを解決するのがサンプリング式のデータです。サンプリングとは、調査を行いたい母集団から直接、調査の対象となるサンプル(=標本)を抜き出すことです。定量的な調査を行う場合、一般的には抜き出すサンプルを無作為に決めるランダム・サンプリングという手法が用いられ、抜き出した対象のサンプルに対して調査の協力を依頼します。母集団から無作為にサンプリングすることで、抜き出した標本の構成は母集団の構成と似たものになっていると言え、例えば住民基本台帳などを用いて日本社会を母集団とした標本を抽出しパネル化した場合、このパネルに対してアンケートを行って得られた結果は、日本社会全体を反映したデータであると考えることができます。このようなサンプリングデータを用いれば、ある商品を認知している人が日本全体の何パーセント、購入経験のある人が何パーセントといった、社会全体の状況を正しく把握することが可能になります。ちなみに、ビデオリサーチが提供している視聴率データもサンプリング式のパネルデータとなります。

ちなみに、国勢調査は日本国内に住むすべての人及び世帯を対象とする「全数調査」というものにあたりますが、ここで言う「全数」は全数データとは意味が異なり、言葉通り、調査対象である「日本に住む人」全員に対して調査を行うために「全数調査」と呼ばれます。日本社会全体の状況を知るためのデータが欲しい時には、全数調査のように日本に住む人全員に対して調査を行うことが理想ですが、費用や時間的な問題で一般企業では実施が現実的ではないので、そのような場合には、先に述べたように日本社会の縮図となるようにサンプリングしたデータを用いて調査を行い、その結果から母集団である日本社会全体の傾向を類推する手法を取ります。

nihontizu.png

ここまで説明してきた通り、全数データとパネルデータでは特性がまったく異なっており、どちらも一長一短があるデータです。そのため、シーンに応じて最適なデータを使い分けることが、ビジネス上の活用において非常に重要となります。

全数データとパネルデータの使い分けを具体的な例で考えてみると...

ここまでお話ししてきた全数データとパネルデータというのを実際のデータに置き換えて、それぞれがどのように活用できるのかを見てみましょう。例えば「テレビCM出稿最適化」という場面に当てはめてみると、使用するデータソースとしてはそれぞれ以下のように考えられます。

 全数データ = テレビメーカーや放送局、セットトップボックスから取得できるテレビ視聴ログ
 パネル(サンプリング)データ
= ビデオリサーチの視聴率データ

全数データ
=テレビメーカーや放送局、セットトップボックスから取得できるテレビ視聴ログを使用する場合

zensu-coment.png

全数データである視聴ログの場合は大規模にデータが取得できているので、出現率の低いターゲットについての分析や、CM接触者を細かいターゲットに切って見ることが可能になります。
例)
・出現率が低いターゲットでの分析
 ⇒「△△」というドラマを毎週欠かさず見ていた人について分析
・細かいターゲットに切って見る
 ⇒2月14日の20時台に○○局のバラエティ番組を見ていた人を性別×年代×都道府県別に見る
また、メーカーなどが自社でデータを集積している場合には、視聴ログと各社で取得しているデータとをIDによって連携することが可能なため、「サイト会員」「自社ECサイトのヘビーユーザー」など、各社独自のセグメントをターゲット軸としてデータを見ることができるのも特徴のひとつと言えます。このように、宣伝したい商品・サービスのターゲット層がどの時間帯にCM(テレビ)を見ているか、どの時間帯にCMを出稿すると効率的にターゲットに届けられるのかを把握するような、商品・サービスごとの細かなターゲットに合わせたプランニングへの活用が可能です。一方、視聴ログの欠点としては、取得できているデータがテレビを見た人のものに限られるため、日本全体でどのくらいの人にそのCMが届いたかという割合を正しく把握することはできず、リーチをふまえたプランニングには向いていません。

heatmap.png


パネル(サンプリング)データ

ビデオリサーチの視聴率データを使用する場合

panel-coment.png

パネルデータ、中でもサンプリングデータである視聴率データの場合、CMを見た人・見ていない人両方のデータが社会の縮図になるように取得できているため、日本全体(※注)でどのくらいの割合の人にCMが届いたかという正確なリーチを算出することができるのが1番のポイントです。一方、CMが届かなかった人がどの程度いて、その人達にどのような特徴があるのかを把握することもできるため、CMをもっと多くの人に届けるにはどうしたらよいのかという出稿プランニングに活用することもできます。このような客観性のあるデータから、競合を含めた自社の状況を相対的に評価できるのもサンプリングデータの特徴のひとつと言えます。また、一般的なアンケートパネルを使用してデータを収集した場合には、CMを「見た」という指標だけではなく、CMに「興味を持った」、CMを見て「実際に商品を購入した」というようなデータも取れるため、KPIを自社の指標で設定した効果検証を行うのに適しています。視聴率・アンケートで聴取したデータともに欠点として、全数データとは逆にデータを取得できるサンプル数が限られているため、出現率の低い特殊なターゲットの場合には分析に耐えうるだけのデータが集められない可能性があることが挙げられます。

※注:ビデオリサーチ視聴率サービスエリアの27地区

reachcarb.png

全数データとパネルデータの使い分けが重要!

ここまで述べてきたように、一口に「データ」と言っても、"集まる"全数データと"集める"パネルデータではその特徴が大きく異なります。そのため、ビジネスに活用するデータは利用目的に応じた使い分けが重要になってきます。しかしながら、みなさまのビジネス上の様ざまな課題を解決するためにどのような種類のデータが必要なのか、全数データとパネルデータをどのように使い分けるのか、というのを判断するのはなかなか難しいものです。また、必要なデータがわかったとしても、そのデータをどのように取得するのかという問題もあります。
ビデオリサーチでは、視聴率のようなサンプリングデータだけではなく、全数データを用いたソリューションについても提供可能です。また、調査会社として長年培ってきたデータ活用のノウハウがありますので、データのハンドリングもお任せください。近年多くの企業で導入されるようになってきたDMPも、集まってきたデータと集めたデータの両方が一緒くたになっている場合が多く、どちらのデータをどのように使えばいいのかお困りの担当者も多いと思います。そんな時、ビデオリサーチではデータの使い分けを含め、データの取得から活用までトータルでの提案・サポートを行わせていただきます。

自社DMPをもっと活用したいとお考えの方、自社で全数データを取得しているもののそのデータ活用に課題をお持ちの方、自社にはそもそもどんなデータが必要なのかとお悩みの方、欲しいデータが自社では収集できずに困っている方など、当社のデータ活用ソリューションに少しでもご興味をお持ちになられた方はお気軽にお問い合わせください。

記事の中でご紹介しているサービスはこちら 
【VR LINC】   

サービス一覧

関連記事