こんにちは、株式会社ブレインパッド(以下、ブレインパッド)でソーシャルメディア分析を担当している福江です。

近年、ビッグデータ活用に対する機運が一段と高まっており、弊社でも様々な形でビッグデータの活用支援を行っています。

Twitter広告ならこの資料をチェック!

Twitter広告ならこの資料をチェック!

広告のプロが解説する『Twitter広告はじめてガイド』をダウンロード

しかし、ビッグデータと一口に言ってもその種類や利用用途は様々であり、何となく意味を理解しているものの、実際にどのようなデータからどういった中身を引き出せるのか具体的なイメージが湧かない人もいるのではないでしょうか。

今回の記事では、身近なビッグデータである"ソーシャルビッグデータ"、いわゆる"SNSの分析データ"について、実際にTwitter全量分析ツールを用いた分析結果とともに説明します。
  

ソーシャルビッグデータについて

まずは、ビッグデータの概念についてご説明します。下記にて用語集に対する意味から理解していきましょう。

ビッグデータ
通常のデータベースでは、記録、保管、解析が難しいような巨大なデータ群のこと。

ビッグデータを定義する要素として、Volume(容量)、Velocity(頻度)、Variety(種類)の3Vが揃っていることが上げられるが、どこからがビッグデータなのかといった明確な定義はまだない。

Variety(種類)…構造的に形作られた「構造化データ」だけでなく、文書、画像、音声、動画、センサーデータなどの「非構造化データ」も処理対象になっている。
Velocity(頻度)…様々なモノがインターネットに繋がったことで、高頻度に発生するデータをリアルタイムに収集し、分析処理できるようになっている。
Volume(容量)…Variety(種類)が増え、Velocity(頻度)も増えた結果、扱うデータのVolume(容量)も激増しており、その容量は、数十テラバイトから数ペタバイトに及ぶと言われている。(テラは10の12乗、ペタは10の15乗)

引用元:株式会社ブレインパッド|ブレインパッド用語集

上述のとおり、ビッグデータは「容量」「頻度」「種類」と主に3つの要素で構成されます。その中でも、さらに「内部データ」と「外部データ」の2つに分類できます。

チャットボット運用で押さえておきたいポイントは?

チャットボット運用で押さえておきたいポイントは?

業界別導入事例に学ぶ成功のポイントを資料でチェック

内部データとは、POSなどの購買履歴やCRM(顧客情報管理)データなど社内で収集・管理を行っているデータを指します。一方、外部データは自社ではなく、外部の会社が収集・管理を行っているデータです。

例えば、政府系機関、調査団体のデータや今回のテーマであるソーシャルメディアのデータを指します。

ソーシャルビッグデータの主なメリットは、以下の3つです。

● ソーシャルビッグデータの主なメリット

1. 過去に自社でデータを蓄積していなくてもデータ分析を行えること
2. 一般に公開されているデータを扱うため情報漏えいなどのリスクが低いこと
3. 顧客の生の声をリアルタイムで聴けること

特に3番目について、アンケートやインタビューでは質問者の設計に回答が左右されがちです。日本人は真面目な方も多いため、どうしても教科書的な発言が多くなります。

その反面、TwitterなどのSNSでは分析されることを前提に投稿しているわけではないため、リアルな意見が多くなり、既存の調査手法では聞くことが難しかったサイレントマジョリティーの声を拾いやすくなっています。