近年、ビッグデータの活用がさまざまな分野で行われています。ビッグデータというのはインターネット上に蓄積された膨大なデータのことで、気象データ、交通情報データ、オンラインショッピングの購入履歴からSNSの投稿まで多種多様なものがあります。

このビッグデータを解析して得られた有益な情報を、マーケティングなどに役立てていこうとする*“データマイニング”*と呼ばれる手法に注目が集まっています。本記事では、これからデータマイニングに取り組んでいこうとする方に「データマイニングとは何か」、そして「データマイニングの基礎」を学習できるサイトを紹介します。

データマイニングとは

大量のデータを統計学的手法やパターン認識、人工知能などの様々な方法で解析を行って、有意なパターンやルールを見つけ出すことが「データマイニング」です。わかりやすく言うと、たくさんのデータを解析することで、データの中に埋もれた傾向やパターンを掘り出す(マイニング)ことです。

例えば、膨大な気象データから、パターンや傾向を読み取り、局地的なゲリラ豪雨などの予測や、蓄積された膨大な交通情報から渋滞の予測をしたり、渋滞が起こらないような道路計画に役立てたり、などの活用も可能。

Webマーケティングの分野でもこのようなデータマイニングの活用は有効で、例えばECでの購入や商品閲覧履歴から、特定の地域に住む30代の男性はどういったものを好む傾向にあるか、などといった情報を取り出すことができます。

この情報を元に、詳細にターゲティングされた広告を出すことで、より成約率の高い効果的な広告が実施できるのです。

データマイニングについて参考にしたい記事5選

1.「仕事の合間に!3分間データマイニング入門」

1.png
http://www.netyear.net/service/data/analysis_datamining1.html

「3分間で読めること」をコンセプトに分かりやすく読みやすい内容でデータマイニングについて解説。データマイニングをマーケティングに活用するための記事をメインに掲載されています。

マーケティングに活かせるデータマイニングについて紹介されている内容が多いので、実戦に役立つでしょう。

2.「SPSS Modelerによるデータマイニング入門」

2.png
http://www.co-graph.net/spss-modeler入門-1/

IBMからリリースされているSPSS Modelerは多くの企業で利用されているデータマイニング用のソフトウェアです。このSPSS Modelerは高機能なデータマイニングツールとしては非常に有名なもので、さまざまな分野で活躍。

この記事では、SPSS Modelerをベースに基本的な使い方から、活用に関する情報まで順序立てて説明していますので、このソフトウェアを使う方はもちろん、データマイニングについて情報収集するのであれば非常に役に立つでしょう。

3.「データマイニング入門~Rと統計に触れてみる~」

http://www.slideshare.net/hrfm/0624-r-23376832

データマイニングはビッグデータを統計的に処理するという手法であることから、解析には統計学の知識を習得することが必要になります。このスライドでは、統計処理でよく用いられる統計処理ソフトウェアRを使ってデータマイニングを基礎から学べます。

4.「Rを学ぼう!エンジニア向けデータマイニング講座」

4.png
http://careerhack.en-japan.com/report/detail/382

前述と同様で、Rを使った統計処理を通してデータマイニングを学習できる記事です。Webエンジニアの事例や使い方までを紹介した内容になっています。

5.「Clojure/Incanter/clj-mlでデータマイニング入門」

5.png
http://antibayesian.hateblo.jp/entry/2014/02/16/021401

JAVA上で動くClojureという言語に、Incanterとclj-mlというモジュールを導入することで、簡単にデータマイニングが可能です。
こちらの記事では、Clojureを使ってデータマイニングによる分析を行う手法を解説しています。