データマイニングとは
「ビックデータ元年」と言われている2012年から、ビックデータと共にデータマイニングという言葉もよく聞かれるようになりました。
なぜ、いきなりこれらの言葉が耳に入るようになったかというと、ICT技術の進歩によるネットワークやバーコードの発達、そしてハードディスクやメモリの発達により、データ一個あたりの収集コストが桁外れに小さくなりました。
さらに、情報を保存しておく機器の進化、インターネットの一般化が大きく関係しています。
たとえば一社のスーパーマーケットチェーン店に蓄積されるバーコードデータは100万件以上にも昇ります。
さらに、一人一台スマートフォンとパソコンを持つのが普通の時代になり、ネットワークサーバに貯まるログなどは、天文学的な量の情報が収集・保存されています。
それらの膨大な量の情報をビックデータと呼びます。
データマイニング 【 Data Mining 】を直訳すると、Data【情報】をMining【採鉱】となります。
ビックデータという情報の炭鉱から、有用なデータを掘り当てるという事を意味しています。
データマイニングの歴史は意外に長く、何度かブームを起こしております。コンピュータを用いての、データの収集や解析をすることは、1960年代には既に行われつつありました。
そして、1990年代半ばから2000年代初めにかけて一度、データマイニングという言葉と概念が大衆に広まりました。
そのブームの火種となった、有名な事例に「おむつとビール」というストーリーがあります。
「ある大手スーパーマーケット・チェーンでPOSデータを分析したところ、顧客はおむつとビールを一緒に買う傾向があることが分かった。ターゲットが成人男性と主婦という、一見関連性の薄そうな両商品だが、調査の結果、子供のいる家庭で母親はかさばる紙おむつを買うように父親に頼み、頼まれた父親はオムツを買うついでに缶ビールも購入していた。この法則性に気付いた店長は、おむつとビールを並べて陳列したところ、売り上げが上がった。」
というものです。
このように、データマイニングというのは「いっけん意味のないような大量に蓄積されたデータを解析して、その中に潜むデータ間の相関関係や法則性などを探し出す技術」の事です。
現在そのデータマイニングの必要性や可能性が見直され、再度注目されてきております。