統計学とは
1.統計学とは
wikipediaによると
統計学は、経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。統計的手法は、実験計画、データの要約や解釈を行う上での根拠を提供する学問であり、幅広い分野で応用されている。
要約すると世の中の多種多様なデータを一般人(ある程度の知識は必要)でも解釈しやすいようにしてくれる学問である。
再びwikipediaを借りると
英語で統計または統計学を statistics と言うが、語源はラテン語で「状態」を意味する statisticum であり、この言葉がイタリア語で「国家」を意味するようになり、国家の人力、財力等といった国勢データを比較検討する学問を意味するようになった。
という語源が示すとおり、源流は国家または社会全体における人口や経済に関する調査にある。
近年ではデジタル化、クラウド化というデータ取得やデータ保持コストの低価格化に伴う、ビッグデータブームと相まって、「統計学が最強の学問である」という本がビジネス書大賞2014を獲得したり、セブン&アイ ホールディングス会長の「鈴木敏文の統計心理学―仮説と検証で顧客のこころを摑む―」という本が出版されたりとビジネスの場においても統計学の重要性が高まってきている。
2.統計学の種類
統計学に大きく分けて「記述統計」と「推測統計」の二種類がある。
記述統計:収集したデータを表やグラフにしたり、要約統計量と呼ばれる平均や分散などを計算して、データの特徴を把握する統計。
とあるスーパーマーケットがあった時に、売上を分解して、どういう商品が売れているか?どのような人が買っているのか?一人あたりの購入点数や購買価格は?といったデータを集計したりどういう分布になっているかを把握したりする、いわゆるデータを可視化するという領域である。
推測統計:標本(サンプル)データの背後にある母集団の特性を推測し、それが正しいかどうかを検定する統計。
何かアンケートを取ろうとした時に、本来なら「全数調査」と呼ばれる対象者全員に質問するというのが理想ではあるが、大半が物理的、時間的、コスト的に実現は不可能な為、一部のデータ(標本またはサンプル)から、全体を表すことができるかどうかの判定をする領域である。