機械学習とは
機械学習とは
パターン認識とは、「何らかの入力が与えられたときに、 その入力パターンを解析して適切なカテゴリに分けること」です。 例を挙げると分かりやすいので、身近な例をいくつか紹介します。
・スパムメールの検知
メールを受信すると、どれがスパムでどれがそうでないかを識別します。この問題のモデルがあれば、プログラムがスパムでない電子メールを受信ボックスに残し、スパムメールをスパム・フォルダーへ移すということが可能になります。非常に有名な例の1つです。
・クレジットカード不正検知
ある顧客の1ヶ月のクレジットカード取引履歴から、それらの取引がその顧客によってなされたものか不正に利用されたかを識別します。これにより、クレジットカードの不正利用を早急に発見することが出来ます。
・数字認識
封筒の手書きの郵便番号を認識し、その手書き文字の数字を識別します。これにより、コンピューター・プログラムが手書きの郵便番号を読み取ることが出来るようになり、封筒を地域毎に仕分けることが可能になります。
◇機械学習ってどうやってるの??
では、機械学習はどのように実現されるのでしょうか。
パターン認識には色々な手法がありますが、よく用いられる方法は、以下の図のようなものです。
まず、元の入力パターンから認識のために必要な本質的な情報を選んで取り出し ます。これを特徴抽出といい、取り出された情報を特徴といいます。次に、抽出した特徴を用いて入力パターンを分類して出力します。
◇特徴抽出部とは
パターンがどんなクラスに属するかを認識するためには、各パターンの特徴を掴む必要があります。適切な特徴を掴むことが出来れば、上手くクラスを識別することが可能になります。この特徴抽出部で特徴をつかめなければ識別が上手くいきません。
◇識別とは
入力された特徴が、どのクラスに属するかを識別する処理です。どのような特徴をもったパターンを各クラスに属するかを識別するために「プロトタイプ」を設定します。プロトタイプとは、クラスを代表する特徴のことです。
◇出力とは
出力部分では、識別部で作成されたプロトタイプを使い、どのプロトタイプにより近いか判定した結果を出す部分です。