データマイニング
データマイニング
Data mining
概要
ビジネス拡大などのために,大量で多様な業務データなどを分析して有用な知見を導出するプロセス。
説明
データの集合から,その性質を表すさまざまな構造・関係・規則を発見し利用する。主なタスクは,(複数データ間の)相関ルール,分類(学習用データによる分類器を用いて新しいデータを分類),回帰分析(連続値の数値予測など),クラスタリング(データ間の類似度に基づきデータのグルーピングを行う),外れ値検出(統計的モデルやデータ間の距離などを利用)などである。大量で多様なリアルタイム性が高い正確性を確保したデータ群を収集・保存・分析し,その知見をビジネスに有効に活かすビッグデータの活用において,データから導出した知見・洞察をビジネス改善に活かすためのデータ分析の重要なプロセスとなる。データの見える化,データの構造化(データ間関係性の明確化),データ特徴量の抽出と最適化,将来値予測などがそのプロセスの内容である。想定できる適用例は,よく買われる商品の組み合わせ分析から陳列の方法を考えるマーケットバスケット分析や,マーケティングにおける多種の観点での顧客分類,Webページやドキュメントの分類や検索,センサネットワークと空間情報を組み合わせたマイニングによる人の行動予測,など多岐にわたるビジネスにおけるデータ分析ニーズに必須のプロセスになっている。
参考文献
- 石川博,新美礼彦,白石陽,横山昌平:データマイニングと集合知,共立出版 (2012).
- 小林孝嗣:ビッグデータ入門,インプレスジャパン (2014).
最終更新日
- 2019.12.01.
- 山本裕 (編集委員会編)