ISディジタル辞典-重要用語の基礎知識-第二版

ビッグデータ解析システム

ビッグデータカイセキシステム

Big data analysis system

概要

ビッグデータを効率的に処理することを目的とする情報システム

説明

ビッグデータ解析では解析対象となるデータはさまざまな形式,属性の多様な種類のデータが含まれ,そのデータ量は継続的に増加する。このような特性を持つデータを格納するための仕組みをデータレイクと呼び,OSS(Open Source Software)を活用した分散ファイルシステムで実装されることが多い。データレイクに格納されているデータをそのまま解析ツールで解析する場合と,データレイクからデータウェアハウスさらにデータマートに取り出して解析する場合もある。データ解析の精度を向上し,解析アプリケーションの開発を容易にするためには,発生源で生成された生データに対し,欠損値の補完,外れ値の除去,データ形式変換など,データを解析しやすく加工する前処理が必要となる。前処理もビッグデータ解析システムが具備すべき重要な機能である。

関連項目

ビッグデータ企業情報システム