ビッグデータ解析システム
ビッグデータカイセキシステム
Big data analysis system
概要
ビッグデータを効率的に処理することを目的とする情報システム。
説明
ビッグデータ解析では解析対象となるデータはさまざまな形式,属性の多様な種類のデータが含まれ,そのデータ量は継続的に増加する。このような特性を持つデータを格納するための仕組みをデータレイクと呼び,OSS(Open Source Software)を活用した分散ファイルシステムで実装されることが多い。データレイクに格納されているデータをそのまま解析ツールで解析する場合と,データレイクからデータウェアハウスさらにデータマートに取り出して解析する場合もある。データ解析の精度を向上し,解析アプリケーションの開発を容易にするためには,発生源で生成された生データに対し,欠損値の補完,外れ値の除去,データ形式変換など,データを解析しやすく加工する前処理が必要となる。前処理もビッグデータ解析システムが具備すべき重要な機能である。
関連項目
最終更新日
- 2019.12.01.
- 吉野松樹 (編集委員会編)