データマートとは?DWHやデータレイクと比較し分かりやすく解説!

「データマート」とはなにかご存じでしょうか。
似たような言葉として「データウェアハウス(以下「DWH」)」「データレイク」などがありますが、違いを把握できているでしょうか。

この記事では、これらをわかりやすく解説し、データマートの利用が有効なパターン4つをご紹介します。

データマートとは

データマートとは

データマートは、特定の部門や業務分野に関するデータのみが格納されているデータベースです。

データマート(Data Mart)は直訳で「データの小売店」です。マートには、小売店(消費者が商品を購入する販売店)の意味があります。消費者の声を元に様々な商品の中からデータを収集し、使いやすい形で提供します。

データマートはユーザーが必要としているデータだけを集めてより使いやすい形で提供します。

データマートの特徴

企業内に保管されている膨大なデータの中から、目的に合った必要なデータだけを細かく切り分けて格納されます。データソースと比べるとかなり小規模なデータ量になります。

データマートが扱うデータは、特定の部門や業務分野に関するもののみです。想定されるユーザーのニーズを満たす、処理/加工済みのデータが格納されています。

データマートの用途

必要なデータの抽出が済んでいる状態であるためユーザーにとって非常に利用しやすいものです。そのため、利用するデータの範囲が明確な業務と相性が良いでしょう。逆に多角的な分析などには不向きです。

データマート/DWH/データレイク 比較

DWHとは

DWH は、企業内の複数部署や業務分野にわたるデータを一元管理するための統合データベースです。

DWH(Data Ware House)は直訳で「データの保管庫」です。保管庫には様々なデータが保管されていますが、いずれも保管しやすい形式に整えられています。

DWHは複数分野の様々なデータを構造化して保管します。

DWHは、あらかじめ必要なデータ項目を整理しておき、そこにデータを集めるという考え方で構築されます。

上図の通り、DWHはデータマートのデータソースになる存在です。DWHとデータマートにはよく似た特徴がみられますが、格納されるデータの範囲・量と目的/用途に違いがあります。

データマートはユーザーに使いやすい形でデータを提供することを目的に作られるのに対し、DWHは一元的にデータを管理し扱いやすくすることを目的に作られます。

データレイクとは

データレイクは、データ形式に関わらず様々なデータを一元化できるデータの保存場所です。

データレイク(Data Lake)は直訳で「データの湖」です。湖は貯水の役割を表しており、大量データの保管に特化しています。

データレイクは形式を問わず様々なデータを大量に保管しておくことができます。

上図の通り、データレイクはデータマートのデータソースになる存在です。扱うデータの範囲や量が大きく異なります。また、データマートが提供するデータは利用目的が明確であるのに対し、データレイクに蓄積されるデータには何に利用するか定まっていません。

データレイクは、構造化データだけでなく非構造化データを格納できるという特徴があります。保管データには一切処理を加えないため、ビッグデータを本来あるべき姿のデータのまま扱うことができます。

データレイクには未処理のデータが格納されるため、情報が重複していたり、会社にとって意味のない情報が存在していたりすることがあります。しかし、ビジネスではどの情報が価値を持っているかわりません。データレイクに情報を蓄積しておき必要なタイミングで有効活用できるように、導入する企業が増えています。

データの形式がそろっていないため、ユーザーにとって活用の難易度が高くなりますが、マーケティングやデータアナリストの業務と相性が良いでしょう。

比較表

データマートDWHデータレイク
目的/用途必要なデータのみを保管し、限定的なユーザーに対して利便性を高めるために活用される社内データなど必要な情報を一元管理するために活用される利用目的が定まっていないデータ含め、幅広くデータを蓄積するため活用される
格納されるデータ目的に合わせたデータで、加工されている場合がある様々な分野の生データを構造化したもの様々な分野の生データで、形式は問わない
構造化データ
(※1)
非構造化データ
(※2)
××
検索のしやすさ
必要なデータに素早くアクセスでき、検索のしやすさ

データの形式がそろっているため検索しやすい

データ形式がそろっていないため扱いが難しい
分析への使いやすさ
保管データ量は多くないため、新しい観点での分析はできない

広い範囲のデータを使って分析できる

データ形式がそろっていないため時間がかかる

(※1)…構造化データとは、定められた形に整形されたデータのこと。例えば、データ属性などを定めるリレーショナルデータベースに保管されているデータが挙げられる。
(※2)…非構造化データとは、そのままの形で保存されたデータのこと。例えば、画像、動画、音声、ソーシャルメディアなどのデータが挙げられる。

データマートのメリット

ユーザーにとって使いやすい

データマートでは、 データソース上の生データだけでなく、集計や編集が施された加工済みのデータも存在し、 ユーザーにとって使いやすいものになっています。

低コストで用意できる

DWHやデータレイクに比べ小規模であるため、早く・安く構築することができます。

サーバー負荷や管理コストが軽減される

細分化されたデータを特定のユーザーに公開できるため、無関係なデータが参照されることがなくなります。また、扱われるデータ量も少なくなるため、サーバーの処理負担も少なくなります。

データマートのデメリット

管理が煩雑になりがち

目的に応じて作成していくうちに、データマートをいくつも管理しなければならない状況になります。この場合、全体を管理することが難しくなり、結果的に運用コストが高くなる可能性があります。

当初の目的/業務以外では利用しづらい

データマートは特定の目的、特定業務や利用ユーザーを前提に作成されるものです。よってその目的以外で利用することには向いていません。

ビッグデータの活用や全社を横断したデータ活用など多様かつ大量データを利用する場合、DWHやデータレイクの方が適しています。

データマートの利用が有効なパターン4つ

社内データが膨大で検索に時間がかかっている

データマートを作成すれば、膨大なデータの中から必要なデータを検索する必要がなくなります。目的や業務別に整理すれば、データ検索の効率がアップします。

現場の業務にデータを活用をしたい

データマートでは、使いやすい形でデータを提供できるため、ユーザーの作業負荷を減らすことができます。近年求められている、現場でのデータ活用にも有用です。

データに基づいた意思決定を素早く行いたい

必要なデータがまとまっていれば、分析や意思決定もスムーズに素早く行うことができます。意思決定に必要なデータを集めたデータマートが活用できます。

ただし、データマートは多角的な分析には不向きです。様々なデータから新しい発想を得るのではなく、実績値を可視化したり、傾向分析に活用するのが良いでしょう。

データを整理して安全に公開したい

データマートを利用することで、ユーザーにDWH内の特定情報にアクセス権を付与できます。 データ公開におけるセキュリティ強化につながります。公開対象が小規模になりデータベースへの影響も少なく、データを管理できます。

データマートを活用することで、システム管理者は安全にデータが公開できるだけでなく、現場にとっても使いやすいデータを受け取ることができます。利用目的や管理体制に気を付けながら活用しましょう。

それぞれ特徴を理解してデータ活用環境を用意しよう!

データマート、DWH、データレイクについてご紹介しました。それぞれの特徴についてはお分かりいただけたでしょうか。データをどんな目的/業務で利用したいのか、どんなデータを使用したいのか、によってデータの保管に適した方法が変わってくると思います。

正しい知識で適切なデータ管理・データ活用環境を整備をして、DX推進活動に活かしましょう。


社内のデータ活用・データ管理には、データマネジメントについての知識が役に立ちます。
ご興味がありましたら下記をご確認ください。

\データ活用環境を整える!/
データマネジメント
基礎知識
データマネジメント基礎知識
データ活用環境を整えるために欠かせないデータマネジメントについてご紹介しています。データ活用をさらに促進したい方は、ぜひダウンロードしてみてください。
資料内容
  • 第1章 データマネジメントとは?
  • 第2章 データマネジメントの進め方
  • 第3章 データマネジメント実践例