「この数字、正しいの?」——経営会議や部門レビューで、誰かがこう言い出す瞬間があります。その一言で議論が止まり、担当者がExcelを掘り返し始める。気がつけば30分が「数字の確認」に消えている。
この問題はIT部門の怠慢でも、担当者の不注意でもありません。データ品質は、業務プロセス・ルール・組織・システムが複合的に絡み合って生まれる構造的な問題です。一箇所を直すだけでは再発し、診断なき改善は必ず壁にぶつかります。本連載では、そのための体系的な考え方を8回にわたって解説します。
DMBOKとは何か
DAMA(Data Management Association)が策定した「DMBOK(Data Management Body of Knowledge)」は、データ管理の国際的な知識体系です。データガバナンス・データアーキテクチャ・マスタデータ管理など11の知識領域を体系化しており、「データ品質」はその中核に位置づけられています。
本連載はDMBOKの難解な理論書を翻訳するものではありません。現場で起きている「数字が合わない」「BIが使われない」「AIが精度を出せない」といった問題を、DMBOKの視点で読み解くことを目的としています。
データ品質を診断する6つの軸
DMBOKはデータ品質を6つの次元(ディメンション)で捉えます。これが診断の基本フレームワークです。
DMBOK データ品質の6次元
① 完全性
Completeness
必要なデータ項目に欠損なく値が入力されているか。空欄・NULL・未入力がどの程度存在するかを測る。
② 正確性
Accuracy
記録された値が現実の事実と一致しているか。入力ミス・古い情報の放置・転記エラーが主な原因になる。
③ 整合性
Consistency
複数のシステム・部門間で同じ概念が同じ定義・表記で扱われているか。「売上」の定義が部門で異なるケースが典型。
④ 最新性
Timeliness
必要なタイミングで最新の状態に保たれているか。更新頻度の遅延や締め処理のタイムラグが影響する。
⑤ 有効性
Validity
定義されたルール・フォーマット・取りうる値の範囲に沿った値が入力されているか。入力規則の不在が原因になりやすい。
⑥ 一意性
Uniqueness
同一の実体が重複して登録されていないか。顧客マスタの名寄せ問題や、商品コードの二重登録が代表例。
6つの軸は独立した問題ではありません。たとえば「完全性」が低い(空欄だらけ)の裏には「有効性」の問題(入力ルールが定義されていない)が隠れていることが多い。診断では6軸を横断的に評価することで、表面的な症状ではなく根本原因を特定します。
本連載の用語とBFT Insightサービスの表現について
本連載に記載する用語はDMBOK2に準じます。BFT Insightでは、現場担当者が直感的に理解できるよう実務的な表現を採用し、6次元を5次元に集約しています。本連載でDMBOKの体系を理解しておくと、診断レポートの読み解きがより深くなります。
この連載の全体像(全8回)
- 第1回:データ品質を「診断」する——DMBOKが示す全体地図(本記事)
- 第2回:なぜデータは汚れるのか——データライフサイクルと品質劣化のメカニズム
- 第3回:「誰が正しい数字を持っているか」問題の正体——マスタデータ管理
- 第4回:BIが信用されない本当の理由——データ品質とBI活用の関係
- 第5回:診断なき改善が失敗する理由——データ品質診断のフレームワーク
- 第6回:ガバナンスなしに品質改善は続かない——データガバナンスの基礎
- 第7回:データ品質改善ロードマップの作り方——優先順位と改善サイクル
- 第8回(最終回):あなたの組織のデータ品質改善はここから始まる——連載8回の学びと実践の第一歩
次回(第2回)は、データが「なぜ汚れるのか」のメカニズムを、データライフサイクルの観点から解説します。業務の中のどの瞬間に品質が劣化するのかを知ることが、効果的な診断の出発点です。
BFT Insight データ品質診断
本連載で解説するDMBOKの6次元を用いて、御社のデータ品質を2週間で定量スコア化します。どこが問題でどこから着手すべきかを、根拠ある数字でご提示します。まずは資料でサービス内容をご確認ください。