dwh-auditor — DWH コスト監査 & ガバナンスツール¶
dwh-auditor は、BigQuery の INFORMATION_SCHEMA を解析し、 クラウドデータウェアハウスの コスト最適化・セキュリティ監査・ガバナンス強化 を コマンド一発で実現するオープンソース CLI ツールです。
Tip
実際のテーブルデータには一切アクセスしません。
メタデータ(INFORMATION_SCHEMA)のみを読み取るため、
セキュリティポリシーが厳しいエンタープライズ環境でも即座に導入できます。
主な機能¶
# |
機能 |
説明 |
|---|---|---|
💸 |
アドホック高コストクエリ検知 |
過去 N 日間で単発の課金バイト数が多かったクエリを Top-N でランキング表示します。 |
🔄 |
定常実行アラート (定期的な高コストクエリ) |
バッチやダッシュボード等から定期的に実行され、積算コストが高額になっているクエリを検知します。 |
🚨 |
フルスキャン検知 |
|
🧟 |
ゾンビテーブル検知 |
長期間参照されていないテーブルを特定し、不要なストレージコストを可視化します。 |
📊 |
マルチフォーマット出力 (Markdown / JSON) |
CI/CD に組み込み、GitHub Actions の Artifact に保存したり jq でパース可能な結果を出力します。 |
クイックスタート¶
pip install dwh-auditor
# Generate a configuration file
dwh-auditor init
# Audit BigQuery project (Console output)
dwh-auditor analyze --project my-gcp-project --days 30
# Generate Markdown report
dwh-auditor analyze --project my-gcp-project --output markdown
ドキュメント目次¶
はじめに
設計・アーキテクチャ
API リファレンス
運用・デプロイ
必要な IAM 権限¶
dwh-auditor はメタデータのみを読み取るため、必要な権限は最小限です。
IAM ロール |
用途 |
|---|---|
|
データセット・テーブルのメタデータ閲覧 |
|
ジョブ履歴 ( |
警告
roles/bigquery.dataViewer 以上の権限は 不要 です。
テーブルの実データ(レコードの中身)にはアクセスしません。