ML Capacity Planning for Heterogeneous Databases (Telemetry -> Clusters -> P50/P95)

End-to-end reference implementation of a capacity planning system that:

clusters workload patterns from telemetry (heterogeneous DB fleet)
predicts baseline and peak compute needs via quantile boosted-tree models (P50/P95)
adds explainability + drift-aware retraining to reduce overprovisioning and prevent slowdowns

Quickstart

python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

python scripts/generate_synthetic.py --days 90 --n_dbs 120
python scripts/train.py
python scripts/predict.py --input data/raw/telemetry.csv --output reports/predictions.csv
python scripts/drift_check.py --maybe_retrain

Docs

See docs/ for overview + schema + extension ideas.

License

MIT

Architecture

Demo Pipeline

Design Decisions

See: docs/design_decisions.md

Explainability (SHAP)

After training, generate SHAP explanations:

python scripts/explain_shap.py --quantile 0.95

Artifacts: reports/shap/

Metrics Visualization

Generate plots:

python scripts/plot_metrics.py

Artifacts: reports/plots/

Example Outputs (After Training)

Metrics

SHAP Explainability

These images are generated after running:

python scripts/train.py
python scripts/plot_metrics.py
python scripts/explain_shap.py --quantile 0.95

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
config		config
docs		docs
reports		reports
scripts		scripts
src		src
.DS_Store		.DS_Store
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ML Capacity Planning for Heterogeneous Databases (Telemetry -> Clusters -> P50/P95)

Quickstart

Docs

License

Architecture

Demo Pipeline

Design Decisions

Explainability (SHAP)

Metrics Visualization

Example Outputs (After Training)

Metrics

SHAP Explainability

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ML Capacity Planning for Heterogeneous Databases (Telemetry -> Clusters -> P50/P95)

Quickstart

Docs

License

Architecture

Demo Pipeline

Design Decisions

Explainability (SHAP)

Metrics Visualization

Example Outputs (After Training)

Metrics

SHAP Explainability

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages