Wprowadzenie
Cumulative Distribution Function (CDF) – Funkcja Rozkładu Skumulowanego – to jedna z najważniejszych funkcji w teorii prawdopodobieństwa i statystyce. Pokazuje ona prawdopodobieństwo, że zmienna losowa przyjmie wartość mniejszą lub równą danej liczbie x.
Matematyczna definicja
Dla zmiennej losowej X funkcja CDF jest zdefiniowana jako:
F(x) = P(X ≤ x)
Gdzie:
- F(x) – wartość funkcji rozkładu skumulowanego w punkcie x
- P(X ≤ x) – prawdopodobieństwo, że zmienna X przyjmie wartość mniejszą lub równą x
Właściwości CDF
- Funkcja jest niemalejąca
- limx→-∞ F(x) = 0
- limx→+∞ F(x) = 1
- Jest prawostronnie ciągła
- Dla rozkładu ciągłego: F(x) = ∫-∞x f(t) dt (gdzie f(t) to PDF)
Związek z PDF i PMF
- Zmienne ciągłe: CDF jest całką z Probability Density Function (PDF)
- Zmienne dyskretne: CDF jest sumą z Probability Mass Function (PMF)
Zastosowania w AI i Data Science
- Ocena modeli (np. ROC-AUC, Precision-Recall)
- Analiza rozkładów predykcji modelu
- Generative Models (np. w Diffusion Models)
- Statystyczne testy hipotez
- Normalizacja i standaryzacja danych
- Quantile Regression i predykcja przedziałów ufności
- Detecting outliers i anomaly detection
Powiązane pojęcia
Probability Density Function (PDF) • Probability Mass Function (PMF) • Quantile • Expectation • Variance • Normal Distribution • ROC Curve • Quantile Regression
Dodano: 16 maja 2026