Wprowadzenie
Out-of-Distribution Detection (OOD Detection) to zadanie polegające na identyfikacji próbek danych, które pochodzą z rozkładu różniącego się od tego, na którym model został wytrenowany. Jest to jedna z kluczowych technologii dla bezpiecznego i wiarygodnego działania systemów AI w rzeczywistym świecie.
Dlaczego OOD Detection jest ważne?
- Modele AI bardzo słabo generalizują poza dane treningowe (brak „zdrowego rozsądku”)
- W praktyce napotykamy nieznane klasy, warunki środowiskowe lub ataki
- Krytyczne w zastosowaniach bezpieczeństwa: medycyna, autonomiczne pojazdy, finanse, systemy decyzyjne
- Pozwala modelowi „wiedzieć, czego nie wie”
Główne podejścia do OOD Detection
- Maximum Softmax Probability (MSP) – najprostsza metoda bazująca na pewności modelu
- Energy-based Methods – wykorzystanie energii modelu
- Mahalanobis Distance – metoda statystyczna w przestrzeni cech
- Gradient-based Methods (GradNorm, ODIN)
- Generative Approaches – modele autoregresywne i density estimation
- Self-Supervised Methods (np. RotNet, SimCLR + OOD head)
- Bayesian Neural Networks i metody oparte na niepewności (Uncertainty Estimation)
OOD vs Anomaly Detection
Często mylone pojęcia:
- Anomaly Detection – wykrywanie rzadkich, nietypowych przykładów w obrębie tego samego rozkładu
- OOD Detection – wykrywanie przykładów pochodzących z zupełnie innego rozkładu
Wyzwania (stan na 2026)
- Near-OOD vs Far-OOD (trudne vs łatwe przypadki)
- Spadek wydajności przy silnym domain shift
- Brak uniwersalnej metody działającej dobrze we wszystkich domenach
- Ataki adversarialne na detektory OOD
- Skalowalność do bardzo dużych modeli (LLM, Vision Transformers)
Powiązane pojęcia
Uncertainty Estimation • Open Set Recognition • Distribution Shift • Anomaly Detection • Mahalanobis Distance • Energy-based Models • AI Safety • Robustness • Calibration