Out-of-Distribution Detection (OOD) | Detekcja Danych Spoza Rozkładu

Wprowadzenie

Out-of-Distribution Detection (OOD Detection) to zadanie polegające na identyfikacji próbek danych, które pochodzą z rozkładu różniącego się od tego, na którym model został wytrenowany. Jest to jedna z kluczowych technologii dla bezpiecznego i wiarygodnego działania systemów AI w rzeczywistym świecie.

Dlaczego OOD Detection jest ważne?

Modele AI bardzo słabo generalizują poza dane treningowe (brak „zdrowego rozsądku”)
W praktyce napotykamy nieznane klasy, warunki środowiskowe lub ataki
Krytyczne w zastosowaniach bezpieczeństwa: medycyna, autonomiczne pojazdy, finanse, systemy decyzyjne
Pozwala modelowi „wiedzieć, czego nie wie”

Główne podejścia do OOD Detection

Maximum Softmax Probability (MSP) – najprostsza metoda bazująca na pewności modelu
Energy-based Methods – wykorzystanie energii modelu
Mahalanobis Distance – metoda statystyczna w przestrzeni cech
Gradient-based Methods (GradNorm, ODIN)
Generative Approaches – modele autoregresywne i density estimation
Self-Supervised Methods (np. RotNet, SimCLR + OOD head)
Bayesian Neural Networks i metody oparte na niepewności (Uncertainty Estimation)

OOD vs Anomaly Detection

Często mylone pojęcia:

Anomaly Detection – wykrywanie rzadkich, nietypowych przykładów w obrębie tego samego rozkładu
OOD Detection – wykrywanie przykładów pochodzących z zupełnie innego rozkładu

Wyzwania (stan na 2026)

Near-OOD vs Far-OOD (trudne vs łatwe przypadki)
Spadek wydajności przy silnym domain shift
Brak uniwersalnej metody działającej dobrze we wszystkich domenach
Ataki adversarialne na detektory OOD
Skalowalność do bardzo dużych modeli (LLM, Vision Transformers)

Powiązane pojęcia

Deep Out Of Distribution Detection→Distribution Shift→Energy Anomaly Detection→Anomaly Detection→Industrial Anomaly Detection→K Nn Anomaly Detection AI→Configuration Anomaly Detection→Container Anomaly Detection→Conveyor Anomaly Detection→Cyber Anomaly Detection→