Out-of-Distribution Detection (OOD)

Wprowadzenie

Out-of-Distribution Detection (OOD Detection) to zadanie polegające na identyfikacji próbek danych, które pochodzą z rozkładu różniącego się od tego, na którym model został wytrenowany. Jest to jedna z kluczowych technologii dla bezpiecznego i wiarygodnego działania systemów AI w rzeczywistym świecie.

Dlaczego OOD Detection jest ważne?

  • Modele AI bardzo słabo generalizują poza dane treningowe (brak „zdrowego rozsądku”)
  • W praktyce napotykamy nieznane klasy, warunki środowiskowe lub ataki
  • Krytyczne w zastosowaniach bezpieczeństwa: medycyna, autonomiczne pojazdy, finanse, systemy decyzyjne
  • Pozwala modelowi „wiedzieć, czego nie wie”

Główne podejścia do OOD Detection

  • Maximum Softmax Probability (MSP) – najprostsza metoda bazująca na pewności modelu
  • Energy-based Methods – wykorzystanie energii modelu
  • Mahalanobis Distance – metoda statystyczna w przestrzeni cech
  • Gradient-based Methods (GradNorm, ODIN)
  • Generative Approaches – modele autoregresywne i density estimation
  • Self-Supervised Methods (np. RotNet, SimCLR + OOD head)
  • Bayesian Neural Networks i metody oparte na niepewności (Uncertainty Estimation)

OOD vs Anomaly Detection

Często mylone pojęcia:

  • Anomaly Detection – wykrywanie rzadkich, nietypowych przykładów w obrębie tego samego rozkładu
  • OOD Detection – wykrywanie przykładów pochodzących z zupełnie innego rozkładu

Wyzwania (stan na 2026)

  • Near-OOD vs Far-OOD (trudne vs łatwe przypadki)
  • Spadek wydajności przy silnym domain shift
  • Brak uniwersalnej metody działającej dobrze we wszystkich domenach
  • Ataki adversarialne na detektory OOD
  • Skalowalność do bardzo dużych modeli (LLM, Vision Transformers)

Powiązane pojęcia

Uncertainty Estimation • Open Set Recognition • Distribution Shift • Anomaly Detection • Mahalanobis Distance • Energy-based Models • AI Safety • Robustness • Calibration