Feature Importance

Wprowadzenie

Feature Importance to zbiór technik wyjaśniających, które cechy (zmienne wejściowe) mają największy wpływ na decyzje modelu uczenia maszynowego. Jest to kluczowy element Explainable AI (XAI) – pozwala zrozumieć, dlaczego model podejmuje konkretne decyzje.

Dlaczego Feature Importance jest ważna?

Dzięki analizie ważności cech możemy:

  • Poprawić jakość modelu (feature selection)
  • Zwiększyć zaufanie do modelu
  • Wykryć bias i problemy w danych
  • Zmniejszyć koszty obliczeniowe poprzez usunięcie nieistotnych cech
  • Uzyskać wiedzę biznesową z modelu

Główne metody obliczania Feature Importance

  • Gini Importance / Mean Decrease in Impurity (MDI) – wbudowana w drzewa decyzyjne i Random Forest (najprostsza)
  • Permutation Importance – najpopularniejsza metoda model-agnostyczna. Mierzy spadek jakości modelu po losowym przemieszaniu danej cechy.
  • SHAP Values (SHapley Additive exPlanations) – najbardziej zaawansowana i teoretycznie uzasadniona metoda. Pokazuje wkład każdej cechy w konkretną predykcję.
  • LIME (Local Interpretable Model-agnostic Explanations) – wyjaśnia pojedyncze predykcje poprzez aproksymację lokalnym modelem liniowym.
  • Coefficient Magnitude – dla modeli liniowych (regresja logistyczna, liniowa)
  • Drop Column Importance – retrening modelu bez danej cechy

Porównanie metod

  • Gini Importance – szybka, ale może być stronnicza wobec cech o wielu wartościach
  • Permutation Importance – uniwersalna, ale wolniejsza
  • SHAP – najdokładniejsza, ale obliczeniowo najdroższa (szczególnie Kernel SHAP)

Zastosowania w praktyce (2026)

  • Bankowość i scoring kredytowy
  • Medycyna (diagnostyka wspomagana AI)
  • Marketing i rekomendacje
  • Przemyśl (predykcyjne utrzymanie maszyn)
  • Nauka i badania

Najlepsze praktyki

  • Używaj SHAP do wyjaśniania indywidualnych predykcji
  • Permutation Importance do ogólnego rankingu cech
  • Zawsze sprawdzaj stabilność wyników (multiple runs)
  • Łącz Feature Importance z Partial Dependence Plots (PDP) i ICE plots
  • W przypadku danych kategorycznych uważaj na bias metod

Powiązane pojęcia

Explainable AI (XAI) • SHAP • LIME • Permutation Importance • Model Interpretability • Partial Dependence Plot • Global vs Local Explanations • Feature Selection