Feature Importance – Jak Określić, Które Cechy Najbardziej Wpływają na Model?

Wprowadzenie

Feature Importance to zbiór technik wyjaśniających, które cechy (zmienne wejściowe) mają największy wpływ na decyzje modelu uczenia maszynowego. Jest to kluczowy element Explainable AI (XAI) – pozwala zrozumieć, dlaczego model podejmuje konkretne decyzje.

Dlaczego Feature Importance jest ważna?

Dzięki analizie ważności cech możemy:

Poprawić jakość modelu (feature selection)
Zwiększyć zaufanie do modelu
Wykryć bias i problemy w danych
Zmniejszyć koszty obliczeniowe poprzez usunięcie nieistotnych cech
Uzyskać wiedzę biznesową z modelu

Główne metody obliczania Feature Importance

Gini Importance / Mean Decrease in Impurity (MDI) – wbudowana w drzewa decyzyjne i Random Forest (najprostsza)
Permutation Importance – najpopularniejsza metoda model-agnostyczna. Mierzy spadek jakości modelu po losowym przemieszaniu danej cechy.
SHAP Values (SHapley Additive exPlanations) – najbardziej zaawansowana i teoretycznie uzasadniona metoda. Pokazuje wkład każdej cechy w konkretną predykcję.
LIME (Local Interpretable Model-agnostic Explanations) – wyjaśnia pojedyncze predykcje poprzez aproksymację lokalnym modelem liniowym.
Coefficient Magnitude – dla modeli liniowych (regresja logistyczna, liniowa)
Drop Column Importance – retrening modelu bez danej cechy

Porównanie metod

Gini Importance – szybka, ale może być stronnicza wobec cech o wielu wartościach
Permutation Importance – uniwersalna, ale wolniejsza
SHAP – najdokładniejsza, ale obliczeniowo najdroższa (szczególnie Kernel SHAP)

Zastosowania w praktyce (2026)

Bankowość i scoring kredytowy
Medycyna (diagnostyka wspomagana AI)
Marketing i rekomendacje
Przemyśl (predykcyjne utrzymanie maszyn)
Nauka i badania

Najlepsze praktyki

Używaj SHAP do wyjaśniania indywidualnych predykcji
Permutation Importance do ogólnego rankingu cech
Zawsze sprawdzaj stabilność wyników (multiple runs)
Łącz Feature Importance z Partial Dependence Plots (PDP) i ICE plots
W przypadku danych kategorycznych uważaj na bias metod

Powiązane pojęcia

Feature Importance Alternatives→Feature Learning→Feature Selection→Feature Selection Quant→Feature Attribution Methods→Feature Engineering→Feature Extraction→Deep Feature Learning→Data Importance Sampling→Data Importance Weighting→