Explainable AI (XAI) – co to jest, metody i znaczenie | Encyklopedia AI

Wprowadzenie

Explainable AI (XAI) to dziedzina AI zajmująca się tworzeniem modeli, których decyzje i procesy myślowe można zrozumieć i wyjaśnić człowiekowi. Adresuje problem „black box” – sytuacji, w której model daje wynik, ale nie wiemy dlaczego.

Dlaczego Explainable AI jest ważne?

Budowanie zaufania do systemów AI
Zgodność z regulacjami (EU AI Act, GDPR)
Debugowanie i poprawa modeli
Wykrywanie biasów i dyskryminacji
Odpowiedzialność prawna za decyzje AI
Bezpieczeństwo krytycznych systemów (medycyna, finanse, autonomia)

Poziomy wyjaśnialności

Global Explainability – zrozumienie całego modelu
Local Explainability – wyjaśnienie pojedynczej decyzji
Intrinsic Interpretability – modele przezroczyste z natury (drzewa decyzyjne, regresja liniowa)
Post-hoc Explainability – wyjaśnienia dodawane do czarnych skrzynek

Najpopularniejsze metody XAI

LIME – Local Interpretable Model-agnostic Explanations
SHAP – SHapley Additive exPlanations (najczęściej używane)
Attention Visualization – mapy uwagi w transformerach
Integrated Gradients
Counterfactual Explanations – „co by było gdyby…”
Mechanistic Interpretability – badanie neuronów i circuitów (np. Anthropic)

Explainable AI w dużych modelach językowych

W LLM stosuje się:

Chain-of-Thought + wyjaśnienia krok po kroku
Feature Attribution dla tokenów
Probing classifiers
Activation Patching

Powiązane pojęcia

Explainable Diagnosis→Explainable Forecasting→Explainable Hiring AI→Explainable Recommendation→Explainable Underwriting→Explainable Credit Scoring→Explainable Energy Dispatch→Mechanistic Interpretability→