Wprowadzenie
Explainable AI (XAI) to dziedzina AI zajmująca się tworzeniem modeli, których decyzje i procesy myślowe można zrozumieć i wyjaśnić człowiekowi. Adresuje problem „black box” – sytuacji, w której model daje wynik, ale nie wiemy dlaczego.
Dlaczego Explainable AI jest ważne?
- Budowanie zaufania do systemów AI
- Zgodność z regulacjami (EU AI Act, GDPR)
- Debugowanie i poprawa modeli
- Wykrywanie biasów i dyskryminacji
- Odpowiedzialność prawna za decyzje AI
- Bezpieczeństwo krytycznych systemów (medycyna, finanse, autonomia)
Poziomy wyjaśnialności
- Global Explainability – zrozumienie całego modelu
- Local Explainability – wyjaśnienie pojedynczej decyzji
- Intrinsic Interpretability – modele przezroczyste z natury (drzewa decyzyjne, regresja liniowa)
- Post-hoc Explainability – wyjaśnienia dodawane do czarnych skrzynek
Najpopularniejsze metody XAI
- LIME – Local Interpretable Model-agnostic Explanations
- SHAP – SHapley Additive exPlanations (najczęściej używane)
- Attention Visualization – mapy uwagi w transformerach
- Integrated Gradients
- Counterfactual Explanations – „co by było gdyby…”
- Mechanistic Interpretability – badanie neuronów i circuitów (np. Anthropic)
Explainable AI w dużych modelach językowych
W LLM stosuje się:
- Chain-of-Thought + wyjaśnienia krok po kroku
- Feature Attribution dla tokenów
- Probing classifiers
- Activation Patching
Powiązane pojęcia
Interpretability • SHAP • LIME • AI Governance • EU AI Act • Transparency • Black Box • Mechanistic Interpretability • Responsible AI • Trustworthy AI