Explainable AI

Wprowadzenie

Explainable AI (XAI) to dziedzina AI zajmująca się tworzeniem modeli, których decyzje i procesy myślowe można zrozumieć i wyjaśnić człowiekowi. Adresuje problem „black box” – sytuacji, w której model daje wynik, ale nie wiemy dlaczego.

Dlaczego Explainable AI jest ważne?

  • Budowanie zaufania do systemów AI
  • Zgodność z regulacjami (EU AI Act, GDPR)
  • Debugowanie i poprawa modeli
  • Wykrywanie biasów i dyskryminacji
  • Odpowiedzialność prawna za decyzje AI
  • Bezpieczeństwo krytycznych systemów (medycyna, finanse, autonomia)

Poziomy wyjaśnialności

  • Global Explainability – zrozumienie całego modelu
  • Local Explainability – wyjaśnienie pojedynczej decyzji
  • Intrinsic Interpretability – modele przezroczyste z natury (drzewa decyzyjne, regresja liniowa)
  • Post-hoc Explainability – wyjaśnienia dodawane do czarnych skrzynek

Najpopularniejsze metody XAI

  • LIME – Local Interpretable Model-agnostic Explanations
  • SHAP – SHapley Additive exPlanations (najczęściej używane)
  • Attention Visualization – mapy uwagi w transformerach
  • Integrated Gradients
  • Counterfactual Explanations – „co by było gdyby…”
  • Mechanistic Interpretability – badanie neuronów i circuitów (np. Anthropic)

Explainable AI w dużych modelach językowych

W LLM stosuje się:

  • Chain-of-Thought + wyjaśnienia krok po kroku
  • Feature Attribution dla tokenów
  • Probing classifiers
  • Activation Patching

Powiązane pojęcia

Interpretability • SHAP • LIME • AI Governance • EU AI Act • Transparency • Black Box • Mechanistic Interpretability • Responsible AI • Trustworthy AI

Dodano: 21.05.2026