K-Anonymity Privacy

Wprowadzenie

K-Anonymity (K-Anonimowość) to jedna z fundamentalnych technik ochrony prywatności danych. Zapewnia, że każdy rekord w opublikowanym zbiorze danych jest nie do odróżnienia od co najmniej K-1 innych rekordów na podstawie quasi-identyfikatorów.

Jak działa K-Anonymity?

Technika polega na generalizacji (np. zamiana dokładnego wieku na przedział wiekowy) i supresji (usuwanie danych). Dzięki temu każdy rekord należy do grupy co najmniej K podobnych rekordów.

Zastosowania

  • Anonimizacja danych medycznych
  • Udostępnianie danych publicznych
  • Big Data i analizy statystyczne
  • Trening modeli AI na wrażliwych danych
  • Zgodność z RODO/GDPR

Zalety i wady

  • Zalety: prosta koncepcja, szeroko akceptowana
  • Wady: podatna na ataki Homogeneity i Background Knowledge, może obniżać użyteczność danych

Powiązane pojęcia

Differential Privacy • L-Diversity • T-Closeness • Data Anonymization • GDPR • Quasi-Identifiers