Wprowadzenie
K-Anonymity (K-Anonimowość) to jedna z fundamentalnych technik ochrony prywatności danych. Zapewnia, że każdy rekord w opublikowanym zbiorze danych jest nie do odróżnienia od co najmniej K-1 innych rekordów na podstawie quasi-identyfikatorów.
Jak działa K-Anonymity?
Technika polega na generalizacji (np. zamiana dokładnego wieku na przedział wiekowy) i supresji (usuwanie danych). Dzięki temu każdy rekord należy do grupy co najmniej K podobnych rekordów.
Zastosowania
- Anonimizacja danych medycznych
- Udostępnianie danych publicznych
- Big Data i analizy statystyczne
- Trening modeli AI na wrażliwych danych
- Zgodność z RODO/GDPR
Zalety i wady
- Zalety: prosta koncepcja, szeroko akceptowana
- Wady: podatna na ataki Homogeneity i Background Knowledge, może obniżać użyteczność danych
Powiązane pojęcia
Differential Privacy • L-Diversity • T-Closeness • Data Anonymization • GDPR • Quasi-Identifiers