Collaborative Filtering

Wprowadzenie

Collaborative Filtering (Filtracja Współpracująca) to jedna z najskuteczniejszych i najczęściej stosowanych technik w systemach rekomendacyjnych. Polega na przewidywaniu preferencji użytkownika na podstawie zachowań innych podobnych użytkowników lub podobieństwa przedmiotów.

Jak działa Collaborative Filtering?

Algorytm zakłada, że jeśli dwóch użytkowników miało podobne oceny w przeszłości, to prawdopodobnie będą mieli podobne preferencje w przyszłości.

Główne typy Collaborative Filtering

  • User-based Collaborative Filtering – znajduje użytkowników o podobnych gustach i poleca im to, co lubili podobni użytkownicy
  • Item-based Collaborative Filtering – analizuje podobieństwo przedmiotów (np. filmów, produktów) i poleca przedmioty podobne do tych, które użytkownik już polubił
  • Model-based – wykorzystuje techniki takie jak Matrix Factorization (SVD, NMF), ALS

Zalety

  • Nie wymaga wiedzy o treści przedmiotów (content)
  • Automatycznie odkrywa ukryte powiązania
  • Bardzo skuteczny przy dużej liczbie użytkowników i ocen
  • Skalowalny (szczególnie item-based)

Wady i problemy

  • Cold Start Problem – nowe przedmioty i nowi użytkownicy
  • Sparsity (rzadkie oceny)
  • Popular bias (nadreprezentacja popularnych produktów)
  • Skalowalność przy bardzo dużej liczbie użytkowników

Historia i znaczenie

Algorytm zyskał ogromną popularność dzięki konkursowi Netflix Prize (2006–2009), w którym zwycięskie rozwiązania opierały się właśnie na zaawansowanym Collaborative Filtering i Matrix Factorization.

Aktualny stan (2026)

Mimo pojawienia się modeli deep learning (np. Neural Collaborative Filtering, BERT4Rec, Transformers), klasyczne Collaborative Filtering nadal jest szeroko stosowane ze względu na prostotę, interpretowalność i dobrą wydajność. Najlepsze systemy produkcyjne łączą Collaborative Filtering z Content-based i Contextual approaches (hybrydowe systemy rekomendacyjne).

Powiązane pojęcia

Recommendation Systems • Matrix Factorization • User-based vs Item-based • Cold Start Problem • Content-based Filtering • Hybrid Recommendation • Netflix Prize • Alternating Least Squares (ALS)

Dodano: 17 maja 2026