Wprowadzenie
U-Net to architektura sieci neuronowej typu encoder-decoder, wprowadzona w 2015 roku przez Olaf Ronnebergera i współpracowników. Została stworzona specjalnie do precyzyjnej segmentacji semantycznej obrazów medycznych, ale szybko stała się standardem w wielu dziedzinach computer vision.
Architektura klasycznego U-Net
Nazwa pochodzi od charakterystycznego kształtu litery „U”:
- Encoder (ścieżka kurczenia) – ekstrakcja cech, zmniejszanie rozdzielczości
- Decoder (ścieżka rozszerzania) – rekonstrukcja segmentacji z wysoką rozdzielczością
- Skip Connections – przekazywanie informacji z encoder do decoder na tym samym poziomie (klucz do precyzji)
Warianty U-Net
1. U-Net++ (Nested U-Net)
Ulepszona wersja z zagnieżdżonymi skip connections. Zamiast pojedynczych połączeń między encoderem a decoderem, U-Net++ wprowadza gęste bloki konwolucyjne pomiędzy poziomami.
Dzięki temu model lepiej agreguje cechy wieloskalowe, co poprawia dokładność, szczególnie na granicach obiektów i w trudnych przypadkach medycznych.
2. Attention U-Net
Wersja wyposażona w mechanizmy Attention Gates. Zamiast przekazywać wszystkie cechy ze skip connections, model uczy się skupiać tylko na najważniejszych obszarach.
Attention Gates redukują szum z nieistotnych regionów obrazu i poprawiają jakość segmentacji struktur o nieregularnych kształtach.
Porównanie wariantów
- U-Net – prosty, szybki, dobry baseline
- U-Net++ – lepsza dokładność, więcej parametrów, wolniejszy trening
- Attention U-Net – lepsza koncentracja na istotnych obszarach, dobra interpretowalność
Zastosowania
- Segmentacja obrazów medycznych (MRI, CT, USG)
- Segmentacja satelitarna i zdalne wykrywanie
- Autonomiczne pojazdy (segmentacja dróg, przeszkód)
- Segmentacja instancji w przemyśle
- Biologia (segmentacja komórek)
Powiązane pojęcia
Semantic Segmentation • Encoder-Decoder Architecture • Skip Connections • Attention Gates • Deep Supervision • nnU-Net • TransUNet • Swin-Unet • Medical Image Segmentation