U-Net

Wprowadzenie

U-Net to architektura sieci neuronowej typu encoder-decoder, wprowadzona w 2015 roku przez Olaf Ronnebergera i współpracowników. Została stworzona specjalnie do precyzyjnej segmentacji semantycznej obrazów medycznych, ale szybko stała się standardem w wielu dziedzinach computer vision.

Architektura klasycznego U-Net

Nazwa pochodzi od charakterystycznego kształtu litery „U”:

  • Encoder (ścieżka kurczenia) – ekstrakcja cech, zmniejszanie rozdzielczości
  • Decoder (ścieżka rozszerzania) – rekonstrukcja segmentacji z wysoką rozdzielczością
  • Skip Connections – przekazywanie informacji z encoder do decoder na tym samym poziomie (klucz do precyzji)

Warianty U-Net

1. U-Net++ (Nested U-Net)

Ulepszona wersja z zagnieżdżonymi skip connections. Zamiast pojedynczych połączeń między encoderem a decoderem, U-Net++ wprowadza gęste bloki konwolucyjne pomiędzy poziomami.

Dzięki temu model lepiej agreguje cechy wieloskalowe, co poprawia dokładność, szczególnie na granicach obiektów i w trudnych przypadkach medycznych.

2. Attention U-Net

Wersja wyposażona w mechanizmy Attention Gates. Zamiast przekazywać wszystkie cechy ze skip connections, model uczy się skupiać tylko na najważniejszych obszarach.

Attention Gates redukują szum z nieistotnych regionów obrazu i poprawiają jakość segmentacji struktur o nieregularnych kształtach.

Porównanie wariantów

  • U-Net – prosty, szybki, dobry baseline
  • U-Net++ – lepsza dokładność, więcej parametrów, wolniejszy trening
  • Attention U-Net – lepsza koncentracja na istotnych obszarach, dobra interpretowalność

Zastosowania

  • Segmentacja obrazów medycznych (MRI, CT, USG)
  • Segmentacja satelitarna i zdalne wykrywanie
  • Autonomiczne pojazdy (segmentacja dróg, przeszkód)
  • Segmentacja instancji w przemyśle
  • Biologia (segmentacja komórek)

Powiązane pojęcia

Semantic Segmentation • Encoder-Decoder Architecture • Skip Connections • Attention Gates • Deep Supervision • nnU-Net • TransUNet • Swin-Unet • Medical Image Segmentation