U-Net | U-Net++ | Attention U-Net | Encyklopedia AI

Wprowadzenie

U-Net to architektura sieci neuronowej typu encoder-decoder, wprowadzona w 2015 roku przez Olaf Ronnebergera i współpracowników. Została stworzona specjalnie do precyzyjnej segmentacji semantycznej obrazów medycznych, ale szybko stała się standardem w wielu dziedzinach computer vision.

Architektura klasycznego U-Net

Nazwa pochodzi od charakterystycznego kształtu litery „U”:

Encoder (ścieżka kurczenia) – ekstrakcja cech, zmniejszanie rozdzielczości
Decoder (ścieżka rozszerzania) – rekonstrukcja segmentacji z wysoką rozdzielczością
Skip Connections – przekazywanie informacji z encoder do decoder na tym samym poziomie (klucz do precyzji)

Warianty U-Net

1. U-Net++ (Nested U-Net)

Ulepszona wersja z zagnieżdżonymi skip connections. Zamiast pojedynczych połączeń między encoderem a decoderem, U-Net++ wprowadza gęste bloki konwolucyjne pomiędzy poziomami.

Dzięki temu model lepiej agreguje cechy wieloskalowe, co poprawia dokładność, szczególnie na granicach obiektów i w trudnych przypadkach medycznych.

2. Attention U-Net

Wersja wyposażona w mechanizmy Attention Gates. Zamiast przekazywać wszystkie cechy ze skip connections, model uczy się skupiać tylko na najważniejszych obszarach.

Attention Gates redukują szum z nieistotnych regionów obrazu i poprawiają jakość segmentacji struktur o nieregularnych kształtach.

Porównanie wariantów

U-Net – prosty, szybki, dobry baseline
U-Net++ – lepsza dokładność, więcej parametrów, wolniejszy trening
Attention U-Net – lepsza koncentracja na istotnych obszarach, dobra interpretowalność

Zastosowania

Segmentacja obrazów medycznych (MRI, CT, USG)
Segmentacja satelitarna i zdalne wykrywanie
Autonomiczne pojazdy (segmentacja dróg, przeszkód)
Segmentacja instancji w przemyśle
Biologia (segmentacja komórek)

Powiązane pojęcia

Denoising U Net→Elastic Net→Computer Vision→Ct Image Segmentation→Decoder Attention→Farm Computer Vision→Fashion Computer Vision→Federated Computer Vision→Image Segmentation→Industrial Computer Vision→