Wprowadzenie
YOLO (ang. You Only Look Once) to rodzina modeli detekcji obiektów, która zrewolucjonizowała computer vision. Zamiast klasycznego podejścia „proponuj regiony → klasyfikuj”, YOLO traktuje detekcję jako pojedyncze zadanie regresji.
Jak działa YOLO?
Model dzieli obraz na siatkę (grid) i dla każdego pola przewiduje jednocześnie kilka rzeczy:
- ramki ograniczające (bounding boxes)
- prawdopodobieństwo obecności obiektów
- klasy obiektów
Historia wersji YOLO
- YOLOv1 (2015) – Joseph Redmon – pierwszy model
- YOLOv2 / YOLOv3 – poprawa dokładności i prędkości
- YOLOv4 / YOLOv5 (2020) – ogromny wzrost popularności
- YOLOv8 (2023) – Ultralytics – obecnie najpopularniejsza wersja
- YOLOv10 (2024) – najnowsza generacja, jeszcze wyższa efektywność
Zalety YOLO
- Bardzo wysoka prędkość inferencji (nawet 100+ FPS)
- End-to-end – jeden przebieg sieci
- Dobra równowaga między prędkością a dokładnością
- Łatwość trenowania i deploymentu
- Aktywny rozwój open-source (Ultralytics)
Zastosowania
- Autonomiczne pojazdy i systemy ADAS
- Monitoring wizyjny i bezpieczeństwo
- Robotyka i drony
- Analiza sportowa
- Medycyna (detekcja guzów, anomalii)
- Przemysł 4.0 (kontrola jakości)
Aktualny status (2026)
YOLO pozostaje liderem w dziedzinie real-time object detection. Dzięki projektowi Ultralytics oraz ciągłemu rozwojowi wersji v8 i v10, YOLO jest najczęściej wybieranym modelem do zastosowań komercyjnych i badawczych wymagających wysokiej prędkości.