YOLO | Encyklopedia AI

Wprowadzenie

YOLO (ang. You Only Look Once) to rodzina modeli detekcji obiektów, która zrewolucjonizowała computer vision. Zamiast klasycznego podejścia „proponuj regiony → klasyfikuj”, YOLO traktuje detekcję jako pojedyncze zadanie regresji.

Jak działa YOLO?

Model dzieli obraz na siatkę (grid) i dla każdego pola przewiduje jednocześnie kilka rzeczy:

ramki ograniczające (bounding boxes)
prawdopodobieństwo obecności obiektów
klasy obiektów

Historia wersji YOLO

YOLOv1 (2015) – Joseph Redmon – pierwszy model
YOLOv2 / YOLOv3 – poprawa dokładności i prędkości
YOLOv4 / YOLOv5 (2020) – ogromny wzrost popularności
YOLOv8 (2023) – Ultralytics – obecnie najpopularniejsza wersja
YOLOv10 (2024) – najnowsza generacja, jeszcze wyższa efektywność

Zalety YOLO

Bardzo wysoka prędkość inferencji (nawet 100+ FPS)
End-to-end – jeden przebieg sieci
Dobra równowaga między prędkością a dokładnością
Łatwość trenowania i deploymentu
Aktywny rozwój open-source (Ultralytics)

Zastosowania

Autonomiczne pojazdy i systemy ADAS
Monitoring wizyjny i bezpieczeństwo
Robotyka i drony
Analiza sportowa
Medycyna (detekcja guzów, anomalii)
Przemysł 4.0 (kontrola jakości)

Aktualny status (2026)

YOLO pozostaje liderem w dziedzinie real-time object detection. Dzięki projektowi Ultralytics oraz ciągłemu rozwojowi wersji v8 i v10, YOLO jest najczęściej wybieranym modelem do zastosowań komercyjnych i badawczych wymagających wysokiej prędkości.