Wprowadzenie
Llama 4 to seria modeli językowych wydana przez Meta w kwietniu 2025 roku. Jest to pierwsza otwarta seria modeli Meta, która jest natywnie multimodalna (tekst + obraz) i wykorzystuje architekturę Mixture of Experts (MoE).
Modele w rodzinie Llama 4
- Llama 4 Scout – 109B parametrów całkowitych (17B aktywnych), 16 ekspertów, kontekst do 10 milionów tokenów
- Llama 4 Maverick – 400B parametrów całkowitych (17B aktywnych), 128 ekspertów, kontekst 1M (rozszerzalny)
- Llama 4 Behemoth – 2T parametrów (288B aktywnych) – najpotężniejszy model w rodzinie (używany jako teacher)
Główne innowacje
- Natywna multimodalność – wczesna fuzja (early fusion) tekstu i obrazu podczas pre-treningu
- Mixture of Experts – tylko część parametrów aktywna podczas inferencji (wysoka efektywność)
- Rekordowy kontekst – Scout obsługuje aż 10 milionów tokenów (idealny do analizy bardzo długich dokumentów)
- Wysoka efektywność – Scout działa na pojedynczej karcie H100
Wydajność
Llama 4 Maverick bije lub dorównuje modelom takim jak GPT-4o i Gemini 2.0 Flash w wielu benchmarkach, oferując znacznie lepszy stosunek jakości do kosztów. Modele osiągają świetne wyniki w rozumowaniu, kodowaniu i analizie multimodalnej.
Zalety Llama 4
- Całkowicie otwarty (open-weight) – można pobierać i uruchamiać lokalnie
- Bardzo niski koszt inferencji dzięki MoE
- Rekordowy kontekst wśród otwartych modeli
- Native multimodality (tekst + obraz)
- Łatwość fine-tuningu (LoRA, QLoRA)
Zastosowania
- Analiza bardzo długich dokumentów (10M tokenów)
- Multimodalne aplikacje (analiza zdjęć, wykresów, memów)
- Chatboty i asystenci AI
- Generowanie kodu i rozumowanie
- Przedsiębiorstwa budujące własne rozwiązania AI
Aktualny status (2026)
Llama 4 uznawana jest za jeden z najmocniejszych otwartych modeli multimodalnych na rynku. Dzięki architekturze MoE oferuje znakomity balans między jakością a kosztem działania. Modele te znacząco przyspieszyły rozwój ekosystemu open-source i stały się bazą dla setek specjalistycznych fine-tunów na całym świecie.
Llama 4 to kolejny krok Meta w kierunku otwartej, dostępnej dla wszystkich sztucznej inteligencji.