Zephyr | Zephyr-7B – Model Językowy od Hugging Face | Encyklopedia AI

Wprowadzenie

Zephyr to rodzina lekkich, ale bardzo wydajnych modeli językowych stworzonych przez Hugging Face. Najpopularniejszy model — Zephyr-7B — został zbudowany na bazie Mistral-7B i dostrojony za pomocą techniki Direct Preference Optimization (DPO).

Historia modelu

Zephyr został wydany pod koniec 2023 roku i szybko zyskał uznanie jako jeden z najlepszych otwartych modeli 7B. Dzięki DPO model jest znacznie bardziej „posłuszny”, pomocny i mniej skłonny do halucynacji niż bazowy Mistral.

Główne cechy

Rozmiar: 7 miliardów parametrów
Architektura oparta na Mistral-7B
Trening z DPO (Direct Preference Optimization)
Wyjątkowo dobre zdolności do podążania za instrukcjami
Dostępny w wersjach: Zephyr-7B-α i Zephyr-7B-β

Zastosowania Zephyr

Lokalne asystenty AI i chatboty
Prototypowanie aplikacji AI
Edukacja i badania nad LLM
Uruchamianie na słabszym sprzęcie (laptopy, single GPU)
Fine-tuning pod własne potrzeby

Zalety i wady

Zalety: świetna jakość jak na rozmiar 7B, otwarty kod, bardzo dobry w rozmowach, niski koszt inferencji
Wady: mniejsza wiedza ogólna niż większe modele (70B+), ograniczenie kontekstu (8k tokenów)

Powiązane pojęcia

Direct Preference Optimization→Preference Optimization→