Wprowadzenie
Hallucynacja AI (AI Hallucination) to sytuacja, w której model sztucznej inteligencji generuje treści, które brzmią wiarygodnie, ale są całkowicie zmyślone, nieprawdziwe lub sprzeczne z rzeczywistością. Model „wymyśla” fakty, cytaty, linki czy dane, których nigdy nie widział podczas treningu.
Rodzaje hallucynacji AI
- Fact Hallucination – wymyślanie nieistniejących faktów
- Source Hallucination – fałszywe cytowanie źródeł lub linków
- Entity Hallucination – błędne osoby, daty, liczby, nazwy
- Instruction Hallucination – ignorowanie lub przekręcanie poleceń użytkownika
- Self-Contradiction – sprzeczności w jednej odpowiedzi
Główne przyczyny hallucynacji
- Brak wiedzy w zbiorze treningowym (knowledge cutoff)
- Mechanizm autoregresyjnego przewidywania tokenów
- Overconfidence modelu (zbyt pewny ton)
- Słabe dostrojenie (RLHF nie zawsze eliminuje problem)
- Brak dostępu do aktualnych danych (bez RAG)
Hallucynacje w dużych modelach językowych (2026)
Nawet najnowocześniejsze modele (GPT-4o, Claude 3.5, Grok, Gemini) nadal halucynują. Problem jest szczególnie widoczny przy:
- Złożonych obliczeniach i faktach niszowych
- Analizie aktualnych wydarzeń
- Generowaniu kodu i linków
- Medycynie, prawie i naukach ścisłych
Jak minimalizować hallucynacje?
- RAG (Retrieval-Augmented Generation) – podawanie rzeczywistych źródeł
- Chain of Verification (CoVe)
- Self-Consistency + Self-Refinement
- Fact-Checking prompts i tool use
- Human-in-the-Loop + recenzja
- Modele mniejsze, ale lepiej dostrojone do konkretnej domeny
- Techniki jak Guardrails i output validation
Powiązane pojęcia
Prompt Engineering→RAG→Chain of Thought→Self-RefinementAI ReliabilityFactualityGroundingAI Safety→RLHF→Hallucination Mitigation