Wprowadzenie
Query Optimization (Optymalizacja zapytań) w kontekście dużych modeli językowych (LLM) to zbiór technik i strategii mających na celu poprawę jakości, spójności, efektywności oraz redukcję halucynacji poprzez lepsze formułowanie promptów i zapytań do modelu.
Główne podejścia do Query Optimization
- Prompt Engineering – precyzyjne konstruowanie promptów (role prompting, few-shot, chain prompting)
- Chain of Thought (CoT) – wymuszanie krok-po-kroku rozumowania
- Tree of Thoughts (ToT) – eksploracja wielu ścieżek rozumowania jednocześnie
- ReAct (Reason + Act) – łączenie rozumowania z wykonywaniem akcji
- Self-Consistency – generowanie wielu odpowiedzi i wybieranie najbardziej spójnej
- Automatic Prompt Optimization – algorytmy automatycznie poprawiające prompty (np. APE, OPRO)
Query Optimization w RAG
W systemach Retrieval-Augmented Generation optymalizacja zapytań obejmuje:
- Query rewriting (przekształcanie pytania na bardziej efektywne)
- Query expansion (rozszerzanie zapytania o synonimy i kontekst)
- Multi-query retrieval
- HyDE (Hypothetical Document Embeddings)
- Step-back prompting
Zalety stosowania Query Optimization
- Znaczna poprawa jakości odpowiedzi (nawet o 20-40%)
- Redukcja halucynacji
- Lepsze wykorzystanie kontekstu modelu
- Obniżenie kosztów (mniej tokenów przy wyższej jakości)
- Większa powtarzalność i determinizm odpowiedzi
Powiązane pojęcia
Prompt Engineering • Chain of Thought • Tree of Thoughts • ReAct • RAG • Self-Consistency • Automatic Prompt Engineer (APE) • Step-Back Prompting