Query Optimization | Encyklopedia AI

Wprowadzenie

Query Optimization (Optymalizacja zapytań) w kontekście dużych modeli językowych (LLM) to zbiór technik i strategii mających na celu poprawę jakości, spójności, efektywności oraz redukcję halucynacji poprzez lepsze formułowanie promptów i zapytań do modelu.

Główne podejścia do Query Optimization

Prompt Engineering – precyzyjne konstruowanie promptów (role prompting, few-shot, chain prompting)
Chain of Thought (CoT) – wymuszanie krok-po-kroku rozumowania
Tree of Thoughts (ToT) – eksploracja wielu ścieżek rozumowania jednocześnie
ReAct (Reason + Act) – łączenie rozumowania z wykonywaniem akcji
Self-Consistency – generowanie wielu odpowiedzi i wybieranie najbardziej spójnej
Automatic Prompt Optimization – algorytmy automatycznie poprawiające prompty (np. APE, OPRO)

Query Optimization w RAG

W systemach Retrieval-Augmented Generation optymalizacja zapytań obejmuje:

Query rewriting (przekształcanie pytania na bardziej efektywne)
Query expansion (rozszerzanie zapytania o synonimy i kontekst)
Multi-query retrieval
HyDE (Hypothetical Document Embeddings)
Step-back prompting

Zalety stosowania Query Optimization

Znaczna poprawa jakości odpowiedzi (nawet o 20-40%)
Redukcja halucynacji
Lepsze wykorzystanie kontekstu modelu
Obniżenie kosztów (mniej tokenów przy wyższej jakości)
Większa powtarzalność i determinizm odpowiedzi

Powiązane pojęcia

Optimization→Query AI→Inference Optimization→Fast Inference Optimization→Cargo Optimization→Cnc Optimization→Combustion Optimization→Conversion Optimization AI→Convex Optimization→Cooling System Optimization→