Query Optimization

Wprowadzenie

Query Optimization (Optymalizacja zapytań) w kontekście dużych modeli językowych (LLM) to zbiór technik i strategii mających na celu poprawę jakości, spójności, efektywności oraz redukcję halucynacji poprzez lepsze formułowanie promptów i zapytań do modelu.

Główne podejścia do Query Optimization

  • Prompt Engineering – precyzyjne konstruowanie promptów (role prompting, few-shot, chain prompting)
  • Chain of Thought (CoT) – wymuszanie krok-po-kroku rozumowania
  • Tree of Thoughts (ToT) – eksploracja wielu ścieżek rozumowania jednocześnie
  • ReAct (Reason + Act) – łączenie rozumowania z wykonywaniem akcji
  • Self-Consistency – generowanie wielu odpowiedzi i wybieranie najbardziej spójnej
  • Automatic Prompt Optimization – algorytmy automatycznie poprawiające prompty (np. APE, OPRO)

Query Optimization w RAG

W systemach Retrieval-Augmented Generation optymalizacja zapytań obejmuje:

  • Query rewriting (przekształcanie pytania na bardziej efektywne)
  • Query expansion (rozszerzanie zapytania o synonimy i kontekst)
  • Multi-query retrieval
  • HyDE (Hypothetical Document Embeddings)
  • Step-back prompting

Zalety stosowania Query Optimization

  • Znaczna poprawa jakości odpowiedzi (nawet o 20-40%)
  • Redukcja halucynacji
  • Lepsze wykorzystanie kontekstu modelu
  • Obniżenie kosztów (mniej tokenów przy wyższej jakości)
  • Większa powtarzalność i determinizm odpowiedzi

Powiązane pojęcia

Prompt Engineering • Chain of Thought • Tree of Thoughts • ReAct • RAG • Self-Consistency • Automatic Prompt Engineer (APE) • Step-Back Prompting