RAG – Retrieval-Augmented Generation

Name: RAG – Retrieval-Augmented Generation
SKU: SCREAUGE1D
Price: 12500.00 CZK
Availability: InStock

Tento workshop ukazuje, jak postavit RAG jako praktický architektonický vzor pro práci s firemními znalostmi a dokumenty.

PN: SCREAUGE1D

Datum, místo *

18. 8. 2026, Online
22. 9. 2026, Online
19. 10. 2026, Online

12 500 Kč bez DPH

Množ.:

Projdeme si celou pipeline ingestion - retrieval - generation, kde pochopíte , proč je kvalita retrievalu klíčová, a vyzkoušíte si návrh i ladění vyhledávání včetně hybridních přístupů (vector + fulltext), fúze výsledků (RRF) a technik jako query rewriting nebo metadata-aware retrieval.

1 denní | 9:00 - 17:00 hod

Backend / Full-stack vývojáři
Tech lead / Architekti
AI / ML engineers
Vývojáři pracující s firemními dokumenty a LLM

RAG jako architektonický vzor
typy vyhledávání a jejich kombinace
retrieval jako klíčový faktor úspěchu RAG
volba přístupu: RAG × hybrid × agentní přístup

základní práce s LLM API
znalost Pythonu
základ databází / SQL

Úvod do RAG

Proč RAG vznikl

limity LLM (knowledge cutoff, halucinace)
proč „víc promptu“ nefunguje
grounding odpovědí

Kdy RAG použít

firemní dokumenty
znalostní báze
technická, právní, procesní data

Kdy RAG nepoužít

jednoduché CRUD dotazy
strukturovaná data bez textu

Architektura RAG systému

High-level architektura

ingestion pipeline
embeddings
vector store
retrieval
generation

Varianty RAG

basic RAG
conversational RAG
hybrid RAG
agentic RAG (náhled)

Typické problémy

špatný retrieval
nekvalitní data
přetížený kontext

Data ingestion, chunking & metadata

Typy vstupních dat

PDF, DOCX, HTML
SharePoint / Confluence
e-maily, tabulky

Chunking strategie

fixed-size
semantic chunking
adaptive chunking
overlap vs kontext

Metadata (kritické)

jazyk
zdroj
typ dokumentu
datum / verze
oprávnění

Embeddings & Vector Databases

Embeddings

co embedding reprezentuje
dimenze, normalizace
vícejazyčnost
limity embeddingů

Vectorová databáze

PostgreSQL + pgvector
specializované vector DB
škálování (miliony chunků)

Indexy & výkon

cosine / dot / L2
HNSW vs IVF
latency × přesnost

Typy vyhledávání v RAG

Vector similarity search (baseline)

sémantická podobnost
top-k, threshold
slabiny (čísla, názvy, přesné termíny)

Fulltext / BM25

lexikální relevance
silné pro názvy, ID, verze
slabé na parafráze

Hybridní vyhledávání (Vector + FTS)

paralelní vyhledávání
dvoufázové strategie
vážené kombinace

RRF / RRT (Reciprocal Rank Fusion)

fúze pořadí místo skóre
robustní vůči špatnému scoringu
ideální pro: vector + FTS, multi-query, agentní retrieval

Query rewriting (LLM-assisted)

přeformulování dotazu
domain-specific dotazy
guardrails, náklady

Multi-query retrieval

jeden dotaz → více dotazů
fúze výsledků (RRF)
lepší pokrytí vágních dotazů

Metadata-aware retrieval

filtrace před / po vyhledávání
jazyk, zdroj, datum
zásadní pro enterprise RAG

Hierarchické vyhledávání

dokument → kapitola → chunk
vhodné pro dlouhé dokumenty
snížení šumu

Agent-assisted retrieval (úvod)

agent jako orchestrátor
iterativní vyhledávání
adaptivní strategie

Generation & prompt design

Kontextové prompty

systémový prompt
pravidla citací
práce se zdroji

Grounding odpovědí

„odpovídej jen z kontextu“
fallback strategie
kontrola halucinací

Typické chyby

příliš mnoho kontextu
špatné pořadí chunků
ignorování relevance

Pokročilé RAG scénáře

Conversational RAG

práce s historií
re-query podle kontextu

Agentic RAG

agent jako planner
iterativní retrieval
validace odpovědí

GraphRAG (úvod)

entity & vztahy
kdy dává smysl
kdy je overkill

Kdy RAG (ne)používat

Anti-patterny

RAG místo SQL
RAG bez metrik
RAG bez kvalitních dat

Decision framework

LLM only × RAG × Hybrid × Agent
náklady
latence
údržba

Školení je pořádáno ve spolupráci s naším partnerem
Pokyny ke školení obvykle zasíláme 7 kalendářních dní před zahájením
V objednávce uvádějte vždy jméno a příjmení účastníka, email a mobil (v případě řešení organizačních náležitostí)
Na základě objednávky zasíláme zálohovou fakturu (pokud s objednavatelem nejsou sjednány jiné platební podmínky)
Notebook s připojením k internetu
Python prostředí (lokálně nebo v cloud IDE)
Přístup k LLM API (klíč / účet)

Možnosti ubytování a parkování

RAG – Retrieval-Augmented Generation

Dosažená ocenění