Testování a evaluace LLM aplikací v Pythonu: Praktický průvodce DeepEval
Naučte se systematicky testovat výstupy LLM aplikací v Pythonu pomocí frameworku DeepEval. Od metrik jako GEval a Answer Relevancy přes evaluaci RAG pipeline až po integraci do CI/CD — vše s funkčními příklady kódu.