Статьи
Пишу про поиск, evals, наблюдаемость и интеграции. Та часть работы, где система либо взрослеет, либо начинает сыпаться.
Практическая архитектура юридического QA, частично выросшая из работы вокруг Agentic RAG Legal Challenge: идентичность документа, гибридный поиск, строгие форматы ответа, привязка к страницам, телеметрия и проверки.
Rewrite, decomposition, step-back prompting, HyDE, fusion — и когда каждый из этих приёмов действительно оправдывает задержку.
Как снижать галлюцинации в LLM-системах: поиск по источникам, отказ от ответа, проверка утверждений, evals и честные ограничения.
Нарезка, заголовки, метаданные, parent-child структура, reranking и контроль качества корпуса для RAG.