Статьи
Пишу про поиск, evals, наблюдаемость и интеграции. Та часть работы, где система либо взрослеет, либо начинает сыпаться.
Практическая архитектура юридического QA, частично выросшая из работы вокруг Agentic RAG Legal Challenge: идентичность документа, гибридный поиск, строгие форматы ответа, привязка к страницам, телеметрия и проверки.
Как снижать галлюцинации в LLM-системах: поиск по источникам, отказ от ответа, проверка утверждений, evals и честные ограничения.
Практический разбор: опорные наборы, оценщики, проверки трасс, продовые метрики и релизные гейты для LLM-систем.