Статьи
Пишу про поиск, evals, наблюдаемость и интеграции. Та часть работы, где система либо взрослеет, либо начинает сыпаться.
Практический разбор: опорные наборы, оценщики, проверки трасс, продовые метрики и релизные гейты для LLM-систем.