Статьи
Пишу про поиск, evals, наблюдаемость, ограничения и интеграции — то есть про ту часть работы, где система либо взрослеет, либо начинает сыпаться.
Короткая заметка из Израиля о том, что постоянные сирены делают с вниманием, профессиональным чутьём и командными привычками — и какие рабочие практики помогают легче переживать такие срывы.
Практическая архитектура для юридического QA, частично выросшая из работы вокруг Agentic RAG Legal Challenge: идентичность документа, гибридный поиск, строгий формат ответа, привязка к страницам, телеметрия и проверки.
Практический разбор: prompt injection, лишняя автономия, опасные ответы, evals и внятные границы для LLM-продукта.
Практическая заметка о спокойной иерархии, доведённых состояниях и том, почему интерфейсы, которым доверяешь, ощущаются дороже.
Практический разбор: короткие циклы исправлений, небольшие правки, доверие к тестам и путь к зелёному CI без войны с кодовой базой.
Практический разбор: контракты инструментов, работа с контекстом, точки согласования, evals и телеметрия.
Rewrite, decomposition, step-back prompting, HyDE, fusion — и когда каждый из этих приёмов действительно оправдывает задержку.
Как снижать галлюцинации в LLM-системах: поиск по источникам, отказ от ответа, проверка утверждений, evals и честные ограничения.
Нарезка, заголовки, метаданные, parent-child структура, reranking и контроль качества корпуса для RAG.
Как я использую лёгкий spec-driven workflow в реальной работе, что автоматизирует SDDRush и где в этой схеме уместен Kotef.
Практический разбор: опорные наборы, оценщики, проверки трасс, продовые метрики и релизные гейты для LLM-систем.
Промпты сегодня — это формат ответа, примеры, инструменты и циклы evals, а не поиск магической фразы.
Как превратить BI-страницу в инструмент решения, а не в стену графиков.