כתיבה
הערות על retrieval, evals, observability ועל העבודה ההנדסית שמתחילה ברגע שהדמו הוא החלק הקל.
Query rewrite, decomposition, step-back prompting, HyDE, fusion — ומתי כל אחד מהם שווה את ה-latency הנוסף.
Chunking, כותרות, metadata, מבנה parent-child, reranking ו-QA לקורפוס במערכות RAG.