כתיבה
כתיבה מעשית על retrieval, evals, observability, מגבלות, ועל העבודה ההנדסית שמתחילה כשהדמו כבר לא החלק הקשה.
הערה קצרה מישראל על מה אזעקות חוזרות עושות לקשב, לשיקול הדעת ולהרגלי עבודה — ואילו הרגלים מקצועיים עוזרים לחזור לעבודה בלי לעשות מהלחץ הצגה.
Blueprint מעשי ל-Legal QA, שנשען בין היתר על עבודה סביב Agentic RAG Legal Challenge: זהות מסמכים, hybrid retrieval, תשובות מובְנות, grounding ברמת עמוד, טלמטריה ו-evals.
מדריך מעשי לבטיחות במוצרי LLM: prompt injection, אוטונומיה עודפת, פלט מסוכן, evals וגבולות מפוכחים.
איך לבנות ממשקים שנראים שקולים, יקרים במובן הטוב, ואמינים תחת עומס — בלי גימיקים ובלי תיאטרון AI.
איך להשתמש ב-AI בתוך תהליך פיתוח בלי להפוך green build למשחק ניחושים ובלי לשחוק את הריפו.
עקרונות מעשיים לחוזי כלים, הנדסת הקשר, evals, אישורים וטלמטריה במערכות agentic.
Query rewrite, decomposition, step-back prompting, HyDE, fusion — ומתי כל אחד מהם שווה את ה-latency הנוסף.
איך לבנות שכבת grounding, abstention ו-verification שמורידה hallucinations בלי להפוך את המוצר לאיטי או יהיר.
Chunking, כותרות, metadata, מבנה parent-child, reranking ו-QA לקורפוס במערכות RAG.
איך אני משתמש ב-workflow קל של Spec-Driven Development בפרויקטים אמיתיים, מה SDDRush עושה בפועל, ואיפה Kotef נכנס אם רוצים שכבת agent חזקה יותר.
איך להפעיל LLM evals בפרודקשן עם gold sets, graders, בדיקות trace, סיגנלים תפעוליים ושערי ריליז.
Prompt design היום הוא פורמטים, דוגמאות, כלים ולולאות eval — לא לחשים.
איך לגרום לעמודי BI לתמוך בהחלטות דרך נרטיב, היררכיה חזותית ואמון.