כתיבה

הערות על מערכות AI, על retrieval, ועל העבודה שמתחילה אחרי הדמו.

הערות על retrieval, evals, observability ועל העבודה ההנדסית שמתחילה ברגע שהדמו הוא החלק הקל.

RightLayout: שחררתי כלי AI ל-Mac, ואז העברתי אותו לקהילה

איך אימנתי מאפס מודל CoreML קטן למתקן פריסת מקלדת ב-macOS, השתמשתי בו חודשים, ואז פתחתי את הקוד במקום לנסות לסקיילל לבד.

AI Systems

נבחר2 במאי 202610 דק׳ קריאה

פרוגנוזה ללא נבואה: דיסציפלינה בטקסט פשוט

למה אני משאיר את העתיד לאסטרולוגיה ופונה למחלקות-ייחוס, פרה-מורטמים ויומני קליברציה. אי-ודאות מדויקת בטקסט פשוט.

Delivery

17 פוסטים

2 במאי 2026

10 דק׳ קריאה

פרוגנוזה ללא נבואה: דיסציפלינה בטקסט פשוט

23 באפר׳ 2026

4 דק׳ קריאה

מחפשים עבודה? תלגמו לאט. אנחנו נחפש בשבילכם.

למה הפסקתי להגיש בסגנון LinkedIn ובניתי שירות שקט שעושה את העבודה השחורה במקומי, ועכשיו במקומכם. מעלים קורות חיים פעם אחת ומקבלים בכל בוקר רשימה מדורגת עם רמז קצר איך לפנות לכל תפקיד.

29 במרץ 2026

6 דק׳ קריאה

הרצתי 12 סוכני AI במשך 47 שעות. הנה מה ששרד.

אורקסטרטור דטרמיניסטי בקוד פתוח לסוכני קידוד CLI מקבילים. מריץ Claude Code, Codex CLI, Gemini CLI במקביל: אפס טוקני קואורדינציה, 37 מתאמים, אימות janitor, בידוד git worktree.

11 במרץ 2026

4 דק׳ קריאה

לעבוד תחת אזעקות חוזרות

הערה קצרה מישראל על מה אזעקות חוזרות עושות לקשב, לשיקול הדעת ולהרגלי עבודה, ואילו הרגלים מקצועיים עוזרים לחזור לעבודה בלי לעשות מהלחץ הצגה.

10 במרץ 2026

19 דק׳ קריאה

איך בונים מערכות Legal Answering שאפשר לסמוך עליהן

Blueprint מעשי ל-Legal QA, שנשען בין היתר על עבודה סביב Agentic RAG Legal Challenge: זהות מסמכים, hybrid retrieval, תשובות מובנות, grounding ברמת עמוד, טלמטריה ו-evals.

9 במרץ 2026

3 דק׳ קריאה

בטיחות למוצרי LLM בלי תיאטרון

מדריך מעשי לבטיחות במוצרי LLM: prompt injection, אוטונומיה עודפת, פלט מסוכן, evals וגבולות מפוכחים.

6 במרץ 2026

3 דק׳ קריאה

עיצוב ממשקים למוצרים רציניים

איך לבנות ממשקים שנראים שקולים, יקרים במובן הטוב, ואמינים תחת עומס. בלי גימיקים ובלי תיאטרון AI.

4 במרץ 2026

3 דק׳ קריאה

איך להגיע למצב ירוק עם AI בלי להרוס את הקוד

איך להשתמש ב-AI בתוך תהליך פיתוח בלי להפוך green build למשחק ניחושים ובלי לשחוק את הריפו.

2 במרץ 2026

4 דק׳ קריאה

לבנות מערכות Agentic שמחזיקות מעמד

עקרונות מעשיים לחוזי כלים, הנדסת הקשר, evals, אישורים וטלמטריה במערכות agentic.

24 בפבר׳ 2026

3 דק׳ קריאה

אילו query transformation techniques באמת עוזרים ל-RAG?

Query rewrite, decomposition, step-back prompting, HyDE, fusion: מתי כל אחד מהם שווה את ה-latency הנוסף.

18 בפבר׳ 2026

3 דק׳ קריאה

איך מצמצמים hallucinations בלי לעבוד על עצמנו

איך לבנות שכבת grounding, abstention ו-verification שמורידה hallucinations בלי להפוך את המוצר לאיטי או יהיר.

12 בפבר׳ 2026

2 דק׳ קריאה

רוב הכשלים ב-RAG מתחילים במסמכים

Chunking, כותרות, metadata, מבנה parent-child, reranking ו-QA לקורפוס במערכות RAG.

6 בפבר׳ 2026

4 דק׳ קריאה

Spec-Driven Development: השיטה שאני באמת משתמש בה

איך אני משתמש ב-workflow קל של Spec-Driven Development בפרויקטים אמיתיים, מה SDDRush עושה בפועל, ואיפה Kotef נכנס אם רוצים שכבת agent חזקה יותר.

3 בפבר׳ 2026

5 דק׳ קריאה

איך מריצים LLM evals בפרודקשן

איך להפעיל LLM evals בפרודקשן עם gold sets, graders, בדיקות trace, סיגנלים תפעוליים ושערי ריליז.

29 בינו׳ 2026

2 דק׳ קריאה

Prompt engineering: מניסוח למדיניות

Prompt design היום הוא פורמטים, דוגמאות, כלים ולולאות eval, לא לחשים.

14 בינו׳ 2026

4 דק׳ קריאה

BI storytelling שבאמת מזיז החלטות

איך לגרום לעמודי BI לתמוך בהחלטות דרך נרטיב, היררכיה חזותית ואמון.