Alex ChernyshAlex ChernyshAI Systems Engineer · תל אביב
כתיבה

מערכות AI שמחזיקות מעמד בפרודקשן.

forward-deployed עבודה: retrieval, evals, agent infra. זמין בדרך כלל.

Bernstein·HireEx(pre-launch)·GitHub

איך העבודה באמת נראית

▸

מה בעצם עושה מהנדס AI במודל forward-deployed?

Forward-deployed זה לעבוד בתוך הריפו ובסטאק שלכם, לא מערוץ Slack חיצוני. אני כותב ושולח את הקוד שסוגר את הפער בין דמו עובד לבין מערכת שאפשר להשאיר רצה. רוב הזמן זה retrieval grounding, כיסוי evals, גבולות של כלים ומסלול rollback. מה שמתקבל בסוף - commits ו-runbooks, לא מצגות.

מתי תזמור מולטי-אייג׳נט באמת נחוץ ומתי הוא over-engineering?

שווה כשמשימה חוצה כמה משטחי כלים, ארוכה מקונטקסט אחד של מודל או דורשת audit trail חתום לכל צעד. over-engineering כשסוכן יחיד מוקפד עם גבולות כלים נוקשים כבר מספיק. Bernstein בנוי לתרחיש הראשון. אם ה-workflow שלכם הוא פרומפט אחד וכלי אחד, אתם לא צריכים אורקסטרטור, אתם צריכים evals טובים יותר.

למה retrieval grounding נופל בפרודקשן גם כשבדמו הכל נראה תקין?

שאילתות דמו ידידותיות, תעבורת פרודקשן לא. ה-retriever מחזיר בשקט קונטקסט שנשמע סביר אבל שגוי, המודל כותב סביבו טקסט בטוח, ושום דבר בסטאק לא תופס את זה. מה שאני בדרך כלל מתקן: hybrid retrieval, תבנית תשובה עם ציטוטים ברמת עמוד, ו-eval set עם שאילתות יריב שמקבע את המצבים שבאמת נופלים אצלכם.

מתי תזמור סוכנים on-prem באמת קריטי?

כשהעומס נוגע במידע רגולטורי, ברשת סגורה או בשער LLM בצד הלקוח שלא אפשר לעקוף. Bernstein מחזיק state בקבצים, scheduling דטרמיניסטי וסקופ הרשאות לכל סוכן - הכל בתוך הפרימטר שלכם. אין קריאות יוצאות שלא אישרתם. אותו אורקסטרטור רץ על לפטופ, ב-CI וב-VM מוקשח - וזה מה ש-compliance בדרך כלל רוצה לראות.

איך נראית eval-driven delivery בפועל?

כל שינוי נשלח עם gold set של קלטים, judge דטרמיניסטי ו-gate שנופל סגור ב-CI. מצבי כשל חדשים נתפסים כ-eval cases לפני שהתיקון נכנס, כך שהרגרסיה לא חוזרת בשקט. האורקסטרטור מתעד כל צעד של הסוכן, וכשמטריקה זזה אפשר לשחזר את הריצה המדויקת שהזיזה אותה. בלי releases לפי תחושה.

הערות

  • 8 במאי 2026RightLayout: שחררתי כלי AI ל-Mac, ואז העברתי אותו לקהילה
  • 2 במאי 2026פרוגנוזה ללא נבואה: דיסציפלינה בטקסט פשוט
  • 23 באפר׳ 2026מחפשים עבודה? תלגמו לאט. אנחנו נחפש בשבילכם.
לכל ההערות
  • Open sourceBernsteinתזמור עבור סוכני CLI.
  • בדמו · pre-launch Q3-Q4 2026HireExרשימת משרות יומית - העבודה השחורה עליי. עדיין לא קולטים משתמשים חדשים.
  • ייעוץMulti-agent orchestrationביקורות ארכיטקטורה, אבחון grounding ו-shaping ל-embedded build.
  • מוצרRightLayoutמתקן פריסת מקלדת ל-macOS. CoreML on-device, ללא ענן.

רץ כמו אוגר בגלגל, אבל אם יש לכם משהו מעניין באמת - alex at this website dot com

gh·x·rss

© 2026 Alex Chernysh

על אלכס·Privacy·Terms