Alex ChernyshAlex ChernyshAgentic behaviorist · תל אביב
כתיבהעוזר
חזרה לכתיבה

הערה

אילו query transformation techniques באמת עוזרים ל-RAG?

Query rewrite, decomposition, step-back prompting, HyDE, fusion — ומתי כל אחד מהם שווה את ה-latency הנוסף.

24 בפברואר 2026·3 דק׳ קריאה
RAGRetrievalPrompting
בעמוד הזה(7)
לא כל שאלת retrieval צריכה rewriteQuery rewriteDecompositionStep-back promptingHyDEQuery fusionאיך בוחרים

Query transformation מועיל כשהוא פותר כשל retrieval מסוים. הוא הופך לתיאטרון יקר ברגע שמוסיפים אותו רק כי דיאגרמת הארכיטקטורה הרגישה בודדה.

כלל אצבע

להוכיח קודם את הסימפטום, ורק אז להוסיף שכבת transformation. אם הקורפוס שבור, rewrite יפה לא יהפוך אותו לחכם יותר.

לא כל שאלת retrieval צריכה rewrite

יש מחלקות כשל שונות. השאלה משתמשת במונח אחד, המסמכים במונח אחר. יש שתי כוונות מעורבות וצריך decomposition. חסרה הפשטה כללית יותר ו-step-back עוזר. צריך HyDE כדי לייצר מרחב חיפוש טוב יותר. צריך fusion של כמה ניסוחים.

אם לא ברור איזו מחלקת כשל קיימת, כל transformation layer תיראה אותו דבר. עוד latency, יותר תנועה, לא בהכרח יותר evidence.

Query rewrite

Rewrite עוזר כשהפער מילוני. המשתמש שואל במונח אחד, המסמכים כתובים במונח אחר, metadata או titles בנויים סביב vocabulary שונה.

שימושי. וגם השכבה שהכי קל להעמיס יתר על המידה. אם rewrite רץ על כל שאלה בלי אבחנה, הוא הופך לעוד מס על המערכת.

Decomposition

Decomposition מתאים כשבשאלה יש כמה תתי-שאלות שונות, וכל אחת צריכה retrieval נפרד. כשצריך ראיות משני אזורים שונים בקורפוס. כשהשאלה מערבבת condition ו-exception. כשתשובה אחת רציפה הייתה דוחפת יותר מדי context לחלון אחד.

Decomposition מוסיף retrieval passes. אם איכות הקורפוס עדיין חלשה, מקבלים יותר תוצאות חלשות, לא יותר ודאות.

Step-back prompting

Step-back עוזר כשצריך למסגר את השאלה ברמה מושגית יותר. השאלה צרה מדי או תלויה בניסוח מקרי. המסמכים מאורגנים סביב כלל כללי יותר. retrieval גולמי נתקע בפרטים הלא נכונים.

גם כאן, אם ה-document structure חלש, השלב הנוסף רק מכסה על הבעיה לזמן קצר.

HyDE

HyDE שימושי כשמרחב החיפוש דל או sparse, וצריך לייצר היפותזה טקסטואלית טובה יותר ל-retrieval.

פחות מתאים כשיש titles ומטא-דאטה טובים, כשהבעיה האמיתית היא ranking, כשה-latency budget לא סובל עוד generation step. HyDE הוא כלי. לא ברירת מחדל.

Query fusion

Fusion עוזר כשיש כמה ניסוחים סבירים של אותה שאלה, וכל אחד פותח מסמכים אחרים. עובד כשכל ניסוח מחלץ signal שונה, כשאפשר לשלב את התוצאות בצורה מבוקרת, וכשיש reranking שמסוגל לנקות את הרעש.

עובד פחות טוב כשאין דרך ברורה למזג את התוצאות, או כשהקורפוס קטן מספיק שהשכבה רק מסרבלת.

איך בוחרים

ההחלטה הפרקטית.

  • בעיית vocabulary -> rewrite
  • כמה תתי-שאלות נפרדות -> decomposition
  • framing צר מדי -> step-back
  • corpus sparse -> HyDE
  • כמה ניסוחים טובים -> fusion

לפני כל זה, השאלות שצריכות לעלות.

  1. האם titles ו-metadata של המסמכים סבירים?
  2. האם chunking נורמלי?
  3. האם reranking חסר?
  4. האם חלון ה-context הסופי קטן וברור?

אם התשובות בעייתיות, transformation הוא לא המקום להתחיל בו.

Query transformation הוא לא מנוע עומק כללי. הוא טיפול נקודתי בסימפטום retrieval ספציפי. כשהוא נבחר נכון, מורגש. כשנבחר סתם כך, הוא מוסיף latency ומקשה להבין מה המערכת באמת הייתה צריכה.

✓ Reading complete

Alex ChernyshAlex ChernyshApplied AI Systems & Platform Engineer

עוד על RAG

חלק מהערות ציבוריות על מערכות AI עם grounding, retrieval, evals ועל איך שולחים את זה תחת מגבלות אמיתיות.

  • →איך בונים מערכות Legal Answering שאפשר לסמוך עליהן10 במרץ 2026·19 דק׳ קריאה
  • →רוב הכשלים ב-RAG מתחילים במסמכים12 בפבר׳ 2026·2 דק׳ קריאה
  • →לבנות מערכות Agentic שמחזיקות מעמד2 במרץ 2026·4 דק׳ קריאה
בעמוד הזה
  • 01לא כל שאלת retrieval צריכה rewrite
  • 02Query rewrite
  • 03Decomposition
  • 04Step-back prompting
  • 05HyDE
  • 06Query fusion
  • 07איך בוחרים