Prompt Engineering ו-Evals

שיעור זה עוסק בטכניקות prompt engineering ובבניית eval harness לבדיקת איכות תגובות.

כמו שסופר מנסה כמה גרסאות של פסקת פתיחה — prompt engineering מנסה ניסוחים שונים כדי לקבל את התגובה הכי טובה מה-AI.

Few-shot: הכללת דוגמאות ב-prompt כדי לעזור ל-LLM להבין את הפורמט הרצוי.
Chain-of-thought: הנחיית ה-LLM לחשוב בשלבים לפני מתן תשובה — משפרת דיוק.
Eval harness: מערכת אוטומטית להרצת prompts על test cases ולמדידת איכות.
LLM-as-judge: שימוש ב-LLM אחד לדירוג תגובות של LLM אחר.