שיעור 5: מצב 'הופעה' — שני המתגים לפני שמריצים
עדיין ברמת אינטואיציה, כמעט בלי קוד. לפני שמריצים מודל 'באמת', מעבירים אותו ל'מצב הופעה' — בעזרת שני מתגים נפרדים. מתג אחד גורם לתשובות להיות יציבות; המתג השני חוסך זיכרון ומאיץ את ההרצה. נבין מה כל מתג עושה ולמה שניהם נחוצים, ונכיר בעדינות את שמות הקוד שלהם.
מתג אחד אומר למודל 'אנחנו בהופעה, לא בחזרות' — בלי תרגילי אקראיות. המתג השני אומר 'אל תרשום הערות לתיקון אחר כך' — בלי מחברת למידה.
- מתג ההתנהגות (eval)
- מעביר את המודל למצב הרצה יציב — מכבה אקראיות כמו dropout, כך שאותו קלט נותן תמיד אותה תשובה.
- מתג הלמידה (no_grad / inference_mode)
- מפסיק לשמור 'הערות ללמידה' (gradients). ב-inference אין למידה, אז זה חוסך זיכרון ומאיץ.