מאגר Python/AI נקי עם .gitignore
פרויקט AI ממלא את התיקייה שלך בהמון קבצים — אבל לא כולם צריכים להישמר ב-Git. יש סביבת venv במשקל מאות מגה, datasets כבדים בתיקיית data/, משקלי מודל (.ckpt, .pt), וקובץ .env עם סיסמאות ומפתחות. את כל אלה המחשב יכול לייצר מחדש, או שאסור בכלל שיהיו ציבוריים. הכלי הפשוט שמסדר את זה הוא קובץ אחד בשם .git
.gitignore הוא רשימת 'אל תסתכל על אלה' של Git. דברים שנוצרים מחדש לבד (venv, cache) או שלא צריכים להיות ציבוריים (סיסמאות, datasets ענקיים) — פשוט אומרים ל-Git להתעלם מהם.
- .gitignore
- קובץ טקסט פשוט במאגר שמפרט שמות ותבניות של קבצים ותיקיות ש-Git צריך להתעלם מהם ולא לעקוב אחריהם.
- במעקב מול מתעלמים
- .gitignore משפיע רק על קבצים שעדיין לא נכנסו למעקב. קובץ שכבר במעקב ימשיך להיעקב גם אם נוסיף אותו ל-.gitignore.
- git rm --cached
- פקודה שמפסיקה לעקוב אחרי קובץ אבל משאירה אותו על הדיסק — הדרך לנקות קובץ ש'נכנס' למאגר בטעות.
- סודות (secrets)
- מפתחות API, סיסמאות וטוקנים, בדרך כלל בקובץ .env. עדיף מאוד לא לשמור אותם ב-Git — הם מודלפים בקלות.
- נוצר מחדש (regenerable)
- קובץ שהמחשב מייצר שוב לבד מתוך הקוד או ההגדרות, כמו venv או __pycache__. אין טעם לשמור אותו ב-Git.