שיעור 4: ייצוג מידע — טקסט, מספרים ממשיים ומדיה
בשיעור הקודם ייצגנו מספרים שלמים בביטים. אבל מסך מלא באותיות, תמונות, מוזיקה ומספרים עם נקודה עשרונית. הסוד הגדול: כל מידע הוא בסופו של דבר ביטים — מה שחסר הוא קידוד (Encoding) מוסכם, הסכמה איזו תבנית ביטים פירושה מה. נכיר את ASCII (קוד בן 7 ביטים שבו 'A' הוא 65), את Unicode ואת UTF-8 שמאפשרים לעברי
המחשב שומר הכול כביטים, אבל ביטים לבד הם חידה. קידוד הוא 'ספר הפענוח' שמסכים מראש שהמספר 65 פירושו האות A, ושצירוף מסוים של ביטים פירושו פיקסל אדום. בלי הספר הזה אי אפשר לדעת מה המידע אומר.
- קידוד
- הסכמה הקובעת איזו תבנית ביטים מייצגת איזה ערך (אות, צבע, צליל); בלעדיה ביטים חסרי משמעות.
- ASCII
- קידוד בן 7 ביטים ל-128 תווים בסיסיים של אנגלית: אותיות, ספרות וסימני פיסוק. למשל 'A' הוא 65.
- יוניקוד
- תקן שמקצה מספר ייחודי (נקודת קוד) לכל תו בכל שפה בעולם, כולל עברית ואמוג'י.
- UTF-8
- שיטה לקידוד נקודות הקוד של יוניקוד לביטים, באמצעות 1 עד 4 בתים לתו; תואמת לאחור ל-ASCII.
- נקודה צפה
- שיטה לייצוג מספרים ממשיים בעזרת סימן, מעריך (אקספוננט) ומנטיסה; מאזנת בין טווח לדיוק.
- מנטיסה
- הספרות המשמעותיות במספר נקודה-צפה; קובעת את דיוק המספר (כמה ספרות אפשר לשמור).
- מעריך
- החלק במספר נקודה-צפה שקובע את סדר הגודל (היכן 'הנקודה' יושבת); קובע את הטווח.
- פיקסל
- נקודת צבע אחת בתמונה; תמונה היא רשת מלבנית של פיקסלים, ולכל פיקסל ערך צבע.
- RGB
- ייצוג צבע בעזרת שלוש רמות: אדום, ירוק וכחול. כל רמה לרוב בית אחד (0-255).
- דגימה
- מדידה בודדת של עוצמת הצליל ברגע נתון; צליל דיגיטלי הוא רצף דגימות הנלקחות אלפי פעמים בשנייה.