דרכים אפשריות לדחיסת תמונה
השאלה העיקרית שנשאלת בנושא של דחיסת תמונות היא האם בכלל ניתן לדחוס תמונה מבלי לפגוע בצורה משמעותית באיכותה החזותית. התשובה לכך היא חיובית. הדבר נכון בפרט כשמדובר בתמונה דיגיטלית, וזה משתי סיבות עיקריות: ראשית, ניתן לשמור אותה בזיכרון, דבר המאפשר להשתמש בכל רכיבי התמונה, וכן בתמונות קודמות. שנית, ניתן לבצע פעולות עיבוד "חכמות" מסוגים שונים.
קיימות כמה דרכים אפשריות לקבלת דחיסה מוצלחת. שיטות הדחיסה המקובלות כיום הן מתוחכמות יחסית, ובהתאם גם מורכבות.
דחיסה ע"י הקטנת כמות המידע הגולמי
לכאורה, ניתן לדחוס תמונת וידאו בצורה פשוטה - עוד בתהליך הספרור - ע"י הקטנת כמות המידע הדיגיטלי גולמי, המרכיב אותה. ישנן
3 דרכים לעשות זאת: ע"י תת דגימה (הקטנת מספר הדגימות בתמונה), ע"י תת כימוי (הקטנת מספר הסיביות לדגימה) וע"י תת עדכון (הקטנת קצב התמונות).
תת דגימה
תמונה יש לדגום בתדר כפול מרוחב הפס של סיגנל הוידאו.
דגימה בקצב נמוך יותר גורמת אמנם להקטנת כמות המידע, אולם היא
כרוכה בשתי תופעות בלתי רצויות: טשטוש פרטים קטנים בתמונה והוספת פרטים מלאכותיים
לתמונה עקב תופעת הקיפול. תמונות טלוויזיה מעדיפים לדגום בקצב של 512 * 512.
תת כימוי
בתהליך הספרור סיגנל התמונה נדגם, והדגימות עוברות כימוי. הכימוי המקובל הוא אחיד,
וכל דגימה מיוצגת ע"י מספר בינארי יחסי לרמת הבהירות שהיא מייצגת. ע"י כימוי גס יותר
(כלומר עם פחות סיביות), ניתן להקטין את כמות המידע, אולם פעולה זו כרוכה גם בהופעת קווי מתאר בלתי רצויים במעבר בין רמות
הבהירות השונות. קווי מתאר אלה ברורים במיוחד באזורים שבהם רמת הבהירות משתנה בהדרגה ובאופן מתון.
ברוב התמונות ניתן למנוע את הופעת קווי המתאר ע"י כימוי ב-6 סיביות או יותר. מעשית דוגמים בד"כ
תמונות טלוויזיה ב-8 סיביות (256 רמות אפור).
תת עדכון
קצב תמונות הוידאו נקבע על פי שני שיקולים: מניעת הבהוב ויצירת רושם של השתנות רציפה. את בעיית ההבהוב ניתן לפתור ע"י הקרנה כפולה
(או יותר מכך) של התמונה מתוך זיכרון תמונה דיגיטלי. כמות המידע נקבעת אז ע"י קצב העדכון הנדרש לשם רציפות התנועה.
מעשית, ניתן להקנות תחושת תנועה ע"י עדכון בקצב של 12 תמונות בשנייה. אולם, כאשר התנועה מהירה,
העין עלולה להבחין "בקפיצות". לכן עדיף לעדכן בקצב של כ-25 תמונות בשנייה - קצב זהה לקצב התמונות
בוידאו אנלוגי.
למעשה ניתן להסיק, כי לא ניתן לדחוס את התמונה במידה משמעותית ובאיכות סבירה ע"י הקטנת מאפייני הספרור, לשם הקטנת כמות
המידע הגולמי. קצבי הדגימה, הכימוי והעדכון המקובלים קרובים מאד למינימום הנדרש לקבלת תמונה סבירה. לכן כדי לדחוס במידה
הנדרשת, יש לנקוט דרכים שונות לחלוטין.
ניצול תכונות העין והתמונה לשם דחיסה יעילה
דחיסת התמונה אפשרית בשל הימצאו של מידע עודף או מיותר בתמונה. הכוונה ב"מידע" היא למידע דיגיטלי, שמרכיב את התמונה (כלומר, כמות הסיביות שמרכיבות אותה). מידע מיותר הוא מידע שסילוקו אינו משנה את התמונה, שקולט המוח באמצעות העין. מיותרות זו קשורה בשני גורמים: האחד הוא מגבלות יכולת הראייה של הצופה האנושי, והשני הוא תכולת התמונה עצמה.
מבחינת העין, תמונה עשויה לכלול מידע מיותר, פשוט מפני שלעין אין רגישות אחידה לכל המידע החזותי. אם נחסיר מן התמונה את אותו מידע שהעין ממילא אינה רגישה לו, נקבל תמונה שמבחינת הצופה איכותה זהה, אך היא כוללת פחות מידע להעברה או לשמירה.
התכונה העיקרית של העין, שאותה ניתן לנצל למטרות דחיסה, היא ירידת כושר ההבחנה בתדרים מרחביים גבוהים. בתדרים אלה מספר רמות האפור, שבהם היא מבחינה, קטן יותר. לכן את הידע של התדרים המרחביים הגבוהים ניתן לייצג בכימוי גס יותר (כלומר, חסכוני יותר), מאשר את הידע של התדרים הנמוכים, בלי לפגוע באיכות התמונה שקולטת העין. בדרך זו ניתן לסלק כמות רבה של מידע מיותר מהתמונה המקורית.
תכונה אחרת של העין, שניתן לנצלה לשם דחיסה, היא ירידת כושר ההבחנה המרחבי לגבי עצמים נעים. מבחינת קצב העברת המידע, תנועת עצמים יוצרת קושי, כי נדרש עדכון מהיר של החלקים הנעים בתמונה. ניצול תכונה זו של העין מאפשר לבצע עדכון חלקי בלבד של עצמים נעים (כלומר, העברת תמונה פחות מפורטת שלהם), ובכך להגדיל את הדחיסה.
המיותרות הקשורה בתמונה עצמה נובעת ממספר גורמים: הראשון כרוך בפילוג ערכי הבהירות של הנקודות בתמונה. פילוג זה אינו אחיד. חלק מן הערכים חוזרים בתכיפות גבוהה, ואחרים - נדירים יחסית. חיסכון בייצוג התמונה אפשרי, אם אותם הערכים המופיעים לעיתים תכופות, יוצגו ע"י מספר סיביות קטן מאלה המייצגות ערכים נדירים יותר. ניתן אולי להקביל זאת לשימוש שאנו עושים בראשי תיבות לציון מונחים המופיעים בתדירות גבוהה בדיבור ובכתיבה.
הגורם השני קשור בפילוג התדירויות המרחביות בתמונה. גם הפילוג הזה אינו אחיד. נמצא, כי מרבית המידע בתמונת טלוויזיה טיפוסית מרוכז בתדירויות המרחביות הנמוכות, הקשורות לשטחים בתמונה, שבהם הבהירות משתנה באופן הדרגתי. בד"כ, רק חלק קטן מהמידע, שמרכיב את התמונה, שייך לתחום התדירויות המרחביות הגבוהות - בעיקר קווי הגבול שבין חלקים שונים בתמונה. ייצוג התדירויות המרחביות הנמוכות מצריך דגימה מרחבית בעלת צפיפות נמוכה, ולכן הוא בעל תכולת מידע נמוכה יחסית. צפוי אם כן, שאם נתייחס בעיקר לתחום התדירויות המרחביות הנמוכות, נקבל תמונה דומה לתמונה המקורית בייצוג חסכוני.
צד אחר של אותו עניין הוא קיום מתאם מרחבי גבוה יחסית בתמונה. מתאם מרחבי הוא גודל, המייצג באופן כמותי את התלות ההדדית שבין הערכים של נקודות שכנות בתמונה. המשמעות של מתאם מרחבי גבוה היא, שבמרבית תמונות הטלוויזיה ניתן לשערך בצורה משביעת רצון את ערך התמונה בכל נקודה, על סמך ערכי הנקודות בסביבתה. לפיכך, חלק ניכר מתרומתה של נקודה בודדת לתמונה הוא מיותר: ניתן "לנחש" אותה על סמך ערכי הנקודות השכנות. בדרך זו ניתן לוותר על חלק ניכר מתכולת המידע (כלומר מספר הסיביות) של כל נקודה.
גורם שלישי למיותרות הקיימת בתמונה קשור בהשתנות הזמנית שלה, שהיא איטית בד"כ. במלים אחרות, רוב המידע החזותי חוזר על עצמו, והמתאם הזמני בין תמונות עוקבות הוא גבוה. כאשר מעדכנים תמונה, יש צורך לעדכן רק את החלקים שהשתנו. בגלל המתאם הזמני הגבוה, נדרש עדכון מועט יחסית. יתרה מזו, ע"י ניתוח התמונה, ניתן לבצע את העדכון הנדרש באופן חסכוני במידע. למשל, ניתן לזהות חלקי תמונה שנמצאים בתנועה, לזהות את מהירות התנועה וכיוונה, ולצרף מידע זה לחלק הנע. באופן זה אין צורך לעדכן את כל התמונה, משום שהעצם כבר נמצא ממילא בזיכרון.
תהליך הדחיסה כרוך, בחלק מן המקרים, בפגיעה מסוימת באיכות התמונה. מידת הפגיעה המותרת תלויה בשימוש שנעשה בתמונה. כאשר רצף תמונות משודר לצפייה, אפשר לפגוע באיכות התמונה במידה שאינה ניכרת לעין הצופה. לעומת זאת, במקרים אחרים, אין אפשרות להתפשר על איכות התמונה, והתמונה הפרוסה חייבת להיות זהה למקורית. דרישה כזו קיימת, למשל, במקרים של דחיסת תמונות רפואיות לצורך אחסונן בארכיב.
דחיסת תמונה עשויה להיות לעזר לתחומים שונים. בתחום שידור תמונה היא מביאה תועלת רבה בשידורי טלוויזיה, בשידורי תמונות לווין, בתקשורת בין מחשבים, בשידור פקסימיליה ועוד. בתחום אחסון תמונה, הדחיסה שימושית לשמירת מסמכים, לשמירת תמונות לצורכי אבחנה רפואית, לשמירת מפות ותמונות שטח ועוד.