תמליל > קידוד תווים


כמו-כן, מערכות התווים בסדרת מערכות התווים ISO-8859 אף סותרות זו את זו, מהבחינה הזאת ששני קידודים יכולים להשתמש באותו מספר לייצוג שני תווים נבדלים, או להשתמש במספרים שונים לייצוג אותו התו.
את הפתרון לבעיות שהוצגו לעיל מספק תקן בינלאומי חדש יחסית, שנקרא: "Unicode". תקן זה הוא בן 16 סיביות (2 בתים) ומאפשר ייצוג של 65,536 תווים שונים (מ-0 ועד 65,535). 65,536 תווים מספיקים בהחלט כדי לייצג את כל השפות בעולם במקביל, כולל את השפות של מדינות מזרח אסיה. ניתן למצוא בתקן זה אף קידוד של אותיות השפה העברית, ניקוד עברי, וטעמי המקרא. תקן זה עדיין אינו מיושם במרבית מערכות המחשב, אך השימוש בו צפוי לגדול בצורה משמעותית בשנים הקרובות. התפתחות רשת האינטרנט בפרט ורשתות המידע בכלל, והצורך בהתאמת רשתות אלה לשימוש גלובלי ורב-לשוני, יוצרים קרקע פורייה להתבססות של תקן "Unicode" כתקן המחייב במערכות המחשבים בכל העולם.
האחסון הרגיל של "Unicode" הוא בסדרות עוקבות של שני בתים. אולם, קיימות לא מעט תוכנות שנבנו על הנחת עבודה של טיפול בבית אחד, ולכן אינן פועלות כפי שצריך עם תקן "Unicode" המקורי. לכן הומצא קידוד, שנקרא: "UTF-8", שממיר את הסדרות העוקבות של שני הבתים לסדרות של בתים בודדים בעלי אורך משתנה, בהאם לקידוד של התו.
תקן ISO-10646 הוא בן 32 סיביות (4 בתים), והוא מסוגל לייצג הרבה יותר תווים מאשר תקן "Unicode". בשנת 1991 תקן "Unicode" הפך לחלק מתקן ISO-10646.
כיוון שישנם פרוטוקולי תקשורת, שעדיין מבוססים על קוד ASCII בן 7 הסיביות, יש לבצע המרה מתמליל המבוסס על קוד ASCII המורחב, בן 8 הסיביות, לקוד ASCII המקורי בן 7 הסיביות. ישנן מספר שיטות המשמשות להמרה בין סוגי קידודים אלה:
UTF 7 ,64-BASE ,QUOTED PRINTABLES ,UUENCODE ו-UTF 8.




הגדרת Unicode

  אודות האתר - מפת האתר - עמוד הבית  
© כל הזכויות שמורות למערכת המידע איתן