arrow

פרק 1 - מבוא לבסיסי נתונים באינטרנט

מה הוא בסיס נתונים

היו היה, בזמנים הפרימיטיביים והברבריים שקדמו להמצאת המחשב, אנשים נהגו לאחסן מידע בראש. הדבר לא היווה בעיה, שכן כמות המידע שהייתה ברשות האנושות בימים הללו לא הייתה גדולה. מוחותיהם של כמה זקני שבט הספיקו בהחלט.

הכל היה טוב ויפה, אבל אז לפתע פתאום, במהירות של מגיפה מתפשטת, התפתחה החקלאות. התחילו להופיע כל מיני ניצנים של הכלכלה המודרנית, כגון יצור יתר של מזון. הטיפול במחסנים הגדולים של חיטה, אורז, ותירס הפך לצרה רצינית עבור המלכים והקיסרים שצמחו יחד עם הכלכלה החדשה. המידע פשוט הפך לרב מדי. מוחותיהם של הזקנים כבר לא הצליחו להכיל את כולו. וכך, על מנת לאחסן את המידע החדש האנושות המציאה את טכנולוגיית הכתב. מידע החל להתאחסן בכספות עבות כרס הקרויות ספרים. כפי שידוע לנו הספרים התפשטו במהירות ותוך זמן קצר קהילות שלמות של ספרים נדדו ל"בסיסי נתונים" ממשיים ראשונים, הספריות.

בניגוד לגרסאות הקודמות של מחסני מידע (אנשים וספרים), שלב זה יכול להיחשב למהפכני ביותר באבולוציית בסיסי הנתונים. ספריה זהו כבר זן מודרני של בסיס נתונים, אם כי פרימיטיבי ביותר כמובן. ליתר דיוק ספריות הציגו שיטות סטנדרטיות שלפיהן מידע יכול היה להישמר ולהישחזר. ללא שיטות סטנדרטיות של גישה למידע הספריות היו נראות כמו כל ארון בגדים ממוצע: כאוס אינסופי. ספרים והנתונים שבתוכם צריכים להיות נגישים בקלות לכולם, אם רוצים שיהיה להם שימוש כלשהו, וספריה היא צורת אחסון שעונה על הדרישה הזאת.

בעצם היעילות של ספריה או כל בסיס נתונים אחר, פרופורציונית ליעילות אחסון ושחזור המידע בה. זהו העקרון שינחה את האבולוציה של בסיסי הנתונים במשך אלפיים השנים הבאות, עד לצורתה הנוכחית.

הספרנים הראשונים קבעו נוהל של דוחות על מלאי והשאלה- קטלוג כרטיסים. וכך במשך אלפיים השנים הבאות הספריות גדלו, וגדלו, וגדלו. יחד איתן גדלו טכנולוגיות האחסון ושחזור שונות כגון חדרי אחסון, לוחות צבעוניים וקלסרים. וכך זה נמשך עד שיום אחד לפני כחצי מאה, כמה חברה מבריקים, שכללו את אלן טיורינג, ושעבדו עבור הממשל הבריטי נתבקשו להמציא מכשיר מתקדם לפענוח קודים של המודיעין הגרמני. ביום גורלי זה העולם השתנה פעם נוספת. ביום ההוא נולד המחשב.

המחשב היה טכנולוגיה מהפכנית ביותר כמובן, אך כמו במקרה של כל טכנולוגיה מהפכנית אנשים לקחו ויישמו אותה לצורך מציאת פתרונות לבעיותיהם הישנות. במקום להשתמש בפוטנציאל המהפכני שלהם, כמעט באופן מיידי המחשבים נרתמו לפתרון הבעיה עתיקת הימים של אחסון ושחזור מידע. זה די מובן – הרי המידע הלך והצטבר בקצב העולה על יכולת הקיבול של כל הספריות. האינפורמציה העודפת דלפה מכל נקבוביה וחריץ של החברה המודרנית.

הניסיונות הראשונים של אחסון ושחזור המידע נעשו בדרכים הדומות לאלו שהאנשים היו כבר רגילים אליהן. המערכות הראשונות היו מבוססות על קבצים נפרדים בספריה וירטואלית. בשיטת הקבצים הזו, ערמת קבצים נשמרה במחשב והייתה נגישה למפעילו. קבצי הנתונים נקראו "טבלאות" משום שהם נראו כמו טבלאות הנהוגות בשיטת אחסון הקבצים המסורתית. עמודות הטבלה נקראות "שדות", ושורות נקראות "רשומות". נראה טבלה כזאת למשל בדוגמה הבאה:

טלפון אי-מייל שם משפחה שם פרטי
1234567 dany@dan.com דן דני
7654321 yosy@yos.co.il יוסף יוסי
1231231 avi@av.co.il אב אבי

שיטת קבצים זו הייתה ההתחלה, והיא הייתה מאד לא אפקטיבית. כדי למצוא רשומה צריך היה לסרוק את כל הקובץ, בתקווה שהרשומה הדרושה איננה האחרונה. במקרה של מאות אלפי רשומות, אפשר בקלות להבין הבעייתיות של שיטה זו. על מנת להקל על הבעיה מדעני המחשב (שוב, ע"י חשיבה במושגים הקיימים) הנהיגו את שיטת קטלוג הכרטיסים, זאת אומרת תהליך גישה אקראי כאמצעי לגשת ביעילות לרשומה בודדת מבלי לסרוק את כל הקובץ על מנת למצוא אותה. כתוצאה מכך התקבלה שיטת קבצי האינדקס: קובץ אינדקסים נפרד הכיל מילות מפתח ומצביעים לרשומות שבפועל אוחסנו במקום אחר. השיטה הפכה את השחזור ליעיל יותר. היא עבדה ממש כמו קטלוג הכרטיסים בספריה. בכדי למצוא מידע היה על המחפש לעבור על המפתחות בלבד, ולא לקרוא את הרשומות במלואן. אך למרות היתרונות של האינדקסים, שיטה המבוססת על קבצים עדיין סבלה מבעיות רבות, כגון:

  1. כפילויות מידע: אותו המידע עלול לחזור על עצמו במקומות שונים.
  2. יכולת נמוכה של בקרת נתונים: במקרה של כפילויות, המידע יכול להיות שונה מעט בין המופעים השונים. למשל אם אדון דן משנה את שמו לדני, והשינוי מתבצע רק בחלק מהקבצים שמכילים את פרטיו של האדון.
  3. אי היכולת לתמרן את המידע בקלות: עדכון קבצים בצורה ידנית זו משימה מייגעת ומועדת לטעויות רבות.
  4. גישה לנתונים אפשרית למומחים בלבד: הגישה לנתונים דרשה מאמצי תכנות ניכרים, והייתה קשה מדי למשתמש פשוט שאיננו מתכנת.

חשבו, לדוגמא כמה קשה לטיפול בשיטת הקבצים יהיה קובץ הנתונים הבא:

ציון קורס כתובת שם
65 כימיה הרצל 3 דני דן
100 סינית הרצל 3 דני דן
80 פיסיקה הרצל 2 דני דן
100 אנגלית הרצל 3 דני דן
100 פסיכולוגיה1 בן גוריון 1 אבי אב
100 פסיכולוגיה2 ביאליק 8 אבי בן
100 מתמטיקה בן גוריון 1 אבי אב
100 היסטוריה בן גוריון 1 אבי אב

מה שהיה דרוש לפתרון הביעה היא דרך מיוחדת וחדשנית שתנצל את המדיום של המחשב. שיטה אשר לא תאלץ את המחשב ליישם את הכלים והמושגים הישנים. שיטה זו נמצאה- ברוכים הבאים אל בסיסי הנתונים.

בצורה פשטנית בסיס נתונים זו שיטה ממוחשבת של אחסון רשומות. זו מערכת הכוללת נתונים, חומרה שמאחסנת את הנתונים באופן פיסי, ותוכנה שמייעלת את מערכת הקבצים של החומרה. המטרות הן 1) לאחסן את הנתונים ו- 2) לספק שיטה סטנדרטית לשחזור ושינוי הנתונים. המרכיב האחרון הם המשתמשים שיהפכו את הנתונים למידע.

מסדי הנתונים (בסיסי הנתונים), יצור של שנות ה- 60, נוצרו על מנת לפתור את הבעיות שהיו בשיטת הקבצים. הם היו קומפקטיים, קלים לשימוש, מדויקים, מספקים הבטחה, ואפשרו שיתוף נתונים בין מספר משתמשים. בסיס נתונים יכול להיות מערכת מורכבת ודורשת הרבה תשות לב, כמו למשל מערכות מעקב אחר החשבונות בבנקים שכוללות אלפי לקוחות. או שזו יכולה להיות מערכת פשוטה כמו אוסף בולים במחשב של מישהו. הדבר החשוב הוא שבסיס הנתונים מאפשר למשתמש לאחסן נתונים ולגשת אליהם או לעדכן אותם בעת הצורך, בקלות וביעילות בלא קשר לכמות הנתונים שבטיפול.

באופן מסורתי, בסיסי נתונים היו רצים על מחשבים ראשיים (mainframe) גדולים ובעלי עוצמה שמיועדים לאפליקציות עסקיות. בודאי שמעת על חבילות כגון:

  • Oracle 8
  • Sybase SQL Server

אך אם המצאת המחשבים האישיים, קטנים ובעלי עוצמה, בסיסי הנתונים הפכו לשימושיים יותר גם עבור משתמש ממוצע. מייקרוסופט אקסס זו טכנולוגיה פופולרית שמיועדת לרוץ על מחשב אישי.

דבר שיותר קשור לענייננו הוא שבסיסי נתונים הפכו במהרה לחלק בלתי נפרד מעיצובו, פיתוחו, והשירותים שניתנים ע"י אתרי אינטרנט. חשבו למשל על אתר כמו Amazon.com שחייב לאפשר למשתמשים לקפוץ במהירות בין עמודים בתוך מחסן וירטואלי רחב ידיים של ספרים ותקליטורים.

כיצד יכלו מפעילי האתר ליצור עמוד עבור כל פריט שבמלאי, וגם לשמור את כל העמודים הללו מעודכנים? התשובה היא שהעמודים שלהם נוצרים בו במקום ע"י תוכנה שמפעילה "שאילתות" על בסיס נתונים, ומייצרת דפי אינטרנט . תוכנם של הדפים הללו מבוסס על התוצאות לשאילתות. מטרת המדריך שלנו היא לתת לך מבוא גס ומוכן למסדי נתונים, ולהקנות לך כלים שתזדקק להם בעבודה עם בסיס נתונים. נתחיל בצדדים התיאורטיים יותר של מסדי הנתונים, כך שתהיה לך תחושה טובה של הנושא באופן כללי, ורק אחר כך נתעמק בפרטים. א

תוכן עניינים
סוגים של בסיסי נתונים


פרק 1 -> פרק 2 -> פרק 3 -> פרק 4 -> פרק 5 ->