logo


פרק 5: עיבוד וניתוח של עמודי רשת

ה Perl שאתם צריכים לדעת: פרק 5 "עיבוד וניתוח של עמודי רשת"

בסדרה שלנו עברנו על אמצעים רבים להוספת תכנים לעמודי רשת, אולם עדיין לא למדנו איך לשלוף מידע מעמודי רשת בעזרת Perl. בפרק הקודם למדנו להכניס תכנים מתעדכנים לעמודים בנויים מראש, כמו ה Gazette Smallville בעזרת תבניות רשת (web templates). בפרק הזה אנו מרחיבים את היריעה ולומדים לשלוף מידע מהרשת ולאחר מכן להכניס אותה בצורה דינאמית לעמוד פלט מבוסס תבניות. הפעם נשתמש בספריית הLWP של Perl, אשר, כמו אולר שוויצרי, מכילה מספר כלים לחיתוך, ביתור, איחוד מחדש וניתוח של עמודי רשת.

בסדרה שלנו עברנו על אמצעים רבים להוספת תכנים לעמודי רשת, אולם עדיין לא למדנו איך לשלוף מידע מעמודי רשת בעזרת Perl. למעשה ישנן סיבות רבות לרצות לדעת לגשת ולשלוף מידע מעמודי רשת מתוך הסקריפט שלכם, בנוסף ליכולת ליצור עמודי רשת כפלט. בפרק הקודם ניצלנו את התבניות על מנת להכניס מידע לעמוד רשת בנוי מראש כמו ה Gazette Smallville. בפרק הזה אנו מרחיבים את היריעה ולומדים לשלוף מידע לרשת ולאחר מכן להכניס אותה בצורה דינאמית לעמוד פלט מבוסס תבניות. הניסוח אומנם מסורבל, אולם היו בטוחים שהתוצאה תהיה פשוטה ואלגנטית.

השותפה שלנו ליצירת התמונה היא ה "library for WWW access in Perl" (ספריית הגישה לרשת ב Perl) - הידועה כ LWP. ספריית הLWP של Perl מכילה מספר מודולים, אשר, כמו אולר שוויצרי, מכילה מספר כלים לחיתוך, ביתור, איחוד מחדש וניתוח של עמודי רשת. חלק מהיכולות של LWP פשוטות ביותר, לעומת אחרות שיכולות להיות מסובכות מאוד. נתחיל את התבוננותנו על LWP ושימושיה הפשוטים יותר בצרוף עם טכניקת התבניות שראינו בפרק 4.

תוכן:

מטרה פשוטה

פשוט, LWP:Simple

רודפים אחרי תגים

שליפת תגיות בלי מאמץ: TokeParser

ניתוח תכונות בקלות

השיטה היא לנתח: מסכם עמודי רשת

אודות
תוכן עניינים
פרק 1: ה Perl שאתם צריכים לדעת
פרק 2: קישור Perl לעמודי הרשת
פרק 3: שמירת מצב
פרק 4: HTML בחטף ותבניות (Templates) רשת
פרק 5: עיבוד וניתוח של עמודי רשת
מטרה פשוטה: קוד כמו שסבתא נהגה להכין  
פשוט, LWP:Simple  
רודפים אחרי תגים  
שליפת תגיות בלי מאמץ: TokeParser  
ניתוח תכונות בקלות  
השיטה היא לנתח: מסכם עמודי רשת  
פרק 6: להשתעשע עם בסיסי נתונים מקוונים:אקסס
פרק 7: המודל MySQL
פרק 8: להשתעשע בבסיסי נתונים - GUFE - החזית הכללית והשימושית
פרק 9: המילניום - ניהול זמן ותאריך
פרק 10: ניהול רשימות והאשים (Hashs)
פרק 11: הפניה להפניה
פרק 12: הכרות עם mod_perl