logo


פרק 5: עיבוד וניתוח של עמודי רשת

פשוט, LWP:Simple

מודול ה LWP:Simple, הוא, כמשתמע משמו, יודע לעשות, בעקרו של דבר, פעולה אחת בלבד: להחזיר דף רשת, לייתר פרוט, עמוד רשת המכיל את הטמפרטורה הנוכחית ב Smallville! ראשית, אנו חייבים לכלול את מודול ה LWP:Simple בראש סקריפט ה Perl שלנו:

#!/usr/bin/perl
use CGI;
use LWP::Simple;
...etc...

ישנם המון אתרים המציעים את הטמפרטורה הנוכחית, אולם אנו בחרנו להשתמש ב Weather Underground, של אוניברסיטת מישיגן אשר מציעה תנאי מזג אוויר בתוך ארה"ב ומחוצה לה. למעשה, בנייתURL אשר מפרסם את מזג האויר על פי מיקוד באתר של Weather Underground קלה ביותר (שימו לב, ה URL הארוך הזה מופרד למספר שורות לאורך המאמר בכדי להקל על הקריאה בלבד).

http://www.wunderground.com/
 cgi-bin/findweather/getForecast?query=ZIPCODE

נניח ש Simville נמצאת באיזור מיקוד 14850, נוכל להשתמש ב LWP:Simple בתוך הסקריפט שלנו בכדי לאחזר את תחזית מזג האויר מתוך Weather Underground. כל העמוד יושם לתוך המשתנה weatherPage$.

#set URL to weather web page
$weatherURL="http://www.wunderground.com/cgi-bin/
 findweather/getForecast?query=14850";
#retrieve this web page
$weatherPage=get($weatherURL);

דף הרשת המוחזר מכתובת זו היינו גדול למדי ומכיל המון מידע. כיצד נוכל להוציא ממנו רק את הטמפרטורה? ובכן, אין דרך כללית - דף רשת מכיל מידע המסומן לפי מבנה אולם לא לפי משמעות - ולכן אין, למעשה, דרך שבה סקריפט ה Perl שלנו, יוכל להתבונן לתוך הדף ולהכריז בקול תרועה "מצאתי, הנה הטמפרטורה!". אם נסטה מהנושא, קיים תחום ה XML שבו, בנוסף להמון דברים אחרים, ניתן לפתור גם בעיה זו, ע"י מתן אפשרות למפתח לסמן את משמעות המידע בתוך המסמך. אולם אם נניח את XML בצד, אנו עדיין זקוקים לפתרון - למזלנו Weather Underground נותן פתרון די נוח. אם נתבונן בHTML המופק מהאתר של Weather Underground נמצא סדרה של הערות המכילה את תנאי מזג האוויר הבסיסיים:

<!-- Condition ==  -->
<!-- Temperature == 20.0 -->

מטרה פשוטה
תוכן עניינים
רודפים אחרי תגים

אודות
תוכן עניינים
פרק 1: ה Perl שאתם צריכים לדעת
פרק 2: קישור Perl לעמודי הרשת
פרק 3: שמירת מצב
פרק 4: HTML בחטף ותבניות (Templates) רשת
פרק 5: עיבוד וניתוח של עמודי רשת
מטרה פשוטה: קוד כמו שסבתא נהגה להכין  
פשוט, LWP:Simple  
רודפים אחרי תגים  
שליפת תגיות בלי מאמץ: TokeParser  
ניתוח תכונות בקלות  
השיטה היא לנתח: מסכם עמודי רשת  
פרק 6: להשתעשע עם בסיסי נתונים מקוונים:אקסס
פרק 7: המודל MySQL
פרק 8: להשתעשע בבסיסי נתונים - GUFE - החזית הכללית והשימושית
פרק 9: המילניום - ניהול זמן ותאריך
פרק 10: ניהול רשימות והאשים (Hashs)
פרק 11: הפניה להפניה
פרק 12: הכרות עם mod_perl