זוכרים מה רצינו? לפתח מערכת שמציגה גרף של מספר החולים בכל תאריכי הבדיקה בעיר מבוקשת.
למשל, אם העיר המבוקשת היא בית שמש, המערכת תחשב מתוך הנתונים בטבלה את מספר החולים בכל תאריכי הבדיקה בעיר בית שמש, ותציג אותם בגרף:
דורון


אבל טבלת הנתונים כוללת בדיקות בערים שונות, והיא כוללת גם בדיקות חיוביות (חולים) וגם בדיקות שליליות (לא חולים)…
אמיר

אז אם לדוגמה העיר המבוקשת היא בית שמש, איך נוכל להוציא מהטבלה הגדולה הזאת רק את הבדיקות של החולים בבית שמש בכל תאריכי הבדיקות?
הדסה

שלב 1 - נבדקים חיוביים - פילטר
אנחנו כבר יודעים לפלטר טבלה.
בתור התחלה, נוכל לפלטר את טבלת הנתונים ולקבל טבלה של כל הבדיקות החיוביות שנעשו.
נדגים כאן את הפילטור על הטבלה הקטנה לצורך המחשה. כאשר תבנו את המערכת, תעבדו עם הטבלה הגדולה.
כך נפלטר מתוך טבלת הנתונים רק את הבדיקות החיוביות:
small_tests_table = read_table(
“https://ontopnew.s3.dualstack.il-central-1.amazonaws.com/pandemic/small_tests_table.csv”)
positve_table = filter_data(small_tests_table , “test_result”, True)
חזרה: נתבונן בפקודת הפילטר
התאימו לכל חלק בפקודת הפילטר את הדוגמה המתאימה מהקוד:
משהו ללמוד - סוגי המשתנים בטבלה
כמו שלמשתנה יש טיפוס, גם לטור בטבלה יש טיפוס.
כשאנחנו מפלטרים טבלה, חשוב לשים לב לטיפוס הטור שלפיו אנחנו מפלטרים.
למשל, נכתוב את הערך במרכאות רק אם הוא מטיפוס string (מחרוזת).
דורון

הטבלה שלנו בנויה מטיפוסי הטורים האלה:
שימו לב❤️:
הטור של תוצאות הבדיקות מכיל את הנתונים True ו-False, אלה נתונים מטיפוס בוליאני ולא מחרוזתי!
לכן בפקודת הפילטר לא כתבנו את הערך True במרכאות. לעומת זאת את שם הטור של תוצאות הבדיקה "test_result" כתבנו במרכאות, כי שם הטור הוא מטיפוס string.
כתוצאה מהפילטור התקבלה תת טבלה (במשתנה positive_table) הכוללת רק את הבדיקות החיוביות.
שימו לב שבטור "test_result" מופיע רק הערך True:
הטבלה positive_table:
אז למדנו שצריך לקחת בחשבון את טיפוס המשתנה שאותו מפלטרים.
ועכשיו בואו נתרגל קצת.
דורון


