.. (לתיקייה המכילה) | ||
(6.1) גרסה חדשה של התרגיל צפויה להתפרסם מחר - ראשון | |
יהיו בה תיקונים של חלק ב ועדכון שיטת ניקוד בחלק ג |
האם ה data שאנחנו נבחנים עליו קיים באינטרנט? | |
לא בגרסה ששלחנו לכם אותו. ממליצים לא להסתמך על שום דבר מהאינטרנט או על תרגילי בית ישנים. בנוסף, נזכיר כי בתרגיל זה כמו גם בקודמים נבדקות העתקות |
האם להשאיר את הקוד של הניסויים שעשיתי? | |
כן |
באיזה ספריות מותר להשתמש בחלק ב' (מלבד שאלה 7)? | |
מותר להשתמש בספריות עבור פעולות מתמטיות, אסור להשתמש בספריות שמביאות לטריוויאליזציה של התרגיל |
האם לשנות את הקבצים שניתנו או ליצור חדשים? | |
אתם אינכם מגישים את הקבצים שניתנו לכם, ואנחנו נריץ את הקוד עם הקבצים המקוריים כך שכל קוד שרשמתם בקבצים אלו לא יוגש, ויש ליצור קבצים חדשים |
מה מכיל ה dataset המתקבל? | |
dataset הוא tuple של patients,labels |
מה הם הערכים הבוליאניים המתאימים עבור התיוגים של החולים? | |
True=1 False=0 |
האם ניתן להגיש קבצי pickle עבור המידע המחולק לתיקיות? | |
כן |
בסעיף 3.2 נרשם שעלינו להשתמש באותה החלוקה לתיקיות, למה הכוונה? | |
בכל המקרים שבהם אתם משתמשים במידע המחולק ל k תיקיות עליכם להשתמש באותם התיקיות בדיוק |
האם מותר לנו להשתמש בשיטות למידה שלא נלמדו בקורס? | |
באפשרותכם להשתמש בצורה חופשית במסווגים שנלמדו בקורס ולחפש דרכים ושיטות לשפר את המסווגים הללו לגבי מסווגים שלא נלמדו בקורס: אין בעיה אם בניתם מסווגים חדשים בהסתמך על עקרונות שראיתם בקורס אך אין להשתמש בספריות שמביאות לטריווליזציה של התרגיל (בדגש על חלק ב' בתרגיל). מטרת החלק של התחרות היא עבודה עם ה data שקיבלתם, לכן שימוש בספריות אשר מבצעות בעצמן את עיבוד המידע (באופן גלוי או לא) איננו מקובל דוגמה לכך היא שימוש בחבילה בנויה של רשתות נוירונים. לאור הבקשות אנחנו נקבל הגשות שלא יעמדו בדרישות אלה, אך שימו לב שהגשות אלו לא עומדות בכלל הדרישות של התרגיל ובפרט אינן מפגינות יצירתיות ויכולת עבודה עם data - דברים אשר משתקפים בציון הכולל על הסעיף. |
האם ב knn_classifier אפשר להניח שתשתמשו ב k אי זוגי? | |
כן |
בחלק של התחרות האם מגישים את המסווג שיצרנו? או רק את הסיווג על ה data | |
אתם מגישים קוד שמייצר את המסווג ומבצע את הסיווג, ובנוסף את הסיווג המתקבל בסוף |
בחלוקה לתיקיות, מה לעשות כאשר לא ניתן את החלוקה כפי שנדרש (בגלל שמספר הדוגמאות אינו מתחלק כנדרש)? | |
זאת שאלת מימוש, חישבו מה לדעתכם הדבר שהכי הגיוני לעשות במקרה כזה |
למה הכוונה שאלת מימוש? | |
כל שאלה שנדרש ממכם לענות עליה לצורך מימוש התרגיל |
האם אפשר להשתמש בספריות לצורך עיבוד data? | |
אין חובה לממש קוד שמבצע את עיבוד ה data, זה בהחלט עשוי להביא לביצועים טובים יותר. ישנן ספריות המבצעות עיבוד של המידע בצורה אוטומטית ו"מאחורי הקלעים" - הן לא נחשבות במסגרת הניסויים על data. |
מה צריך להיות ב main של ההגשה? | |
צריך להריץ את הניסויים בחלק ב', ולאחר מכן ליצור (ללמוד מחדש מה data) את המסווג שהחלטתם עליו ולהוציא את הסיווג המתקבל הבהרה: צריך להיות ניתן להריץ את הקובץ ולשחזר את כלל התוצאות שהגשתם |
מה קורה כשקוראים ל evaluate עם פרמטר k? | |
ניתן להניח ש split נקרא עם פרמטר זה לפני כן evaluate יעבוד על התיקיות ש ה split המתאים יצר **תיקון: ניתן להניח שהקריאה האחרונה ל split היא המתאימה |
איך ליצור את requirments.txt? | |
תשתמשו ב pip freeze על מנת שנוכל לייצר סביבה מתאימה להרצת הקוד |