הטכניון - מכון טכנולוגי לישראל Technion - Israel Institute of Technology Технион - израильский технологический институт ألتخنيون - معهد تكنولوجي لإسرائيل

02360501 - מבוא לבינה מלאכותית 02360501 - Introduction to Artificial Intelligence 02360501 - Introduction to Artificial Intelligence 02360501 - Introduction to Artificial Intelligence

חורף 2018-2019Winter 2018-2019Зима 2018-2019شتاء 2018-2019

שאלות ותשובות - HW3 Frequently Asked Questions - HW3 Вопросы и Ответы - HW3 أسئلة وأجوبة - HW3

		.. (לתיקייה המכילה)

(6.1) גרסה חדשה של התרגיל צפויה להתפרסם מחר - ראשון
יהיו בה תיקונים של חלק ב ועדכון שיטת ניקוד בחלק ג

האם ה data שאנחנו נבחנים עליו קיים באינטרנט?
לא בגרסה ששלחנו לכם אותו. ממליצים לא להסתמך על שום דבר מהאינטרנט או על תרגילי בית ישנים. בנוסף, נזכיר כי בתרגיל זה כמו גם בקודמים נבדקות העתקות

האם להשאיר את הקוד של הניסויים שעשיתי?
כן

באיזה ספריות מותר להשתמש בחלק ב' (מלבד שאלה 7)?
מותר להשתמש בספריות עבור פעולות מתמטיות, אסור להשתמש בספריות שמביאות לטריוויאליזציה של התרגיל

האם לשנות את הקבצים שניתנו או ליצור חדשים?
אתם אינכם מגישים את הקבצים שניתנו לכם, ואנחנו נריץ את הקוד עם הקבצים המקוריים כך שכל קוד שרשמתם בקבצים אלו לא יוגש, ויש ליצור קבצים חדשים

מה מכיל ה dataset המתקבל?
dataset הוא tuple של patients,labels

מה הם הערכים הבוליאניים המתאימים עבור התיוגים של החולים?
True=1 False=0

האם ניתן להגיש קבצי pickle עבור המידע המחולק לתיקיות?
כן

בסעיף 3.2 נרשם שעלינו להשתמש באותה החלוקה לתיקיות, למה הכוונה?
בכל המקרים שבהם אתם משתמשים במידע המחולק ל k תיקיות עליכם להשתמש באותם התיקיות בדיוק

האם מותר לנו להשתמש בשיטות למידה שלא נלמדו בקורס?

באפשרותכם להשתמש בצורה חופשית במסווגים שנלמדו בקורס ולחפש דרכים ושיטות לשפר את המסווגים הללו
לגבי מסווגים שלא נלמדו בקורס:
אין בעיה אם בניתם מסווגים חדשים בהסתמך על עקרונות שראיתם בקורס
אך אין להשתמש בספריות שמביאות לטריווליזציה של התרגיל (בדגש על חלק ב' בתרגיל).

מטרת החלק של התחרות היא עבודה עם ה data שקיבלתם,
לכן שימוש בספריות אשר מבצעות בעצמן את עיבוד המידע (באופן גלוי או לא) איננו מקובל
דוגמה לכך היא שימוש בחבילה בנויה של רשתות נוירונים.

לאור הבקשות אנחנו נקבל הגשות שלא יעמדו בדרישות אלה,
אך שימו לב שהגשות אלו לא עומדות בכלל הדרישות של התרגיל ובפרט אינן מפגינות יצירתיות ויכולת עבודה עם data - דברים אשר משתקפים בציון הכולל על הסעיף.

האם ב knn_classifier אפשר להניח שתשתמשו ב k אי זוגי?
כן

בחלק של התחרות האם מגישים את המסווג שיצרנו? או רק את הסיווג על ה data
אתם מגישים קוד שמייצר את המסווג ומבצע את הסיווג, ובנוסף את הסיווג המתקבל בסוף

בחלוקה לתיקיות, מה לעשות כאשר לא ניתן את החלוקה כפי שנדרש (בגלל שמספר הדוגמאות אינו מתחלק כנדרש)?
זאת שאלת מימוש, חישבו מה לדעתכם הדבר שהכי הגיוני לעשות במקרה כזה

למה הכוונה שאלת מימוש?
כל שאלה שנדרש ממכם לענות עליה לצורך מימוש התרגיל

האם אפשר להשתמש בספריות לצורך עיבוד data?
אין חובה לממש קוד שמבצע את עיבוד ה data, זה בהחלט עשוי להביא לביצועים טובים יותר. ישנן ספריות המבצעות עיבוד של המידע בצורה אוטומטית ו"מאחורי הקלעים" - הן לא נחשבות במסגרת הניסויים על data.

מה צריך להיות ב main של ההגשה?
צריך להריץ את הניסויים בחלק ב', ולאחר מכן ליצור (ללמוד מחדש מה data) את המסווג שהחלטתם עליו ולהוציא את הסיווג המתקבל הבהרה: צריך להיות ניתן להריץ את הקובץ ולשחזר את כלל התוצאות שהגשתם

מה קורה כשקוראים ל evaluate עם פרמטר k?
ניתן להניח ש split נקרא עם פרמטר זה לפני כן evaluate יעבוד על התיקיות ש ה split המתאים יצר **תיקון: ניתן להניח שהקריאה האחרונה ל split היא המתאימה

איך ליצור את requirments.txt?
תשתמשו ב pip freeze על מנת שנוכל לייצר סביבה מתאימה להרצת הקוד

שאלות ותשובות - HW3 Frequently Asked Questions - HW3 Вопросы и Ответы - HW3 أسئلة وأجوبة - HW3

(6.1) גרסה חדשה של התרגיל צפויה להתפרסם מחר - ראשון

האם ה data שאנחנו נבחנים עליו קיים באינטרנט?

האם להשאיר את הקוד של הניסויים שעשיתי?

באיזה ספריות מותר להשתמש בחלק ב' (מלבד שאלה 7)?

האם לשנות את הקבצים שניתנו או ליצור חדשים?

מה מכיל ה dataset המתקבל?

מה הם הערכים הבוליאניים המתאימים עבור התיוגים של החולים?

האם ניתן להגיש קבצי pickle עבור המידע המחולק לתיקיות?

בסעיף 3.2 נרשם שעלינו להשתמש באותה החלוקה לתיקיות, למה הכוונה?

האם מותר לנו להשתמש בשיטות למידה שלא נלמדו בקורס?

האם ב knn_classifier אפשר להניח שתשתמשו ב k אי זוגי?

בחלק של התחרות האם מגישים את המסווג שיצרנו? או רק את הסיווג על ה data

בחלוקה לתיקיות, מה לעשות כאשר לא ניתן את החלוקה כפי שנדרש (בגלל שמספר הדוגמאות אינו מתחלק כנדרש)?

למה הכוונה שאלת מימוש?

האם אפשר להשתמש בספריות לצורך עיבוד data?

מה צריך להיות ב main של ההגשה?

מה קורה כשקוראים ל evaluate עם פרמטר k?

איך ליצור את requirments.txt?