.. (לתיקייה המכילה) | ||
שגיאה בשאלה 8 | |
בשאלה זו לא מתבצע כוונון פרמטרים. אך עדיין ניתן להשתמש ב cross validation כדי לקבל תוצאות "עמידות" בפני בחירה טובה/גרועה של קבוצת מבחן. למרות זאת נבקש להשתמש באותה חלוקה לקבוצת אימון וקבוצת מבחן כפי שהגדרנו בשאלה 7 (ולא בשאלה 8). (ללא קרוס וולידציה) סעיף ד' מיותר ולא צריך לענות עליו. בהצלחה |
תיקון ניסוח שאלת בונוס | |
במקום הציגו מקרה עבורו המאפינים הנבחרים הם x3 ו x4 צריך להיות: הציגו מקרה עבורו המאפינים הרצויים הם x3 ו x4 |
תיקון שאלה 2 | |
בשאלה 2 הניחו כי עלות יצור של מעבד היא אפסית והרווח עבור מכירת מעבד תקין הוא 10,000 עדכון: לאחר התיקון הנ"ל החברה מנסה למקסם את הרווח שלה. במילים פשוטות החברה רוצה כמה שיותר כסף בכיס בסוף היום. |
האם ניתן להשתמש בעצי החלטה של ספריית sklearn | |
עבור תרגיל זה ניתן להניח שהעצים של הספריה מתנהגים כמו עצי החלטה מסוג ID3. יש לדאוג שישתמשו בinformation gain כקריטריון לפיצול. |
שאלה 1 סעיף א | |
השאלה לא מנוסחת מספיק ברור, אתם נדרשים למדוד את ביצועי המסווג כמתואר. הכוונה שאתם נדרשים לאמן 4 עצים על תת-קבוצות שונות של הדוגמאות, לצורך תהליך הערכת הביצועים. |
איזה דיוק יש להדפיס בשאלה 3 | |
בשני המקרים את הדיוק על סט האימון |
הבהרה לשאלה 5 | |
על איזו קבוצה יש למדוד את הביצועים? הכוונה לגבי הביצועים הסופיים של אלגוריתם למידה שיאומן רק על תת קבוצת המאפיינים שנבחרה |
האם יש צורך בקובץ q8.py | |
לא, הוא מיותר ואין חובה להגישו מכיוון שהקוד יכול להופיע בpart2.py |
אני לא מבין את המבנה של sfs | |
המטרה של המבנה של הפונקציה היא שיהיה ניתן להשתמש בספריות שונות. בנוסף עבור פונקציית score מסויימת ניתן להשתמש במסווגים שונים. שימו לב שאין ידע מוקדם על הinterface של המסווג לכן אין להשתמש בפונקציות שלו במסגרת sfs (אלא רק במסגרת פונקציית התועלת). זאת מכיוון שנוכל בהמשך להעביר מסווג ופונקציית score משלנו. |