![]() |
.. (לתיקייה המכילה) | |
המבנה המתודולוגי של הניסויים אינו ברור. אפשר בבקשה לחדד?
|
- מפרידים מקבוצת האימון קבוצה שתשמש להערכה בלבד - אופציונלי. - לומדים N עצים, כל אחד על בסיס חלק מהדוגמאות האחרות. - מפעילים את שלושת האלגוריתמים ללמידת (בחירת) וועדה בגודל k מתוך אותה קבוצת N מועמדים. אלגוריתמים אלו יכולים להשתמש בקבוצת ההערכה או שלא. - בוחנים את שלושת הוועדות שהתקבלו על פני קבוצת המבחן. - כל זאת בcross validation. - וכל זאת בריצה על פני הפרמטר הנבדק k או ALPHA. - כל זאת עבור שלושת הdatasets אתם מתבקשים להסביר את המתודולוגיה הנ"ל במילים שלכם במסגרת הדו"ח באופן שיהיה ברור איך ובאיזה שלב מבצעים את ההפרדה לאילו קבוצות (בלי ה "כל זאת..."). אם אתם רואים צורך לשנות איכשהו את המבנה המתודולוגי, זה בסדר כל עוד אתם עומדים בקווים המנחים שנלמדו בכיתה לגבי שיטות הערכה. |
מה הכוונה בתיאור ניסוי 1:
הציגו גרף של דיוק ממוצע על פני 10 הריצות כפונקציה של הפרמטר הנבדק
k?
בדגש על ה10 הזה...
|
הניסוח תוקן לצורך הבהרה. הכוונה היא לדיוק ממוצע על פני ריצות הקרוס-וולידציה, כפי שלמדנו בתרגול. מספר המחיצות הוא לאו דווקא 10, אתם יכולים לבחור אותו כרצונכם. |
בניסוי 1 לכל K אנחנו בונים N עצים שונים ומשווים את כל 3 האלגוריתמים על אותם העצים, אבל אי אפשר להשוות את התוצאות בין ערכי K שונים כי העצים כבר שונים. האם זה בסדר או שצריך לשנות את שיטת הניסוי כך שיהיו אותם N עצים לכל ערכי K?
|
אתה צודק, ההצעה שלכם עדיפה בהקשר של הפרמטר k אך אינה רלוונטית לגבי הפרמטר אלפא בניסוי 2. לא אשנה בשלב זה את המסמך בעניין כדי לא לבלבל אנשים יותר מדי, אבל אני מציע שתכתוב בדו"ח משפט שמסביר שבחרתם לעשות כך ולמה. אם זה גורר צורך בשינויים והרצות חוזרות ואתם מעוניינים לוותר על זה - גם בסדר. |

