یادگیری درخت های تصمیم
تعداد صفحات : 45 با فرمت ورد و قابل ویرایش
یادگیری درخت تصمیم یکی از رایج ترین تکنیک های یادگیری ماشین می باشد که به دلیل سادگی و کارامدی باعث شده است علی رغم مشکلاتی که در استفاده از آن همچون صفات دارای نویز و یا صفات فاقد مقدار یا ... وجود دارد به شکل گسترده ای در مسائل مربوط به یادگیری ماشین استفاده شود. در این تحقیق سعی شده است به مسائل اصلی مطرح در زمینهء درخت طراحی مانند بازنمایی، طراحی، عام سازی و مشکلات و راه کارهای برخورد با آنها که توسعه یافته اند پرداخته شود و همچنین از برخی مسائل غیراصلی مانند درختان رگراسیون، نرم افزارهای آزمایشگاهی و تست آماری χ2 نیز ذکری به میان آید.
- چکیده
مقدمه
1-1- اهداف اصلی درختهای تصمیمگیری دستهبندی کننده
1-2- جذابیت درختان تصمیم
1-3- انواع درختان تصمیم
1-3-1- درختان رگراسیون
2- بازنمایی درخت تصمیم
2-1- توسعهء درختان تصمیم با گراف های تصمیم
3- مسائل مناسب برای یادگیری درخت تصمیم
4- چه صفتی بهترین طبقه بندی کننده است؟
4-1-1- بی نظمی همگونی مثال ها را اندازه گیری می کند.
4-1-2- نفع اطلاعات، کاهش مورد انتظار در بی نظمی را اندازه گیری می کند.
4-2- یک مثال تشریحی
4-3- حالت خاصی از ساخت درخت تصمیم
5- جستجوی فضای فرضیه در یادگیری درخت تصمیم
5-1- قابلیت ها و محدودیت های الگوریتم ID3
6- بایاس قیاسی (استنتاجی) در یادگیری درخت تصمیم
6-1- بایاس های محدودیت و بایاس های ارجحیت
6-2- چرا فرضیات کوتاهتر را ترجیح می دهیم؟
7- مسائل در یادگیری درخت تصمیم
7-1- اورفیتینگ داده ها
7-2- روشهای موجود برای ممانعت از اورفیتینگ
7-2-1- انواع روش های هرس کردن
7-2-1-1- تست chi-Square
7-2-2- هرس خطای کاهش یافته
7-2-3- هرس بعدی قانون
7-3- بکاربردن صفات با مقادیر پیوسته
7-4- معیارهای دیگر برای انتخاب صفات
7-5- بکاربردن مثال های آموزشی با صفات فاقد مقدار
7-6- بکاربردن صفات با هزینه های متفاوت
8- عام سازی درخت
8-1- طراحی یک دسته بندی کنندهء درخت تصمیم
8-2- روشهای اصلی برای طراحی دسته بندی کنندهء درخت تصمیم
9- انواع یادگیری در درخت تصمیم گیری
10- مزایا و معایب درخت تصمیم
10-1- مزایای درختان تصمیم نسبت به روش های دیگر داده کاوی
10-2- معایب درختان تصمیم
11- نرم افزارهای مفید برای درخت تصمیم
12- الگوریتم یادگیری درخت تصمیم پایه
13- جمع بندی
14- لغت نامه
15- مراجع