داده کاوی و الگوریتم های داده کاوی
تعداد صفحات : 40 با فرمت ورد و قابل ویرایش
عموماً data mining )که برخی مواقع بازیافت داده یا دانش گفته می شود) فرایندی ازآنالیز داده از دیدهای مختلف وسپس خلاصه کردن آنها به صورت اطلاعات مفید می باشد . اطلاعات بدست آمده برای بالا بردن بازده، کاهش قیمت یا هردوبه کار می رود. نرم افزارdata mining یکی از ابزارهای متعدد آنالیز برای آنالیز کردن داده می باشد و به کاربراجازه می دهد که داده را از زوایا یا دیمانسیونهای مختلفی آنالیز کند. سپس آنها را دسته بندی کند و نهایتاً ارتباطات شناخته شده را خلاصه وجمع بندی کند. از لحاظ تکنیکی، data mining فرایندی ازجستجوی همبستگی یا طرح بین مجموعه بسیارزیادی ازفیلدها درپایگاه داده های رابطه ای بزرگ می باشد .Data Mining درگیر به کارگیری ابزارهای آنالیز داده برای یافتن و نمایش ناشناخته های قبلی، ارتباطات و طرحهای معتبر در مجموعه داده ای بزرگ می باشد.
Data Mining در بخشهای عمومی و خصوصی به صورت رایج به کار برده می شود. صنایعی نظیر دارو ، اقتصاد،بانک و ... از Data Mining برای کاهش هزینه ها، بالابردن کیفیت و بالا بردن فروش استفاده می کنند. در بخش عمومی، نیز در وهله اول به عنوان ارزیابی زیان و ضرر و منفعت به کار برده می شود.
برای مثال یک سبزی فروشی زنجیره ای ازخاصیت data mining درنرم افزار اوراکل برای آنالیز طرحهای خرید محلی استفاده نمود. آنها به این واقعیت پی بردند که زمانی که افراد درروزهای شنبه و سه شنبه سیب زمینی می خرند،تمایل به خرید پیاز هم دارند. آنالیزهای بعدی نشان داد که خریداران معمولاً خرید هفتگی خودرا در روزهای شنبه انجام می دهند و در روزهای سه شنبه تنها مقدار کمی خرید می کنند.
از دید برخی متخصصین ، Data Mining به عنوان یک گام در یک فرایند شناخت بزرگتر با نام Knowledge discovery database (KDD) مطرح می شود.
می توان در یک دسته بندی کلی گامها در فرایند KDD ، به ترتیب پیشرفت ،را به صورت زیر برشمرد :
1. Data Cleaninig
2. Data Integration
3. Data Selection
4. Data Transformation
5. Data Mining
6. Pattern Evaluation
7. Knowledge Presentation
|
|
فصل اول : داده کاوی چیست؟
|
|
|
|
1-1-Data mining چیست؟
|
|
1-2- داده،اطلاعات و دانش
|
|
1-3-Data warehouses
|
|
فصل دوم : کارکردن با Data Mining
|
|
|
|
2-1- Data Mining چگونه کار می کند چه کاری انجام می دهد ( آشنایی با قوانین آن ) ؟
|
|
2-2- 1- عناصر Data Mining
|
|
2-2-2- متدهای درخت تصمیم
|
|
2-2-3- پارامترهای Data Mining
|
|
2-2-4- وظایف داده کاوی
|
|
2-5- یافتن درخت تصمیم از Training Set
|
|
2-6- قوانین DataMining
|
|
2-6- 1- قوانین کلاس بندی و رگرسیون
|
|
2-6-2- قوانین با ساختار درختی
|
|
فصل سوم : ساختار الکوریتم ها در Data Mining
|
|
|
|
3-1- تصمیم گیری
|
|
3-1-1 درختان تصمیم گیری
|
|
3-1-2- الگوریتمی برای ساختن درختان تصمیم
|
|
3-2- clustering
|
|
3-2- 1- کلاستر بندی
|
|
3-2- 2- یک نمونه الگوریتم کلاستربندی انحصاری : BIRCH
|
|
3-3- ترتیب ها
|
|
3-3- 1- جستجوی تشابه روی ترتیب ها
|
|
3-3- 2- الگوریتمی برای پیدا کردن ترتیب های مشابه
|
|
3-4- اهداف clustering
|
|
3-5- کلاستربندی سلسله مراتبی
|
|
3-5- 1- الگوریتم کلاستربندی سلسله مراتبی
|
|
3-5- 2- یک مثال از الگوریتم کلاسترینگ سلسله مراتبی
|
|
3-5- 3- معایب الگوریتم کلاسترینگ سلسله مراتبی
فصل چهارم : مدل ها و الگوریتم های داده کاوی
4 – 1 مدل ها و الگوریتم های داده کاوی
4-1 -1 شبکه های عصبی
4-2-1 Decision trees
4-3 – 1 Multivariate Adaptive Regression Splines(MARS)
4-4 – 1 Rule induction
4-5 – 1 K-nearest neibour and memory-based reansoning(MBR)
4-6 – 1 رگرسیون منطقی
4-7 – 1 تحلیل تفکیکی
4-8 – 1 مدل افزودنی کلی (GAM)
4 -9 – 1 Boosting
4- 2 سلسله مراتب انتخابها
نتیجه گیری
فهرست منابع
|
|