خوشه بندی توافقی بر روی دادههای توزیع شده ناهمگن
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 131 صفحه
چکیده
خوشه بندی را میتوان یکی از مهمترین مراحل در تحلیل دادهها برشمرد. روشهای خوشهبندی بسیاری تاکنون توسعه و ارائه داده شدهاند. یکی از این روشها که در مطالعات اخیر مورد توجه و بررسی قرار گرفته است، روش خوشهبندی توافقی میباشد. هدف خوشهبندی توافقی ترکیب چند خوشهبندی اولیه و بدست آوردن یک خوشهبندی نهایی است به گونهای که در آن خوشهها از کیفیت بالاتری، نسبت به خوشهها در خوشهبندیهای اولیه، برخوردار باشند.
ما در این پایان نامه فرآیندی را جهت انجام خوشهبندی توافقی بر روی دادههای توزیع شده ناهمگن ارائه خواهیم نمود که این فرآیند از سه مرحله تشکیل میشود. در مرحلهی اول خوشههای نظیر به نظیر در خوشهبندیهای اولیه تشخیص داده میشود. در مرحلهی دوم هر یک از خوشهبندیهای اولیه وزندار میشوند. در مرحلهی سوم نیز خوشهبندی توافقی با توجه به وزن اختصاص داده شده به خوشهبندیها، انجام میگردد.
در این پایان نامه فرآیند پیشنهادی بر روی دادههایی که به صورت ناهمگن توزیع شدهاند، مورد ارزیابی قرار گرفته است. نتایج ارزیابیهای انجام شده نیز با ۴ الگوریتم دیگر در زمینه ی خوشهبندی توافقی مقایسه شده است. مقایسههای انجام شده بیانگر آن است که فرآیند پیشنهادی در اغلب موارد از کارایی بالاتری نسبت به دیگر الگوریتمها برخوردار است.
کلید واژه:خوشه بندی-داده های توزیع شده ناهمگن
فهرست مطالب
چکیده 1
فصل اول مقدمه 2
۱-۱- مقدمه 3
۱-۲- داده کاوی 3
۱-۳- روشهای داده کاوی 4
۱-۴- خوشه بندی 5
۱-۵- خوشه بندی توافقی 9
۱-۶- تحقیقات انجام گرفته در پایان نامه 12
۱-۷- نتایج بدست آمده 13
۱-۸- ساختار پایان نامه 13
فصل دوم مروری بر کارهای انجام شده 14
۲-۱- مقدمه 15
۲-۲- روشهای خوشهبندی 15
۲-۲-۱- روشهای بخشبندی 17
۲-۲-۲- روشهای سلسله مراتبی 19
۲-۲-۳- الگوریتم خوشهبندی K-Means 19
۲-۳- خوشهبندی توافقی 22
۲-۳-۱- انگیزههای استفاده از خوشهبندی توافقی 23
۲-۳-۲- مسئله خوشهبندی توافقی: ارائهی مثال 25
۲-۳-۳- مروری بر روشهای خوشهبندی توافقی 26
۲-۳-۴- گروهبندی روشهای خوشهبندی توافقی 27
۲-۳-۵- روشهای شباهت محور 31
شباهت دوبهدو(ماتریس همبستگی) 31
گراف محور 35
۲-۳-۶- روشهای توافقی با استفاده از اطلاعات دوجانبه 39
۲-۳-۷- روشهای توافقی با استفاده از مدل ترکیبی 40
۲-۳-۸- روشهای توافقی رأی محور 42
۲-۴- روشهای تولید اجتماع خوشهبندیها 46
۲-۵- خلاصه فصل 49
فصل سوم ارائهی راهکار پیشنهادی: خوشهبندی توافقی بر روی دادههای توزیع شده ناهمگن 51
۳-۱- مقدمه 52
۳-۲- راهکار پیشنهادی 53
۳-۲-۱- تشخیص نظیر به نظیر بودن خوشه¬ها 53
۳-۲-۲- خوشهبندیهای دارای وزن 60
۳-۲-۳- خوشهبندی توافقی بر روی داده های توزیع شده ناهمگن 64
۳-۳- تولید اجتماع خوشهبندیها 67
۳-۴- خلاصه فصل 68
فصل چهارم پیادهسازی راهکار پیشنهادی و نتایج ارزیابی آن 70
۴-۱- مقدمه 71
۴-۲- معیارهای ارزیابی 71
۴-۲-۱- معیار دقت 72
۴-۲-۲- شاخص Davies-Bouldin 73
۴-۲-۳- شاخص Rand 73
۴-۲-۴- متوسط اطلاعات دوجانبه نرمالسازی شده (ANMI) 75
۴-۳- پیادهسازی 76
۴-۴- مجموعههای دادهای 76
۴-۵- نتایج ارزیابی 78
۴-۵-۱- معیار دقت 78
۴-۵-۲- شاخص Davies-Bouldin 81
۴-۵-۳- شاخص Rand 83
۴-۵-۴- متوسط اطلاعات دوجانبه نرمالسازی شده (ANMI) 85
۴-۶- خلاصه فصل 87
فصل پنجم نتیجه گیری و کارهای آینده 88
۵-۱- مقدمه 89
۵-۲- نتیجه گیری 89
۵-۳- کارهای آینده 92
مراجع 94