به‌ کارگیری داده‌کاوی در پایگاه‌های داده عظیم

به‌کارگیری داده‌کاوی در پایگاه‌های داده عظیم 

تعداد صفحات : 72 با فرمت ورد و قابل ویرایش

 

در نسل اول یا نسل سنتی، فقط انجام پرس‌وجوهای ساده امکان‌پذیر بود، مثلاً تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه‌ای برخط (OLAP) امکان پرس‌وجوی همزمان چندبعدی فراهم گردید. در این روش به‌عنوان‌مثال به سؤالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟» به‌صورت لحظه‌ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می‌شود؛ اما در نسل سوم یا همان داده‌کاوی فقط مسئله پرس‌وجو و دریافت گزارش‌ها از داده‌ها نیست، بلکه از حجم انبوه داده‌ها، الگویی کشف می‌شود که هیچ‌وقت امکان کشف این الگوها در پردازش لحظه‌ای برخط (OLAP) یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده‌کاوی به دست می‌آیند و کاربرد دارند عبارت‌اند از: وابستگی، تسلسل و توالی، طبقه‌بندی، خوشه‌بندی و پیش‌بینی. برای استخراج این الگوها اغلب از روش‌های نوینی مانند شبکه عصبی و درخت‌های تصمیم استفاده می‌شود. در عمل برای امکان انجام داده‌کاوی و استفاده از تکنیک‌های فوق‌الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبار داده در حقیقت پایگاه داده‌ای است که داده‌های جاری و همچنین سوابق قبلی تراکنش‌ها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می‌کند.

داده‌کاوی، فرآیند مرتب‌سازی و طبقه‌بندی داده‌های حجیم و آشکارسازی اطلاعات مرتبط باهم می‌باشد. امروزه داده‌کاوی به‌عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق‌تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده‌های موجود در سازمان با به‌کارگیری ابزارهای نرم‌افزاری، موردبررسی و تحلیل دقیق قرار می‌گیرد تا الگوهای پنهان و پیچیده‌ای که در آن‌ها وجود دارد کشف و استخراج گردد. داده‌کاوی را می‌توان نسل سوم تکنولوژی‌هایی نامید که با داده سروکار دارند.

 

 

چکیده

فصل اول: مقدمه‌ای بر داده‌کاوی

1-1- دلیل پیدایش داده‌کاوی

1-2- روند کشف دانش

1-3- جایگاه داده‌کاوی در میان علوم مختلف

1-4- چه‌کارهایی را نمی‌توان با داده‌کاوی انجام داد

1-5- داده‌کاوی در مقابل انبار داده

1-6- داده‌کاوی در مقابل پردازش لحظه‌ای برخط (OLAP)

1-7- کاربرد هوش مصنوعی و آمار در داده‌کاوی

فصل دوم: توصیف داده‌ها در داده‌کاوی

2-1- خلاصه‌سازی و به تصویر درآوردن داده‌ها

2-2- خوشه‌بندی

2-3- تحلیل لینک

فصل سوم: مدل‌های پیش‌بینی داده‌ها

3-1- کلاس‌بندی

3-2- رگرسیون

3-3- دنباله زمان

فصل چهارم: مدل‌ها و الگوریتم‌های داده‌کاوی

4-1- شبکه‌های عصبی

4-2- درخت‌های تصمیم

4-3- مارس

4-4- استنتاج قوانین

4-5- K- نزدیک‌ترین همسایه و استدلال مبتنی بر حافظه

4-6- رگرسیون منطقی

4-7- تحلیل تفکیکی

4-8- مدل افزودنی کلی

4-9- افزایشی

فصل پنجم: سلسله‌مراتب انتخاب‌ها

فصل ششم: مراحل فرآیند کشف دانش از پایگاه داده‌ها

6-1- انبارش داده‌ها

6-2- انتخاب داده‌ها

6-3- تبدیل داده‌ها

6-4- کاوش داده‌ها

6-5- تفسیر نتیجه

فصل هفتم: عملیات داده‌کاوی

7-1- مدل‌سازی پیشگویی‌کننده

7-2- تقطیع پایگاه داده‌ها

7-3- تحلیل پیوند

7-4- تشخیص انحراف

فصل هشتم: قابلیت‌های داده‌کاوی

8-1- داده‌کاوی و انبار داده‌ها

8-2- داده‌کاوی، آمار و هوش مصنوعی

8-3- کاربردهای داده‌کاوی

8-4- داده‌کاوی موفق

8-5- تحلیل ارتباطات

فصل نهم: طبقه‌بندی

9-1- تئوری بیز

9-2- رگرسیون

9-3- گروه‌بندی داده‌ها

9-4- بخش‌بندی

9-5- سلسله مراتبی

9-6- گروه‌بندی بر اساس تراکم

9-7- کاوش قوانین پیوندی

9-8- آپریوری

9-9- دی. اچ.پی

9-10- خلاصه‌سازی و کلی‌نگری داده‌ها در سطوح مختلف

9-11- رهیافت هرم داده‌ها

9-12- رهیافت استنتاج بر اساس صفت خاصه

9-13- الگوریتم‌های ژنتیک

فصل دهم: ساختن یک پایگاه داده داده‌کاوی

10-1- جستجوی داده

10-2- آماده‌سازی داده برای مدل‌سازی

10-3- ساختن مدل داده‌کاوی

10-4- تائید اعتبار ساده

10-5- ارزیابی و تفسیر

فصل یازدهم: ماتریس‌های پیچیدگی

11-1- ایجاد معماری مدل و نتایج

نتیجه‌گیری

منابع و مراجع

 

فهرست شکل‌ها

شکل (1-1): داده‌کاوی به‌عنوان یک مرحله از فرآیند کشف دانش

شکل (1-2): سیر تکاملی صنعت پایگاه داده

شکل (1-3): معماری یک نمونه سیستم داده کاو

شکل (1-4): داده‌ها از انبار داده‌ها استخراج می‌گردند

شکل (1-5): داده‌ها از چند پایگاه داده استخراج‌شده‌اند

شکل (4-1): شبکه عصبی با یک لایه نهان

شکل (4-2): Wx,y وزن یال بین x و y است

شکل (4-3): درخت تصمیم‌گیری

شکل (4-4): محدوده همسایگی (بیشتر همسایه‌ها در دسته x قرارگرفته‌اند)

شکل (8-1): داده‌ها از انبار داده‌ها استخراج می‌گردند

شکل (8-2): ساختار ارتباطاتی به روش گرافیکی

 

 




ارسال نظر

  1. آواتار


    ارسال نظر
اس تی یو دانلود یک مرجع برای دانلود فایل های دانشجویی و درسی
در صورت بروز هر گونه مشکل در فرآیند خرید با شماره 09010633413 تماس حاصل فرمایید
همچنین در پیام رسان ایتا پاسخگوی شما هستیم
آمار فروشگاه
  •   تعداد فروشگاه: 11
  •   تعداد محصول: 15,081
  •   بازدید امروز : 20,363
  •   بازدید هفته گذشته: 378,734
  •   بازدید ماه گذشته: 934,459