ارائه مدلی برای سیستم­های توصیه گر در شبکه های مبتنی بر اعتماد


عنوان:ارائه مدلی برای سیستم­های توصیه گر در شبکه های مبتنی بر اعتماد

تعداد صفحات :149


چکیده:

امروزه با گسترش و رشد روز افزون اطلاعات در فضای مجازی و وجود انبوهی از کالا یا خدماتی که در وب سایتهای تجاری و خدماتی ارائه می­گردند کاربران را با این مشکل مواجه نموده است که چگونه کالا یا خدمت مورد نظر خود را به راحتی و با صرف کمترین زمان ممکن بیابند. در این میان سیستمهای توصیه­گر با هدف تسهیل و یاری رساندن به کاربران در زمینه انتخاب و یافتن کالای مورد نیاز ایشان با استفاده از علوم و روشهای مبتنی بر داده کاوی اطلاعات، ایجاد و توسعه یافته­اند. همچنین در سالهای اخیر ظهور و گسترش شبکه­های اجتماعی و شبکه­های مبتنی بر رابطه اعتماد میان کاربران، باعث گشوده شدن افق جدیدی در ارائه سیستمهای توصیه­گر و توسعه نسل جدیدی از اینگونه سیستمها گردیده است و آنرا به یکی از موضوعات جذاب و مورد توجه محققان تبدیل نموده است.

از میان روشها و مدل­های موجود در زمینه سیستمهای توصیه­گر روش پالایش گروهی به لحاظ سادگی پیاده­سازی از محبوبیت قابل ملاحظه­ای برخوردار است اما این روش در ارائه پیشنهادات مناسب و قابل قبول به کاربران تازه وارد دارای ضعف­های جدی می­باشد. سیستمهای توصیه ­گر مبتنی بر اعتماد، با بهره­گیری از رابطه اعتماد میان کاربران، در جهت رفع نقاط ضعف بیان شده و خصوصا ارائه پیشنهادات مناسب به کاربران تازه وارد گامهای موثری برداشته­اند. در این تحقیق سعی شده است تا از تلفیق و ترکیب روش­های موجود در زمینه پالایش گروهی و همچنین مدلهای مبتنی بر اعتماد و بررسی نقاط ضعف و قوت آنها مدلی نوین و توسعه یافته ارائه گردد که در آن نتایج از خطای کمتر و دقت بالاتری برخوردار بوده و با افزایش معیار پوشش بتوان به درصد بیشتری از کاربران پاسخ مناسب ارائه نمود. برای این منظور در میان انواع روشهای پالایش گروهی، روش مبتنی بر آیتم و برای پیمایش شبکه اعتماد میان کاربران نیز از روش پیمایش تصادفی بهره گرفته شده است، همچنین با تفسیر و تعدیل نظرات کاربران و اتخاذ شیوه­ای مناسب جهت محاسبه مقدار دقیق اعتماد میان کاربران و تغییر در نحوه پیمایش شبکه اعتماد میان ایشان سعی در بهبود و کاهش خطاهای نتایج گردیده است. در نهایت، جهت ارزیابی و برآورد مدل ترکیبی ارائه شده، نتایج و آمارهای حاصل از اجرای مدل پیشنهادی بر روی مجموعه داده های Epinions و Movielens و مقایسه آنها با نتایج مدل پایه TrustWalkerبه عنوان یکی از بهترین مدلهای ترکیبی ارائه شده در زمینه سیستمهای توصیه گر مبتنی بر اعتماد، ارائه می­گردد.

فصل اول: مقدمه ای بر انواع سیستم های توصیه گر

1-1- مقدمه

گسترش سریع و روز افزون اطلاعات ارائه شده بر روی شبکه جهانی اینترنت، کاربران را با مشکلات عدیده و قابل تاملی در خصوص انتخاب منابع و اطلاعات مورد نیاز ایشان مواجه نموده است و چه بسا که بدون راهنمایی و هدایت صحیح، کاربران در اخذ تصمیمات صحیح یا انتخاب کالا و خدمات مورد نیازشان دچار اشتباه شده که این امر تبعات عدیده­ای از جمله نارضایتی، سلب اطمینان کاربران و مشتریان سایتهای موجود بر روی اینترنت را به همراه خواهد داشت. از اینرو وجود ابزار و سیستمهایی برای کمک به کاربران در انتخاب اطلاعات مناسب و مورد نیاز ایشان کاملا ضروری به نظر می­رسد. در سالهای اخیر برای برآورده سازی این نیازها سیستمهای توصیه­گرمطرح و توسعه یافته­اند و الگوریتمها ، مقالات و متون علمی بسیار متنوع و مختلفی در این زمینه مطرح گردیده است .

در این میان، ایجاد و گسترش شبکه­های اجتماعی، شبکه­های اعتماد و وجود انواع روابط میان کاربران این شبکه­ها افق جدیدی را برروی محققان و توسعه دهندگان سیستمهای توصیه­گر گشوده است تا با بهره­گیری از علوم اجتماعی و علوم روان شناختی حاکم در این شبکه­ها و خصوصا وجود رابطه اعتماد میان کاربران بتوانند نسل جدیدی از سیستمهای توصیه­گر را تحت عنوان “سیستمهای توصیه­گر مبتنی بر اعتماد[1]“معرفی و عرضه نمایند. این سیستمها قادر هستند تا به درصد بیشتری از کاربران پاسخ مناسب را ارائه دهند و همچنین نتایج آنها از دقت بالاتری برخوردار می­باشد.

با توجه به کثرت کاربران و افراد عضو شبکه­های مبتنی بر اعتماد و شبکه­های اجتماعی، همچنین تنوع رفتار و ویژگی­های ایشان، تنها یک شیوه یا یک مدل قادر به پاسخگویی و ارائه پیشنهادات دقیق و قابل قبول نمی­باشد که این امر باعث ظهور سیستمهای توصیه­گر ترکیبی[2]گردیده است. در این سیستمها سعی شده است تا با ترکیب انواع مختلفی از سیستمهای توصیه­گر بتوان سیستمی تولید نمود که دارای مزایای حداکثری و معایب حداقلی باشد.

در این پایان نامه سعی شده است تا با تغییر، اصلاح، تلفیق و ترکیب تعدادی از روشها و الگوریتم­های مطرح و قابل قبول در سطح جهانی، مدلی ارائه گردد که نسبت به مدل­های پیشین دارای دقت و درصد پوشش بالاتری باشد و همچنین بتواند نقایص مدلهای پیشین خصوصا در رابطه با ارائه پیشنهاد به کاربران تازه وارد[3] را تا حد قابل قبولی مرتفع نماید.

1-2- سیستمهای توصیه ­گر

تعاریف متفاوتی برای سیستم‌های توصیه‌گر ارائه شده‌است. عده­ای از محققان سیستمهای توصیه­گر را زیرمجموعه‌ای از سیستمهای تصمیم­یار[4] می‌دانند و آنها را سیستم‌های اطلاعاتی[5] تعریف می‌کنند که توانایی تحلیل رفتارهای گذشته و ارائه توصیه‌هایی برای مسائل جاری را دارا می­باشند[1]. به زبان ساده‌تر در سیستم‌های توصیه‌گر تلاش بر این است تا با حدس زدن شیوه تفکر کاربر به کمک اطلاعاتی که از نحوه رفتار وی یا کاربران مشابه و نظرات آنها داریم مناسب‌ترین و نزدیک‌ترین کالا یا خدمت به سلیقه او را شناسایی و پیشنهاد کنیم. این سیستم‌ها در حقیقت سعی دارند فرایندی را که ما در زندگی روزمره خود بکار می‌بریم و طی آن تلاش می‌کنیم تا افرادی با سلایق نزدیک به خود را پیدا کرده و از آنها در مورد انتخاب‌هایمان نظر بخواهیم را شبیه سازی نمایند.

به صورت کلی­تر سیستمهای توصیه­گر زیر مجموعه­ای از سیستمهای پالایش اطلاعات[6]هستند که وظیفه آنها جستجو برای بیان پیش­بینی امتیاز(درجه)[7] یا بیان سلایق و ترجیحات[8] یک کاربر در خصوص یک موضوع[9] ( مانند موسیقی، کتاب یا فیلم) یا یک عنصر اجتماعی مانند افراد و گروهها می­باشد[2]–[4].

1-3- انواع سیستمهای توصیه ­گر از لحاظ عملکردی

سیستمهای توصیه­گر به لحاظ نحوه ارائه نتایج و پیشنهادات به کاربران خود، به شیوه های متفاوتی عمل می نمایند که در ذیل به پاره­ ای از آنها به صورت فهرست وار اشاره می­گردد:

– پیشنهاد لیستی متشکل از n کالا یا محصول برتر (معمولا n برابر 10 است )

– پیشنهادات فصلی و موردی مانند پیشنهاد یک هتل دارای تخفیف جهت تعطیلات

– بیان درصد علاقه­مندی سایر کاربران به یک محصول خاص، به عنوان مثال: “80 درصد کاربران از خرید این محصول راضی بوده اند “

– پیش بینی میزان امتیازی که یک کاربر به یک محصول خاص خواهد داد

در این تحقیق سعی در ایجاد مدلی است که بتواند نظر و امتیاز تخصیص داده شده توسط یک کاربر خاص به یک محصول یا آیتم خاص را پیش­بینی نماید.

1-4- مزایا و اهمیت یک سیستم توصیه ­گر کارآمد

طبق آمار رسمی ارائه شده توسط سایت فروش کتاب Amazon[10] ، 35 درصد از فروش این سایت به واسطه وجود سیستم توصیه­گر و ارائه پیشنهادات مناسب به علاقه­مندان کتاب می باشد[5] همچنین سایت اجاره فیلم Netflix برای بهبود 10 درصدی دقت سیستم توصیه­گر خود موسوم به Cinematch[11]جایزه ای بالغ بر یک میلیون دلار برای محققان در نظر گرفته است. هر دو مثال فوق نشان دهنده اهمیت سیستمهای توصیه­گر و نقش آنها در تجارت می­باشد. در ذیل تعدادی از دلایل اهمیت وجود یک سیستم توصیه­گر مناسب و کارآمد در یک سایت تجارت الکترونیک برشمرده می­گردد:

– راهنمایی کاربران و بازدید کنندگان در انتخاب کالا ، محصول یا خدمت مناسب

– تسریع در زمان انتخاب کالای مورد نظر مشتری مانند انتخاب یک فیلم مناسب در میان میلیونها فیلم موجود در سایت

– جمع­ آوری اطلاعات ارزشمند در خصوص سلایق و رفتار کاربران جهت برنامه­ ریزی­ های آتی

– جذب مشتریان و بازدید کنندگانی که برای اولین بار است از سایت بازدید می­کنند

– افزایش میزان رضایتمندی کاربران و طبیعتا افزایش سود سرمایه گذاران تجاری

– ایجاد احساس اطمینان در مشتری با ارائه آمار نظرات سایر کاربران

– بهبود معیارهای سنجش رتبه و درجه پورتال یا سایت

– توجه به جنبه­ های روان­شناختی کاربران

– افزایش آگاهی کاربر در زمینه مورد علاقه وی

[1] Trust-Based Recommendation Systems(TBRS)

[2] Hybrid Recommender System

[3] Cold Start Users

[4] Decision Support Systems(DSS)

[5] Information Systems(IS)

[6] Information Filtering Systems

[7] Ratings

[8] Preferences

[9] Item

[10]http://www.amazon.com

[11] http://www.netflixprize.com

فهرست مطالب:

فصل اول : مقدمه­ای بر انواع سیستم توصیه­ گر

1-1- مقدمه

1-2- سیستمهای توصیه­ گر

1-3- انواع سیستمهای توصیه ­گر از لحاظ عملکردی

1-4- مزایا و اهمیت یک سیستم توصیه­ گر کارآمد

1-5- معایب و مشکلات کلی سیستمهای توصیه ­گر

1-6- انواع رویکردها و مدلهای موجود در زمینه پیاده­ سازی سیستمهای توصیه­ گر

1-7- تشریح و بیان مسئله

1-8- اهداف تحقیق

1-9- سوالات و فرضیه­ های تحقیق

1-10- مراحل تحقیق

1-11- فصول پایان نامه

فصل دوم : مروری بر ادبیات تحقیق و مبانی نظری تحقیق

2-1- مقدمه

2-2- پالایش گروهی (Collaborative Filtering)

2-2-1- پالایش گروهی مبتنی بر حافظه(Memory Based)

2-2-1-1- روش پالایش گروهی مبتنی بر آیتم

2-2-1-2- امتیازدهی به صورت پیش فرض

2-2-1-3- تشدید حالت(Case Amplification)

2-2-2- پالایش گروهی مبتنی بر مدل(Model Based)

2-3- پالایش محتوایی (Content Based Filtering)

2-4- تکنیکهای ترکیبی

2-5- سیستمهای توصیه­ گر مبتنی بر رابطه اعتماد میان کاربران

2-5-1- چگونگی کارکرد سیستم توصیه­ گر مبتنی بر اعتماد

2-5-2- مزایا و معایب

2-5-3- انتشار اعتماد و تجمیع اعتماد

2-6- چالش ها و محدودیتهای موجود

2-6-1- نقصان و کاستی اطلاعات

2-6-2- مشکل کاربران تازه وارد

2-6-3- کلاهبرداری و تقلب

2-6-4- پیچیدگی های محاسباتی و زمانی

2-7- معیارهای ارزیابی سیستمهای توصیه­ گر

2-7-1- خطای جذر میانگین مربعات (RMSE)

2-7-2- معیار درصد پوشش

2-7-3- معیار دقت

2-7-4- معیار F-Measure

فصل سوم : مروری بر مطالعات و تحقیقات پیشین

3-1- مقدمه

3-2- مرور کارهای گذشته

3-2-1- مدل MoleTrust

3-2-2- مدل TidalTrust

3-2-3- مدل دانه سیب

3-2-4- مدل ارائه شده توسط Anderson

3-2-5- مدل ارائه شده توسط O’Donovan

3-2-6- مدل TrustWalker

3-2-6-1- ساختار مدل TrustWalker

3-2-6-2- تشابه آیتم ها

3-2-6-3- خصوصیات ویژه مدل TrustWalker

3-2-6-3-1- فراگیری و عمومیت مدل

3-2-6-3-2- اطمینان به نتایج حاصل

3-2-6-3-3- تفسیرپذیری و قابل توضیح بودن نتایج

3-2-6-4- نمایش ماتریسی مدل TrustWalker

3-2-6-5- نتیجه گیری در خصوص مدل TrustWalker

فصل چهارم : تشریح مدل ترکیبی پیشنهادی و چگونگی توسعه و بهبود مدل پایه

4-1- مقدمه

4-2- تشریح مدل کلی TrustWalker

4-2-1- علائم نشانه گذاری و متغیرهای مدل

4-2-2- روند یک پیمایش تصادفی در شبکه

4-2-3- انتخاب تصادفی یک کاربر

4-2-4- انتخاب یک آیتم مشابه

4-2-5- تشابه آیتم ها

4-2-6- محاسبه احتمال ماندن در یک گره شبکه اعتماد

4-2-7- چگونگی انجام پیش­بینی امتیاز

4-2-8- چگونگی محاسبه احتمال

4-2-9- چگونگی محاسبه عملی

4-2-10- شرط اتمام کلی مدل

4-3- بهبود و توسعه مدل TrustWalker

4-3-1- استفاده از فرمول jaccard جهت محاسبه تشابه آیتم ها

4-3-2- حذف میانگین از فرمول پیرسون

4-3-3- استفاده از تکنیک مبتنی بر آیتم خالص

4-3-4- تعدیل و تفسیر نظرات کاربران

4-3-5- محاسبه دقیق مقدار اعتماد یا امتیاز رابطه میان دو کاربر

4-3-6- محاسبه ترکیبی امتیاز رابطه میان کاربران

فصل پنجم : تشریح روند انجام آزمایشات و نتایج حاصل

5-1- مقدمه

5-2- معرفی مجموعه داده epinions

5-2-1- ویژگیهای مجموعه داده epinions

5-2-2- آماده سازی و نحوه پالایش داده­ها

5-2-3- ایجاد مجموعه داده نمونه

5-3- مجموعه داده movielens

5-3-1- ویژگیهای مجموعه داده movielens

5-4- نیازمندیهای نرم افزاری

5-5- نیازمندیهای سخت افزاری

5-6- متدولوژی نرم افزاری

5-7- پارامترهای پیش فرض انجام آزمایشات

5-8- نتایج اجرای آزمایشات با مجموعه داده epinions و movielens

5-8-1- بررسی تاثیر عمق پیمایش بر روی نتایج حاصل در خصوص کاربران تازه وارد

5-8-2- بررسی تاثیر تاریخ اعلام نظرات توسط کاربران

5-8-3- بررسی تاثیر تغییر فرمول محاسبه تشابه آیتمها

5-8-4- بررسی تاثیر بکارگیری مکانیزم تفسیر و تعدیل نظرات کاربران

5-8-5- بررسی تاثیر بکارگیری انواع روشهای ترکیبی برای انتخاب کاربران و پیمایش شبکه

5-8-5-1- نحوه محاسبه امتیاز رابطه موجود میان کاربران

5-8-5-2- بررسی تاثیر بکارگیری روشهای ترکیبی در عملکرد سیستم برای تمامی کاربران

5-8-5-3- بررسی تاثیر بکارگیری روشهای ترکیبی در عملکرد سیستم برای کاربران تازه وارد

5-8-6- بررسی تاثیر بکارگیری توام مکانیزم تفسیر امتیازات کاربران به همراه استفاده از روشهای ترکیبی انتخاب کاربران و پیمایش شبکه اعتماد

5-9- انجام آزمایشات با مجموعه داده movielens

5-9-1- نتایج حاصل از اجرای روشهای ترکیبی مورد استفاده در مدل توسعه یافته

فصل ششم : نتیجه گیری نهایی و کارهای آینده

6-1- مقدمه

6-2- عملکرد مدل توسعه یافته

6-2-1- عملکرد مدل توسعه یافته در خصوص تمامی کاربران

6-2-2- عملکرد مدل توسعه یافته در خصوص کاربران تازه وارد

6-3- نتیجه گیری نهایی

6-3-1- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده epinions

6-3-2- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده movielens

6-4- پیشنهادات کارهای آینده

اختصارات

فهرست منابع




ارسال نظر

  1. آواتار


    ارسال نظر
اس تی یو دانلود یک مرجع برای دانلود فایل های دانشجویی و درسی
در صورت بروز هر گونه مشکل در فرآیند خرید با شماره 09010633413 تماس حاصل فرمایید
همچنین در پیام رسان ایتا پاسخگوی شما هستیم
آمار فروشگاه
  •   تعداد فروشگاه: 11
  •   تعداد محصول: 15,080
  •   بازدید امروز : 40,917
  •   بازدید هفته گذشته: 377,616
  •   بازدید ماه گذشته: 960,912