توسعه تکنیک های وب کاوی به منظور شخصی سازی اطلاعات در موتورهای جستجو
فایل ورد قابل ویرایش در 195 صفحه
چکیده
ماهیت پویای شبکه جهانی و ابعاد رو به رشد آن، بازیابی دقیق اطلاعات را دشوار ساخته است. پاسخ های نادرست برگشت داده شده به وسیله ی موتورهای جستجو، خصوصا برای عبارات پرسوجو با معانی مختلف، باعث نارضایتی کاربران وب شدهاست که نیاز به پاسخ های دقیق برای تقاضاهای اطلاعاتی خود دارند. امروزه موتورهای جستجو تلاش میکنند تا درخواست کاربران را از طریق مطالعه سابقه جستجو و یا حتی شرکت دادن کاربران در فرایند جستجو به منظور روشن ساختن آنچه که آنها واقعا نیاز دارند، دریابند. این روند بخشی از تلاش موتورهای جستجو برای شخصیسازی است.
یکی از موتورهای جستجوی شخصیسازی شده ی خوش تعریف و خوش ساخت، اسنکت[1] است که از مشارکت کاربر برای فرایند شخصیسازی استفاده میکند. در این تحقیق بر اساس الگوریتم شخصیسازی شده اسنکت، یک معماری از موتور جستجوی شخصیسازی شده جدید پیشنهاد شده در این پایان نامه به نام PSEFiL ارائه شدهاست که با دخالت دادن کاربر و فیلتر سازی لینک ها پاسخ هایی با کمترین میزان یا عدم وجود انحراف موضوع به منظور غنی سازی مجموعه جواب، به کاربران تحویل میدهد. علاوه بر این، مجموعه جواب مستحکم است زیرا هر لینک موجود در مجموعه نتایج، یا دارای رتبه بالایی از سایر موتورهای جستجو است و یا کمترین انحراف موضوع را با یک فرایند اسکن دستی دقیق داراست. بعلاوه هر لینک به روشنی برای هر معنی ذهنی موجود از یک عبارت پرسوجو طبقهبندی شدهاست. یکی از اهداف PSEFiL، آماده سازی و تحویل پاسخ های دقیق است نه تحویل مجموعه پاسخی با لینک های بیشتر که ممکن است محتوایشان دقت کم داشته و یا دقیق نباشند.
کلمات کلیدی
موتور جستجو، بهینه سازی موتور جستجو، شخصیسازی موتور جستجو، ساختارکاوی وب, محتوا کاوی وب
فهرست مطالب
چکیده
فصل اول(کلیات)
مقدمه
بیان مسئله و اهمیت آن
اهمیت و ضرورت انجام تحقیق
ساختار پایان نامه
فصل دوم(مبانی و مفاهیم پایه
۲-۱ مقدمه
۹ ۲-۲ وبکاوی
۲-۳ تکامل تاریخی از وبکاوی
۲-۴ مشکلات کاربران در استفاده ازوب
۲-۵ شباهت ها و تفاوت های وبکاوی و داده کاوی
۲-۶ الگوریتم های وبکاوی
۲-۷ دسته بندی وبکاوی
۲-۷-۱ محتوا کاوی وب
۲-۷-۱-۱ دیدگاه های محتوا کاوی وب
۲-۷-۱-۲ دادههای محتوا کاوی وب
۲-۷-۱-۳ رویکردها و تکنیک های محتواکاوی وب
۲-۷-۱-۴ انواع محتواکاوی وب
۲-۷-۲ ساختارکاوی وب
۲-۷-۲-۱ دسته های ساختار کاوی وب بر اساس نوع داده ساختاری
۲-۷-۲-۲ مدل های بازنمایی ساختار وب
۲-۷-۲-۳ کاربردهای ساختارکاوی وب
۲-۷-۳ کاربردکاوی وب
۲-۷-۳-۱ فازهای کاربرد کاوی وب
۲-۷-۳-۲ انواع دادههای کاربردکاوی
۲-۷-۳-۳ کاربردهای کاربردکاوی وب
۲-۸ کاربردهای وبکاوی
۲-۹ چالش های وب کاوی
۲-۱۰ موتور جستجو
۲- ۱۱ تاریخچه موتورهای جستجو
۲-۱۲ موتورهای جستجو را از لحاظ پشتیبانی های مالی و نیروی انسانی
۲-۱۲-۱ موتورهای جستجوی آزمایشی
۲-۱۲-۲ موتورهای جستجوی تجاری
۲-۱۳ معماری کلی موتورهای جستجو و کارکرد آنها
۲-۱۳-۱ درون کاو(خزنده )
۲-۱۳-۲ کنترل درون کاو
۲-۱۳-۳ انباره ی صفحات
۲-۱۳-۴ ماجول شاخص دهی
۲-۱۳-۵ ماجول Collection Analysis
۲-۱۳-۶ Utility Index
۲-۱۳-۷ موتور پرسوجو
۲-۱۳-۸ ماجول رتبه بندی
۲-۱۴ اهمیت موتورهای جستجو
۲-۱۵ مشکلات موتورهای جستجو در ارائه نتایج
۲-۱۶ بهینه سازی موتور جستجو
۲-۱۷ هدف SEO
۲-۱۸ مزیت بهینه سازی وب سایت برای موتورهای جستجو
۲-۱۹ فرآیند بهینه سازی موتورهای جستجو
۲-۲۰ نتیجه گیری
فصل سوم(شخصی سازی موتورهای جستجو)
۳-۱ مقدمه
۳-۲ علت شخصیسازی موتور جستجو
تعریف شخصیسازی
مراحل شخصیسازی
۳-۴-۱ شناخت کاربر
۳-۴-۱-۱ روشهای کمک به کاربران در جستجو در وب
۳-۴-۱-۱-۱ خوشهبندی کد آماده- وب
۳-۴-۱-۱-۲ شخصیسازی فهرست رتبهبندی شده- مسطح از نتایج پرسوجو
۳-۴-۱-۲ راه حل های مشکل خوشهبندی کد آماده وب
۳-۴-۱-۲-۱ خوشه بندی مسطح
۳-۴-۱-۲-۱-۱ کلمات تنها و خوشه بندی مسطح
۳-۴-۱-۲-۱-۲ جملات و خوشه بندی مسطح
۳-۴-۱-۲-۲ خوشهبندی سلسله مراتبی
۳-۴-۱-۲-۲-۱ کلمات تنها و خوشهبندی سلسله مراتبی
۳-۴-۱-۲-۲-۲ جملات و خوشهبندی سلسله مراتبی
۳-۴-۱-۳ معرفی اسنکت
۳-۴-۱-۴ شرح معماری اسنکت
۳-۴-۱-۴-۱ انتخاب جمله و رتبهبندی
۳-۴-۱-۴-۲ خوشه بندی سلسله مراتبی
۳-۴-۱-۴-۳ شخصیسازی نتایج جستجو
۳-۴-۱-۵ مرور اسناد سلسله مراتب برای استخراج اطلاعات
۳-۴-۱-۶ مرور اسناد سلسله مراتب برای انتخاب نتایج
۳-۴-۱-۷ اصلاح پرسوجو
۳-۴-۱-۸ رتبهبندی شخصیسازی شده
۳-۴-۱-۹ واسطه شخصیسازی شده وب
۳-۴-۱-۱۰ نتایج تجربی
۳-۵-۱-۱۰-۱ پیمایش های کاربران
۳-۴-۱-۱۰-۲ مجموعه داده اسنکت و شواهد حکایتی
۳-۴-۱-۱۰ -۳ ارزیابی اسنکت
۳-۴-۱-۱۰ -۳ – ۱ مزایای استفاده از DMOZ….
۳-۴-۱-۱۰ -۳ -۲ مزایای استفاده از شاخص محکم متن
۳-۴-۱-۱۰ -۳ -۳ مزایای استفاده از موتورهای چندگانه
۳-۴-۱-۱۰ -۳ -۴ مزایای استفاده از جملات فاصله دار به عنوان برچسبهای پوشه
۳-۴-۱-۱۰ -۳ -۵ تعداد کدهای آماده وب موجود در پوشهها
۳-۴-۲ مدل سازی کاربر
۳-۴-۲-۱ مدل سازی صریح کاربر
۳-۴-۲-۲ مدل سازی ضمنی کاربر
۳-۴-۲-۲-۱ Caption Nemo
۳-۴-۲-۲ -۱-۱ فضاهای جستجوی شخصی
۳-۴-۲-۲ -۱-۱-۱ مدل شخصی بازیابی
۳-۴-۲-۲ -۱-۱-۲ سبک ارائه شخصی
۳-۴-۲-۲ -۱-۱-۳ موضوع مورد نظر شخصی
۳-۴-۲-۲ -۱-۲ پیاده سازی سیستم
۳-۴-۲-۲ -۱-۲ -۱ رتبهبندی
۳-۴-۲-۲ -۱-۲-۲ طبقهبندی سلسله مراتبی صفحات وب بازیابی شده
۳-۴-۲-۲ -۱-۳ مطالعه کاربر
۳-۴-۲-۲ -۱-۳ -۱ آزمایش
۳-۴-۲-۲ -۱-۳ -۲ آزمایش ۲
۳-۴-۲-۲ -۳ شخصیسازی الگوریتم رتبهبندی صفحه
۳-۴-۲-۲ -۴ الگوریتم LTIL.
۳-۴-۲-۲ -۵ روش IA.
۳-۴-۳ اجرای سیستم شخصیسازی
۳-۴-۳-۱ روش قطعی
۳-۴-۳-۲ روش فازی
۳-۴-۳-۳ شخصیسازی موتورهای جستجو با استفاده از شبکه های مفهومی فازی و ابزارهای داده کاوی
۳-۴-۳-۳ -۱ پیش زمینه
۳-۵-۳-۳ -۲ روش پیشنهادی
۳-۴-۳-۳ -۳ ارزیابی سیستم و بررسی نتایج بهدست آمده
۳-۵ نتیجه گیری
فصل چهارم(مدل پیشنهادی برای شخصیسازی موتورجستجوونتایج بدست آمده از آزمایش ها)
۴-۱ مقدمه
۴-۲ شرح آزمایشها و تجزیه مسئله.
۴-۳ نتیجه گیری
فصل پنجم(رابط کاربری موتور جستجو)
۵-۱ مقدمه
۵-۲ رابط کاربری موتور جستجوی شخصیسازی شده PSEFiL
۵-۳ اهمیت موتور جستجوی شخصیسازی شده PSEFiL
۵-۴ نتیجه گیری
فصل ششم(نتیجه گیری)
۶-۱ مقدمه
۶-۲ مروری بر فصول گذشته
۶-۳ موتور جستجوی پیشنهادی شخصیسازی شده PSEFiL
۶-۴ نتیجه گیری
۶-۵ پیشنهادات و مطالعات آتی
مقالات مستخرج از پایان نامه
فهرست منابع
چکیده انگلیسی