دانلود پاورپوینت سیستم های متن کاوی
تعداد اسلاید : 66
متن کاوی چیست ؟
در حالیکه حجم داده های متنی غیر ساختیافته به صورت مداوم افزایش می یابد، توانایی انسانها برای بهره برداری از این اطلاعات ثابت مانده است
یک ویراستار انسانی، تنها به وسیلة دنبال کردن دقیق همه صفحات وب و یا سایر منابع متنی می تواند قادر به پاسخگویی دقیق به یک مسألة جدید شود
u متن کاوی = کشف دانش از داده ها متنی = متن داده کاوی
u عبارتست از کشف اطلاعات جدید و ناشناخته با استخراج اتوماتیک اطلاعات از منابع داده های متنی غیر ساختیافته بوسیله کامپیوتر
u داده های متنی غیر ساختیافته = مجموعه ای از مستندات
u متن کاوی بر روی داده های متنی غیر ساختیافته و نیمه ساختیافته تعریف می گردد
u داده های متنی غیر ساختیافته : صفحات وب، یادداشت، صورتحساب و ...
u نیمه ساختیافته: XML, SGML . ...