بررسی روش های استخراج ویژگی در بازشناسی حروف و ارقام فارسی

بررسی روش های استخراج ویژگی در بازشناسی حروف و ارقام فارسی
تعداد صفحات : 44 با فرمت ورد 
 
شناسایی متون چاپی انگلیسی، به علت جدا بودن حروف، ازمسائل ساده تر این حوزه محسوب میشود. اما در مورد زبان فارسی، به علت پیوستگی حروف (حتی در متون چاپی)،شناسایی متن هنوز به عنوان یک موضوع نسبتاً دشوار مطرح است. عمده تحقیقات مربوط به زبان فارسی را پژوهشهای داخلی تشکیل میدهند، هرچند پژوهشهای زبان عربی نیز به اندازه کافی به این موضوع شباهت دارد. دستخطهای فارسی وعربی دارای اختلافات جزئی هستند. از نقطه نظر بازشناسی،دستخط عربی کمی بیشتر پیچیده است، اما شباهتهای مابین این دو زبان بر تفاوتهایشان ارجح بوده و از اهمیت بیشتری برخوردار است.
بازشناسی متون دستنویس معمولاً در دو حالت برخط (به طور هم زمان با نگارش متن) و برونخط (پس از نگارش متن)اجرا میشود. بازشناسی در سیستمهای برخط مبتنی بر حرکت قلم (پویایی و تحرک نوشته) بوده و بر رشتهای از مختصات نقاط مسیر حرکت قلم در حین نگارش اعمال میگردد. بازشناسی درسیستمهای برونخط بر تصاویر اسکن شده اسناد اعمال میشودو به عبارت دیگر اطلاعات پس از نوشتن، به کمک مراحل پیشپردازشی تفکیک کننده متن از پس زمینه، از تصاویر اخذ می گردد. پروسه نازک سازی و استخراج اسکلت یکی از ضروریترین عملیات پیشپردازشی است که در بازشناسی برونخط به منظورحذف اثر پهنای قلم اجرا میشود، اما در بازشناسی برخط به دلیل اینکه قلم نگارنده خود دارای پهنای نگارشی یک پیکس است، این عملیات اجرا نمیگردد.
هدف اصلی استخراج ویژگی جایگزینی تصویر یک کاراکتر با یک بردار که با فرمولهای ریاضی یا آماری به دست می آید، تا بتوان بین کاراکتر های دیگر تفاوت قائل شد. روش استخراج ویژگی خوب است که بین کاراکتر های یک گروه بیشترین شباهت  باشد ( کمترین تفاوت ) و بین کاراکتر ها در گروه های متفاوت بیشترین تفاوت را داشته باشد.
 
 

1      مقدمه

2      تبدیل موجک

2.1          مقدمه :

2.2          روش استخراج ویژگی با استفاده از تبدیل موجک مبتنی برا بهبود لبه کیرش :

2.3          تبدیل موجک پیچیده و عملیات استخراج ویژگی :

2.4          روش هندسی استخراج ویژگی :

2.5          بحث و نتیجه گیری :

3      استخراج ویژگی ساختاری کاراکتر دستنویس فارسی با استفاده از عملگر مورفولوژی :

3.1          جداسازی نقطه های حرف :

3.2          نازک سازی :

3.3          اعمال عملگرهای مورفولوژی Hit/Miss :

3.4          نتیجه گیری و مشاهدات :

4      استخراج ویژگی با استفاده از گرادیان تصویر :

4.1          نتایج بدست آمده :

5بازشناسی برون خطی کلمات دستنویس فارسی برمبنای فشرده سازی تصاویرواستخراج ضرایبCA

4.2          بررسی پژوهشهای پیشین

4.3          روش پیشنهادی

4.4          نتیجه گیری

5بهینه‌سازی پارامترهای موثر در استخراج ویژگی از ارقام دست‌نویس فارسی با استفاده از الگوریتم ژنتیک

4.5          استخراج ویژگی

4.5.1              تصویر کوچک شده

4.5.2              نیمرخ‌های چهارگانه

4.5.3              تصویر مقطع عمودی و افقی

4.5.4              ویژگی‌های دیگر

4.6          الگوریتم ژنتیک

4.6.1              بازنمایی

4.6.2              ارزیابی

4.6.3              ترکیب

4.6.4              جهش

4.6.5              انتخاب برای بقا

4.6.6              سایر تنظیمات

4.6.7              نتایج تجربی

4.7          نتیجه‌گیری و کارهای آینده

5      کاربردهای شبکه عصبی در OCR

5.1          پیشپردازش

5.1.1              بهبود تصویر

5.1.2              اصلاح چرخش

5.1.3              باریکسازی

5.2          بخش بندی

5.3          دستهبندی

5.3.1              بازنمایی الگو و رمزگذاری

5.3.2              رمزگذاری ویژگیهای ساختاری

5.3.3              ساختارهای ترکیبی

5.4          جمعبندی و پیشنهادها

6      الگوریتم ژنتیک(Genetic Algorithm)

7      شبکه عصبی

7.1          معرفی شبکه پرسپترون

8                 OCRچیست؟

8.1          تشخیص نوری نویسه‌ها (Optical Character Recognition)

10   منابع:




ارسال نظر

  1. آواتار


    ارسال نظر
اس تی یو دانلود یک مرجع برای دانلود فایل های دانشجویی و درسی
در صورت بروز هر گونه مشکل در فرآیند خرید با شماره 09010633413 تماس حاصل فرمایید
همچنین در پیام رسان ایتا پاسخگوی شما هستیم
آمار فروشگاه
  •   تعداد فروشگاه: 11
  •   تعداد محصول: 15,080
  •   بازدید امروز : 11,886
  •   بازدید هفته گذشته: 348,585
  •   بازدید ماه گذشته: 931,881