بهسازی سیگنال گفتار در حوزه زمان فرکانس

بهسازی سیگنال گفتار در حوزه زمان فرکانس
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 118 صفحه


چکیده
یکی از موضوعات مهم پردازش سیگنال) به عنوان مثال در سیستمهای ارتباطی، کدینگ سیگنالهای صوتی، تشخیص صوت (…، کاهش و حذف نویز ناخواسته از سیگنال اصلی و بهبود آن است. به همین منظور در دهه های گذشته تحقیقات گسترده ای برای بهسازی گفتار انجام شده است. بهسازی گفتار بسته به مساله، هدف آن، ویژگی های نویز و امکانات موجود، قابل بررسی است. از این رو، روش های متفاوتی برای طبقه بندی سیستم های بهسازی گفتار وجود دارد، یکی از طرق تفکیک روش¬ها بر اساس تک‌کاناله و چندکاناله بودن می باشد. روش های یک کاناله که تنها یک میکروفون ورودی در دسترس دارند، متداولترین نوع الگوریتم‌های بلادرنگ می‌باشند چرا که به سادگی قابل پیاده‌سازی هستند و به طور نسبی هزینه آنها کمتر از سیستمهایی با چند کانال ورودی می‌باشد. از خانواده ی روش های تک کاناله، میتوان به روش های تفریق طیفی ، فیلتر وینر، بهسازی گفتار با استفاده از مدل های آماری، تبدیل موجک و … اشاره کرد که هر کدام از این روش ها دارای معایب نظیر نویز موزیکال و اعوجاج و پیچیدگی … می باشند یکی از روش هایی که میتوان عیب این روش ها را بهبود بخشید، استفاده از سیستم های ترکیبی است که از ترکیب روش ها حاصل می شود. در این پایان نامه دو روش ترکیبی جدید بر مبنای روش تک کاناله برای بهسازی گفتار پیشنهاد شده است. در ضمن عموما برای اندازه گیری مشخصات نویز از بخش های غیر گفتار (سکوت) که معمولا از پنجره اول سیگنال است، استفاده می شود. ضعف شدید این روش هنگامی آشکار میشود که فریم اول، یک فریم سکوت نباشد. در این پایان نامه روش جدیدی نیز برای بر طرف کردن این عیب پیشنهاد شده است که این روش ها به شرح زیر می باشند: الف)روش پیشنهادی تخمین نویز: تخمین نویز با استفاده از آنالیز LPC صورت گرفته است و در هر دو روش پیشنهادی زیر از این روش برای تخمین نویز استفاده شده است. ب) روش پیشنهادی اول: بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک، از ترکیب روش های تفریق طیفی و تبدیل موجک حاصل شده و تخمین نویز آن هم که توسط آنالیز LPC صورت گرفته است با الگوریتم ژنتیک بهبود یافته است. پ) روش پیشنهادی دوم: بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک، از ترکیب دو روش تبدیل موجک و کمینه کردن لگاریتم خطای میانگین مربعات(LOG-MMSE) حاصل شده است. در این روش با استفاده از تبدیل فوریه ضرایب موجک سیگنال گفتار آغشته به نویز و سیگنال نویز، تخمین زننده ی لگاریتمی بر مبنای کمترین خطای میانگین مربعات پیشنهاد شده است. در این رساله معیار ارزیابی ، معیارهای مهم نسبت سیگنال به نویز(SNR) و تست شنوایی(MOS) بوده است. با توجه به نتایج، این روش ها هم از لحاظ کیفی و هم از لحاظ کمی عملکرد بهتری داشته اند و توانسته اند SNR و MOS و اعوجاج و نویز موزیکال را بهبود ببخشند. کلید واژه: بهسازی سیگنال صوتی، ،تفریق طیفی تبدیل موجک، تخمین زننده log MMSE، آنالیز LPC ، الگوریتم ژنتیک

فهرست مطالب
فصل اول: 1
مقـــــدمه 1
۱-۱ پیشگفتار 1
۱-۲ بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم 2
۱-۳ تعریف مسئله و تقسیم بندی روش ها 3
۱-۴ نوآوری تحقیق 4
۱-۵ ساختار پایانامه 4
فصل دوم 5
پیش زمینه های پردازش سیگنال گفتار 5
۲-۱ نحوه تولید گفتار در انسان 5
۲-۲ معرفی نویز و انواع آن 10
۲-۲-۱ نویز سفید 13
۲-۲-۲ نویز صورتی 13
۲-۲-۳ نویز قهوهای 14
۲-۲-۴ نویز صنعتی 14
۲-۳ تحلیل زمان- فرکانسی سیگنال گفتار 15
۲-۳-۱ تبدیل فوریه 15
۲-۳-۲ تبدیل فوریه زمان-کوتاه 17
۲-۳-۳ آنالیز چند دقت زمان فرکانسی 20
۲-۳-۴ تبدیل موجک یک بعدی 20
۲-۳-۴-۱ تبدیل موجک پیوسته 20
۲-۳-۴-۱-۱ دقت های زمانی و فرکانسی 22
۲-۳-۴-۱-۲ روابط ریاضی تبدیل موجک: 22
۲-۳-۴-۱-۳ عکس تبدیل موجک: 24
۲-۳-۴-۲ تبدیل موجک گسسته 24
۲-۴ الگوریتم بهینه سازی ژنتیک 28
۲-۴-۱ درباره علم ژنتیک 28
۲-۴-۲ تاریخچۀ علم ژنتیک 29
۲-۴-۳ تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی 29
۲-۴-۴ الگوریتم ژنتیک 32
۲-۴-۵ مکانیزم الگوریتم ژنتیک 34
۲-۴-۶ عملگرههای الگوریتم ژنتیک 37
۲-۴-۶-۱ کدگذاری 37
۲-۴-۶-۲ ارزیابی 37
۲-۴-۶-۳ ترکیب 37
۲-۴-۶-۴ جهش 37
۲-۴-۶-۵ رمزگشایی 38
۲-۴-۷ چارت الگوریتم به همراه شبه کد آن 38
۲-۴-۷-۱ شبه کد و توضیح آن 38
۲-۴-۷-۲ چارت الگوریتم ژنتیک 40
۲-۴-۸ تابع هدف 41
۲-۴-۹ روشهای کد کردن 41
۲-۴-۹-۱ کدینگ باینری 42
۲-۴-۹-۲ کدینگ جایگشتی 42
۲-۴-۹-۳ کد گذاری مقدار 43
۲-۴-۹-۴ کدینگ درخت 44
۲-۴-۱۰ نمایش رشته‌ها 45
۲-۴-۱۱ جمعیت 46
۲-۴-۱۱-۱ ایجادجمعیت اولیه 46
۲-۴-۱۱-۲ اندازه جمعیت 46
۲-۴-۱۲ محاسبه برازندگی (تابع ارزش) 47
۲-۴-۱۳ انواع روشهای انتخاب 48
۲-۴-۱۳-۱ انتخاب چرخ رولت 49
۲-۴-۱۳-۲ انتخاب حالت پایدار 51
۲-۴-۱۳-۳ انتخاب نخبه گرایی 51
۲-۴-۱۳-۴ انتخاب رقابتی 51
۲-۴-۱۳-۵ انتخاب قطع سر 52
۲-۴-۱۳-۶ انتخاب قطعی بریندل 52
۲-۴-۱۳-۷ انتخاب جایگزینی نسلی اصلاح شده 53
۲-۴-۱۳-۸ انتخاب مسابقه 53
۲-۴-۱۳-۹ انتخاب مسابقه تصادفی 53
۲-۴-۱۴ انواع روشهای ترکیب 53
۲-۴-۱۴-۱ جابه‌جایی دودوئی 54
۲-۴-۱۴-۲ جابه‌جایی حقیقی 56
۲-۴-۱۴-۳ ترکیب تک‌نقطه‌ای 57
۲-۴-۱۴-۴ ترکیب دو نقطه‌ای 58
۲-۴-۱۴-۵ ترکیب n نقطه‌ای 58
۲-۴-۱۴-۶ ترکیب یکنواخت 58
۲-۴-۱۴-۷ ترکیب حسابی 59
۲-۴-۱۴-۸ ترتیب 59
۲-۴-۱۴-۹ چرخه 60
۲-۴-۱۵ احتمال ترکیب 60
۲-۴-۱۶ تحلیل مکانیزم جابجایی 61
۲-۴-۱۷ جهش 61
۲-۴-۱۷-۱ جهش باینری 63
۲-۴-۱۷-۲ جهش حقیقی 64
۲-۴-۱۷-۳ وارونه سازی بیت 64
۲-۴-۱۷-۴ تغییر ترتیب قرارگیری 64
۲-۴-۱۷-۵ وارون سازی 64
۲-۴-۱۷-۶ تغییر مقدار 65
۲-۴-۱۸ محک اختتام اجرای الگوریتم ژنتیک 65
۲-۴-۱۹ نقاط قوّت الگوریتمهای ژنتیک 66
۲-۴-۲۰ محدودیتهای GAها 68
۲-۵ آنالیز ضرایب پیشگویی خطی (LPC) 69
۲-۵-۱ محاسبه ضرایب LPC 70
فصل سوم 73
مروری برروش های عمده بهسازی گفتار 73
۳-۱ مقدمه 73
۳-۲ روش تفریق طیفی 74
۳-۳ روش فیلتر وینر 76
۳-۴ بهسازی گفتار با استفاده از مدل های آماری 78
۳-۴-۱ تخمین زننده لگاریتمی بر مبنای کمینه کردن خطای میانگین مربعات(Log MMSE) 78
۳-۴-۲ استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار 80
۳-۵ روش زیر فضای سیگنال 82
۳-۶ بهسازی گفتار با استفاده از تبدیل موجک 83
۳-۷ مقایسه روش ها و بررسی نقاط قوت و ضعف 85
۳-۷-۱ بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار 86
۲-۳-۲ چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف 87
۳-۸ نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار 89
۳-۸-۱ استفاده از سیستم های ترکیبی 89
۳-۸-۲ استفاده از پردازش های زیر باند و مزایای آن 89
۳-۸-۳ استفاده از میکروفون دوم 90
فصل چهارم : روش های پیشنهادی 92
۴-۱ مقدمه 92
۴-۲ روش های پیشنهادی 93
۴-۲-۱ بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک 93
۴-۲-۱-۱ روش تفریق طیفی ضرایب موجک (WSS) 94
۴-۲-۱-۲ اصلاح روش تفریق طیفی ضرایب موجک (IWSS) 95
۴-۲-۱-۳ تخمین نویز 96
۴-۲-۱-۴ الگوریتم ژنتیک 97
۴-۲-۱-۴-۱ عملگر انتخاب 97
۴-۲-۱-۴-۲ عملگر برش 98
۴-۲-۱-۴-۳ عملگر جهش 98
۴-۲-۱-۴-۴ جمعیت اولیه 98
۴-۲-۱-۴-۵ تابع هدف 98
۴-۲-۲ بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 98
۴-۲-۲-۱ تخمین زننده Log MMSE در فضای موجک 99
۴-۲-۲-۲ تخمین نویز 100
فصل پنجم: نتایج و آزمایش ها 101
۵-۱ مقدمه 101
۵-۲ جزئیات پیاده سازی 102
۵-۳ نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک 103
۵-۴ نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک 106
فصل ششم: نتیجه گیری و پیشنهادها 109
۶-۱ نتیجه گیری 109
۶-۲ پیشنهاد برای کارهای آتی 111
مراجع 112

 




ارسال نظر

  1. آواتار


    ارسال نظر
اس تی یو دانلود یک مرجع برای دانلود فایل های دانشجویی و درسی
در صورت بروز هر گونه مشکل در فرآیند خرید با شماره 09010633413 تماس حاصل فرمایید
همچنین در پیام رسان ایتا پاسخگوی شما هستیم
آمار فروشگاه
  •   تعداد فروشگاه: 11
  •   تعداد محصول: 15,080
  •   بازدید امروز : 10,370
  •   بازدید هفته گذشته: 260,770
  •   بازدید ماه گذشته: 827,787