پایان نامه ارائه چارچوبی در راستای بهبود پیشبینی وضعیت ترافیک
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 110 صفحه
چکیده
امروزه موفقیت سیستم های حمل و نقل هوشمند، نه تنها به اطلاعات وضعیت فعلی ترافیک، بلکه تا حد زیادی به آگاهی از وضعیت ترافیکی دقایق آینده وابسته است. از این رو، تحقیقات زیادی در زمینه ی پیش بینی کوتاه مدت وضعیت ترافیکی انجام شده است. هرچند تاکید اکثریت آنها، تنها بر روی اعمال الگوریتم های مختلف بمنظور یادگیری داده های ترافیکی و ارائه ی مدل، بر اساس داده های جمع آوری شده از وضعیت فعلی و پیشین می باشد. حال آنکه، در جهت رسیدن به الگوریتمی کارا، لازم است تا ماهیت نوساناتی و وابسته به زمان داده ها نیز در روند یادگیری مدل لحاظ شود. در این راستا، این پایان نامه با مطالعه ی توزیع جریان های ترافیکی، سعی در جداسازی رفتارهای مربوط به پریودهای اوج و غیر اوج ترافیکی و همچنین استفاده از مفاهیم و دانش بدست¬آمده برای آموزش مدل های متمایز متناظر با رفتارهای مختلف ترافیکی دارد. شایان ذکر است که حتی در صورتی که زمان مرتبط با دادهها صریحاً در اختیار نباشد، روش پیشنهادی با بررسی توزیع داده روند جریانهای ترافیکی را تشخیص می دهد. بدین ترتیب، رندوم فارست بعنوان مدل پیش-بینی کننده، از زمینه ی داده ی مورد آموزش باخبر بوده و بر این اساس احتمال گیر اُفتادن آن در بهینه ی محلی کمتر می شود. به منظور ارزیابی روش ارائه شده، آزمایشاتی بر روی داده ی بخش ترافیک مسابقه بین-المللی داده کاوی سال ۲۰۱۰ انجام شد. نتایج حاصل، مؤید کارایی و مقیاس پذیری روش پیشنهادی در مقایسه با دیگر نتایج بدست آمده توسط تیم های برتر مسابقه، می باشد.
کلید واژه: بهبود- پیشبینی وضعیت ترافیک
فهرست مطالب
فصل اول. مقدمه
۱-۱- تعریف مسئله 2
۱-۲- چالشهای مسئله 4
۱-۳- نگاهی به فصول پایان¬نامه 7
فصل دوم. مبانی نظری تحقیق
۲-۱- مقدمه 10
۲-۲- متدهای یادگیری تجمعی 11
۲-۲-۱- تعاریف مفاهیم اولیه 11
۲-۲-۲- درخت بوستینگ 13
۲-۲-۳- درخت بگینگ 13
۲-۳- رندوم فارست 15
۲-۳-۱- مراحل توسعهی رندوم فارست 16
۲-۳-۲- تئوریهای مرتبط با رندوم فارست 19
۲-۳-۳- رندوم فارست برای رگرسیون 22
۲-۳-۴- مزایا و کاربردهای رندوم فارست 23
۲-۴- نتیجه گیری 24
فصل سوم. پیشینه تحقیق
۳-۱- مقدمه 26
۳-۲- تعریف مسئله 26
۳-۳- روشهای مبتنی بر آنالیزهای سری زمانی 29
۳-۴- روشهای مبتنی بر مدلهای شبکه عصبی 32
۳-۵- روشهای مبتنی بر الگوریتمهای داده¬کاوی 34
فصل چهارم. معرفی تکنیک پیشنهادی
۴-۱- مقدمه 40
۴-۲- خصوصیات کلی پایگاه داده 41
۴-۳- پایگاه داده¬ی مورد استفاده 42
۴-۳-۱- دادهی آموزشی 44
۴-۳-۲- دادهی آزمایشی 44
۴-۴- تکنیک پیشنهادی 45
۴-۴-۱- بررسی توزیع جریانهای ترافیکی 47
۴-۴-۲- مرحله پیش پردازش و استخراج ویژگی 50
۴-۴-۳- مرحله شناسایی و تقسیم بندی به Context های مختلف 52
۴-۴-۴- مرحله یادگیری با بکارگیری Context-Aware Random Forest 56
فصل پنجم. نتایج تجربی
۵-۱- مقدمه 59
۵-۲- پایگاه داده 60
۵-۳- معیارهای ارزیابی 61
۵-۳-۱- معیار ارزیابی خطای پیش¬بینی 61
۵-۳-۲- مقایسه کارآیی معیارهای سنجش فاصله بر روی مشاهدات ترافیکی 62
۵-۴- بررسی تناسب الگوریتم رندوم فارست در مقایسه با دیگر متدها 64
۵-۵- تنظیمات اعمال شده در پیاده سازی الگوریتم (تنظیم پارامترها) 66
۵-۶- ارزیابی سایز گردآمدگی بر روی دادهی اعتبارسنجی 67
۵-۷- استخراج مجموعههای نمونههای آموزشی 70
۵-۸- نتایج یادگیری الگوریتم بر روی مجموعههای نمونههای آموزشی 72
فصل ششم. نتیجهگیری
خلاصه ی مطالب و نتیجه گیری 75
فهرست منابع و مآخذ 78