پروژه یادگیری عامل های مصنوعی پژوهش کامل در حوزه کامپیوتر و IT میباشد و در 5 فصل تنظیم شده است. در این پایان نامه، نقش یادگیری به عنوان گسترش دسترسی طراح به محیط های ناشناخته توضیح داده شده است .شما میتوانید فهرست مطالب پروژه را در ادامه مشاهده نمایید.
پروژه بصورت فایل قابل ویرایش ورد(WORD) در 180 صفحه برای رشته کامپیوتر و IT در پایین همین صفحه قابل دانلود میباشد. شایسته یادآوری است که پروژه از ابتدا تا پایان ویرایش وتنظیم , سکشن بندی (section) ، نوشتن پاورقی (Footnote) و فهرست گذاری اتوماتیک کامل شده وآماده تحویل یا کپی برداری از مطالب مفید آن است.
هدف اصلی از ارایه این پایان نامه، انتقال نظراتی است که در سالهای گذشته در تحقیقات مربوط به رشته یادگیری ماشین (زیر شاخه ای از هوش مصنوعی که بر روی برنامه هایی تمرکز می کند که از طریق تجربه به یادگیری می پردازند.) مطرح شده است. در ارایه این نظرات تلاش شده است که با حفظ دقت، از بیش از حد رسمی شدن پرهیز شود، هرجا که مناسب بوده الگوریتم های شبه برنامه نیز گنجانده شده تا نظرات را ملموس تر کند. به جای توضیح این زیر شاخه از هوش مصنوعی به سبک خاص خودش، سعی گردیده است تا تمام دانسته ها در این زمینه در یک چارچوب مشترک ارایه شوند. در این پایان نامه، نقش یادگیری به عنوان گسترش دسترسی طراح به محیط های ناشناخته توضیح وهمچنین نشان داده می شود که این نقش چگونه برای طراحی عامل ها محدودیت ایجاد می کند و از بازنمایی صریح دانش و استدلال پشتیبانی مینماید. این مبحث، روشهای تولید دانش مورد نیاز توسط اجزای تصمیم گیرنده را توصیف می کند، همچنین نوع جدیدی از این اجزاء (شبکه عصبی) را به همراه رویه های یادگیری مربوط به ان معرفی می نماید. بدین منظور به ترجمه بخش یادگیری از کتاب هوش مصنوعی راسل (فصول 18، 19، 20 و 21) مبادرت شده است. پنج مشخصه اصلی این پایان نامه عبارتند از: 1-ارایه دیدگاهی یکپارچه از رشته یادگیری ماشین. 2-تمرکز حول محور عاملهای هوشمند 3-پوشش جامع و به روز مطالب 4-تأکید یکسان هم بر مباحث نظری و هم عملی 5-درک مطالب از طریق پیاده سازی.
واژه های کلیدی:عامل هوشمند، یادگیری استقرایی، دانش قبلی، یادگیری اماری، شبکه های عصبی، یادگیری تقویتی
فهرست مطالب
فصل یکم یادگیری از طریق مشاهدات
1-5- چرا یادگیری درست عمل می کند : نظریه یادگیری محاسباتی.. 29
2-1- یک تدوین منطقی از یادگیری.. 37
2-3-یادگیری مبتنی بر تشریح.. 52
2-4 - یادگیری با استفاده از ارتباط اطلاعات.. 58
2-5- برنامه نویسی منطقی استقرایی.. 63
3-2-یادگیری با داده های کامل.. 81
3-3-یادگیری با متغیرهای پنهان: الگوریتم EM... 91
3-7-مطالعة موردی : تشخیص ارقام دست نویس.... 125
4-2-یادگیری تقویتی غیر فعال.. 134
4-4-تعمیم در یادگیری تقویتی.. 145
فصل پنجم جمع بندی و نتیجه گیری
فهرست شکل ها
شکل 1-2- درخت تصمیمی برای تصمیم درمورد این که ایا برای یک میز منتظر میمانیم یا خیر.10
شکل 1-3- مثالهایی برای دامنه رستوران.. 12
شکل 1-4-تقسیمبندی مثالها بهوسیله تست بر روی صفات.. 13
شکل 1-5- الگوریتم یادگیری درخت تصمیم.. 14
شکل 1-6- درخت تصمیمی که از مجموعه اموزشی مربوط به 12 مثال نتیجه شده است... 15
شکل1-7- منحنی یادگیری برای الگوریتم درخت... 19
شکل 1-8- تصویری از قدرت رسایی افزایش یافته که توسط یادگیری گروهی به دست امده است... 24
شکل 1-9-چگونگی کارکرد الگوریتم بوستینگ... 26
شکل1-10-گونه ADABOOSTروش بوستینگ درمورد یادگیری گروهی.. 27
شکل 1-12- نمای طرح واری از فضای فرض که نشان دهنده "ε–بال"اطراف تابع درست fاست... 30
شکل 1-13- یک لیست تصمیم برای مسأله رستوران.. 32
شکل 1-14-الگوریتمی برای یادگیری لیست های تصمیم.. 34
شکل 2-2- الگوریتم یادگیری جستجوی بهترین فرض جاری.. 41
شکل 2-4- فضای نمونه شامل تمام فرضهای سازگار با مثالها میباشد. 45
شکل 2-5- بسط های اعضای Sو G. هیچ مثال شناخته شده ای در بین دو مجموعه کران قرار نمیگیرد 46
شکل 2-6-یک فرایند یادگیری فزاینده در طول زمان از دانش زمینه اش استفاده میکند و به ان میافزاید 49
شکل 2-7- درختان اثبات برای مسأله ساده سازی.. 55
شکل 2-8- الگوریتمی برای یافتن یک تعیین کننده سازگار کمینه. 61
شکل2-10- مثال های مثبت و منفی ساختار اصلاح منطقی کد شده. 63
شکل 2-11-یک درخت خانواده معمولی.. 64
شکل 2-12- خلاصه ای از الگوریتم FOIL برای یادگیری مجموعه هایی از بندهای هورن.. 68
شکل 2-13- مراحل اولیه در یک فرایند تحلیل معکوس... 70
شکل 2-14-مرحله ای از تحلیل معکوس که یک گزاره جدید Pرا تولید می کند. 73
شکل3-1- احتمالات متعاقب از معادله(3-1)79
شکل 3-3- منحنی یادگیری برای یادگیری خام بیزین که درمورد مسأله رستوران.. 84
شکل 3-4- یک مدل خطی گاوس... 86
شکل 3-5- مثالهایی از توزیعbeta [a, b] برای مقادیر مختلفی از [a, b].87
شکل 3-6- یک شبکه بیزین که مطابق با یک فرایند یادگیری بیزین میباشد. 89
شکل 3-7-(الف) یک شبکه تشخیص ساده برای بیماری قلبی (ب) شبکه معادل با حذف متغیر پنهانHeartDisease. 91
شکل 3-9-نمودارها نشان دهنده لگاریتم درست نمایی داده ها به عنوان تابعی از تکرار EMمی باشند. 94
جدول 3-1-تعداد هشت نوع اب نبات.. 97
شکل 3-11-شبکه بیزین پویا و گسترده ای که یک مدل پنهان مارکوف را بازنمایی می کند. 98
شکل3-13- تخمین چگالی در مورد داده های شکل 3-12-(الف) با استفاده از k نزدیکترین همسایه. 103
شکل3-15- مدل ریاضی ساده ای برای یک عصب فعالیت خروجی.. 106
شکل 3-16- (الف) تابع فعالیت آستانه ای (ب) تابع دو هلالی.. 107
شکل 3-18-یک شبکه عصبی بسیار ساده با دو ورودی، یک لایه پنهان دو واحدی، و یک خروجی.. 109
شکل 3-20-تفکیک پذیری خطی در پرسپترونهای استانه. 111
شکل 3-21- الگوریتم یادگیری نزول گرادیان برای پرسپترونها113
شکل 3-22-مقایسه کارایی پرسپترونها و درختان تصمیم.. 113
شکل 3-24-یک شبکه عصبی چندلایه ای با یک لایه پنهان و 10 ورودی، که برای مسأله رستوران مناسب است 116
شکل 3-25-الگوریتم پس-انتشار برای یادگیری در شبکه های چندلایه ای.. 117
شکل3-27- (الف)یک مجموعه اموزشی دو بعدی (ب) داده های مشابه بعد از نگاشت یک فضای ورودی سه بعدی 122
شکل3-28- نمای نزدیک و تصویر شده ای به درون دو بعد اول از جداکننده بهینه. 122
جدول 3-2- خلاصه نرخهای خطا و برخی از سایر مشخصههای هفت تکنیک مورد بحث... 128
شکل4-2- یک عامل یادگیری تقویتی غیر فعال مبتنی بر برنامه ریزی.. 138
شکل4-3- منحنی یادگیری ADP غیرفعال برای دنیای3*4. 138
شکل 4-7-کارایی عامل ADPاکتشافی که از R+=2و Ne=5 استفاده می کند. 142
شکل4-8- یک عامل Q- یادگیری اکتشافی.. 144
شکل4-9- وضعیت برای مساله تنظیم یک میله بلند روی یک ارابه متحرک... 150
شکل 4-10 تصاویری از یک هلیکوپتر خودمختار که در حال اجرای یک مانور دایره ای بسیار سخت میباشد 151