فهرست مطالب
عنوان صفحه
فصل اول بازیابی اطلاعات
1-1) مقدمه.........................................................................9
1-2) بازیابی اطلاعات........................................................... 10
1-3) متدهای بازیابی........................................................... 14
1-4) سیستم بازیابی اطلاعات............................................... 18
1-4-1) معماری کلی یک سیستم بازیابی اطلاعات..................... 18
1-5) ارزیابی سیستم بازیابی اطلاعات..................................... 20
1-5-1) ارزیابی مجموعههای بازیابی رتبهبندی نشده.....................20
1-5-2) ارزیابی نتایج بازیابی رتبهبندی شده................................23
فصل دوم انواع مدلهای بازیابی اطلاعات
2-1) مقدمه..............................................................................29
2-2) مدلهای ذخیره و بازیابی متنی. .............................................29
2-2-1) مدل بولین. ....................................................................30
2-2-1-1) ساخت یک فهرست وارونه..............................................33
2-2-1-2) ساختار دادهای postings list
2-2-1-3) پردازش پرسوجوی بولین. .................................................37
2-2-2) مدل احتمالی.................................................................... 39
2-2-2-1) مروری بر نظریهی احتمال. ..................................................39
2-2-2-2) اصول رتبهبندی احتمالی. ..................................................40
2-2-2-3) انواع مدلهای احتمالی...................................................... 41
2-2-2-3-1) مدل استقلال باینری. ......................................................41
2-2-2-3-1-1) استخراج یک تابع رتبهبندی برای واژههای پرسوجو.............. 42
2-2-2-3-1-2) تخمینهای احتمال در تئوری.......................................... 45
2-2-2-3-1-3) تخمینهای احتمال در عمل........................................... 46
2-2-2-3-2) مدلهای مبتنی بر ساختار درختی وابستگیهای بین واژهها.......47
2-2-2-3-3) مدل غیرباینری Okapi BM25
2-2-2-3-4) مدلهای مبتنی بر شبکههای بیزی. ......................................49
2-2-3) مدل زبانی.............................................................................. 50
2-2-3-1) اتوماتای متناهی و مدلهای زبانی. ..........................................50
2-2-3-2) انواع مدلهای زبانی. .............................................................53
2-2-3-3) توزیع چندجملهای روی کلمات.................................................. 54
2-2-3-4) مدل احتمالی پرسوجو. ..........................................................55
2-2-3-4-1) استفاده از مدلهای زبانی احتمالی پرسوجو در بازیابی اطلاعات.. 55
2-2-3-4-2) تخمین احتمال پرسوجو. .......................................................57
2-2-4) مدل فضای برداری. ......................................................................60
2-2-4-1) فراوانی واژه و وزندهی............................................................. 60
2-2-4-1-1) فراوانی مدرک معکوس........................................................... 61
2-2-4-1-2) وزندهی ............................................................................. 62
2-2-4-2) مدل فضای برداری برای امتیازدهی. ...............................................63
2-2-4-2-1) ضربهای نقطهای و محاسبهی تشابه کسینوسی. .......................63
2-2-4-2-2) پرسوجوها به عنوان بردارها........................................................66
2-2-4-2-3) الگوریتمی برای محاسبهی امتیازهای برداری. ................................68
2-2-4-3-2) نرمالسازی tf ماکزیمم. ...............................................................71
2-2-4-3-3) رویههای وزندهی پرسوجو و مدرک.. ............................................72
2-2-4-4) نرمالسازی مدرک بر محور طول. ......................................................73
3-2) خوشهبندی در بازیابی اطلاعات................................................................ 84
3-3) روشهای خوشهبندی بخشبندی (غیرسلسلهمراتبی)..................................86
3-3-2) الگوریتم خوشهبندی LBG. ......................................................................
3-4) روشهای خوشهبندی سلسلهمراتبی....................................................... 94
3-4-1) خوشهبندی سلسلهمراتبی متراکم. .......................................................95
3-4-1-1) خوشهبندی به روش Single-link.
3-4-1-2) خوشهبندی به روش Complete-Link.
3-4-1-3) خوشهبندی به روش Average-Link.
3-4-1-4) خوشهبندی به روش Group Average Link
3-4-1-5) خوشهبندی به روش Median Distance
3-4-2) خوشهبندی تقسیمکننده................................................101
3-4-2-1) Bisecting K-means..........102
واژهنامه...................................................................................103
منابع. .....................................................................................109
فهرست اشکال
فهرست جداول