پروژه پیاده سازی و بررسی روش های متن کاوی پژوهش کامل در حوزه متن کاوی و داده کاوی میباشد و در 2 فصل تنظیم شده است.این پروژه به بررسی روشهای انتخاب ویژگی و روشهاوالگوریتم های فرا اکتشافی پرداخته است.شما میتوانید فهرست مطالب پروژه را در ادامه مشاهده نمایید.
پروژه بصورت فایل قابل ویرایش ورد(WORD) در 75 صفحه برای رشته کامپیوتر و IT در پایین همین صفحه قابل دانلود میباشد. شایسته یادآوری است که پروژه از ابتدا تا پایان ویرایش وتنظیم , سکشن بندی (section) ، نوشتن پاورقی (Footnote) و فهرست گذاری اتوماتیک کامل شده وآماده تحویل یا کپی برداری از مطالب مفید آن است.
رشد فزاینده پایگاه داده ها در زمینه های مختلف از فعالیت انسان باعث شده است که نیاز به ابزارهای قدرتمند جدید، برای تغییر دادن داده به دانش مفید، افزایش یابد. جهت برآوردن این نیاز، محققان به کاوش در زمینه های مختلف برای یافتن روش ها و ایده های مناسب پرداختند. متن کاوی یکی از زمینه های است که به دنبال استخراج اطلاعات مفید، از داده های متنی بدون ساختار، به وسیله شناسایی و اکتشاف الگوها می باشد. ایده اصلی متن کاوی، یافتن قطعات کوچک اطلاعات ازحجم زیاد داده های متنی، بدون نیاز به خواندن تمام آن است. در این مقاله با توجه به اهمیت این روش مختصراً به متن کاوی، زمینه های مرتبط با آن و برخی روش های رایج طبقه بندی و خوشه بندی پرداخته شده است. اگرچه بیان همه روش ها و کاربردها ممکن نیست، اما این پژوهش می تواند دید کلی از متن کاوی را در ذهن خواننده ایجاد کرده و در صورت علاقه برای مطالعه بیشتر، فرد را به منابع مناسب هدایت کند.
واژه های کلیدی: بازیابی اطلاعات، خوشه بندی، طبقه بندی، متن کاوی
فهرست مطالب
1-2- روش های مبتنی بر استخراج ویژگی.. 3
1-4- دسته بندی و تشریح الگوریتم های مختلف انتخاب ویژگی.. 12
1-5- تابع ارزیابی مبتنی بر فاصله - تابع تولید کننده کامل.. 14
1-6- تابع ارزیابی مبتنی بر اطلاعات - تابع تولید کننده مکاشفه ای.. 16
1-7- تابع ارزیابی مبتنی بر اطلاعات - تابع تولید کننده کامل.. 20
1-8- تابع ارزیابی مبتنی بر وابستگی - تابع تولید کننده مکاشفه ای.. 21
1-9- تابع ارزیابی مبتنی بر سازگاری - تابع تولید کننده کامل.. 22
1-10- تابع ارزیابی مبتنی بر سازگاری - تابع تولید کننده تصادفی.. 27
1-11- تابع ارزیابی مبتنی بر خطای طبقه بندی کننده- تابع تولید کننده مکاشفه ای.. 29
1-12- تابع ارزیابی مبتنی بر خطای طبقه بندی کننده - تابع تولید کننده کامل.. 31
1-13- تابع ارزیابی مبتنی بر خطای طبقه بندی کننده - تابع تولید کننده تصادفی.. 31
1-14- جمع بندی روش های انتخاب ویژگی.. 34
بررسی روشهاوالگوریتم های فرا اکتشافی
2-3- انواع الگوریتمهای مکاشفهای.. 36
2-4- پیادهسازی الگوریتم های فرا اکتشافی.. 38
2-5- ویژگی های مشترک روش های فرا اکتشافی.. 38
2-6- دستهبندی الگوریتمهای فرا اکتشافی.. 39
2-7- الگوریتم ژنتیک (Genetic Algorithm)40
2-8- روش های پیاده سازی عملگر ترکیب... 47
2-10- الگوریتم ژنتیک برای انتخاب ویژگی.. 51
2-11- الگوریتم بهینه سازی جمعیت مورچگان (ACO)53
2-12- الگوریتم ACO برای انتخاب ویژگی.. 56
2-13- الگوریتم بهینه سازی انبوه ذرات (PSO)57
2-14- الگوریتم PSO برای انتخاب ویژگی.. 58
2-15- الگوریتم جستجوی ممنوعه 62
2-16- استراتژیهای پیشرفته جستجوی ممنوعه. 63
2-17- حافظه ها در جستجوی ممنوعه. 64
2-18- الگوریتم جستجوی ممنوعه برای انتخاب ویژگی.. 65
فهرست شکل ها
شکل1-1 فرایند انتخاب ویژگی.. 6
شکل 1-2 مقایسه توابع ارزیابی مختلف... 11
شکل 1-4 الگوریتم Branch and Bound. 16
شکل 1-5 الگوریتم درخت تصمیم.. 18
شکل 1-6 مثالی از گراف Bayesian Network. 20
شکل 1-7 الگوریتم روش MDLM... 21
شکل 1-9 الگوریتم روش Focus. 23
شکل 1-10 الگوریتمی دیگر از روش Focus. 24
شکل 1-12 کلاسهای مورد بررسی در الگوریتم Focus. 25
شکل 1-13 روند الگوریتم Focus. 26
شکل 1-14 حل ناسازگاری در الگوریتم Focus. 26
شکل 1-16 طبقهبندی روشهای مختلف انتخاب ویژگی.. 33
شکل 2-1 بهینه محلی و بهینه کلی.. 42
شکل 2-6 چگونگی ترکیب تک نقطه ای.. 47
شکل2-8 چگونگی ترکیب دو نقطهای.. 48
شکل 2-10 چگونگی ترکیب یکنواخت... 48
شکل 2-11 چگونگی ترکیب یکنواخت... 49
شکل 2- 13 مرحله اول پیاده کردن کوتاه ترین مسیر. 53
شکل 2- 14 مرحله دوم پیاده کردن کوتاه ترین مسیر. 53
شکل 2- 15 مرحله سوم پیاده کردن کوتاه ترین مسیر. 53
شکل 2- 16 مرحله چهارم پیاده کردن کوتاه ترین مسیر. 53
توجه کنید که فایل هارا را پس از دانلود از حالت فشرده (زیپ)خارج کنید
09371798496 تلگرام
mobnet4kia@yahoo.com
دیگر نرم افزار های پیشنهادی ما به شما دوستان عزیز
دانلود پاورپوینت با موضوع رعایت بهداشت در تولید پنیر لاکتیکی
دانلود پاورپوینت با موضوع توحید و شرکو از محصولات جذاب و بروز ما نیز دیدن کنید.
کلی کادوی خوشگل با قیمت مناسب
بدو بدو که داره تموم میشه
عنوان پروژه: وب کاوی
قالب بندی: word
تعداد صفحات: 41
فهرست مطالب:
1- مقدمه
2- مراحل وب کاوی
3- وب کاوی و زمینه های تحقیقاتی مرتبط
3-1- وب کاوی و داده کاوی
3-2- وب کاوی و بازیابی اطلاعات
3-3- وب کاوی و استخراج اطلاعات
3-4- وب کاوی و یادگیری ماشین
4- انواع وب کاوی
5- چالش های وب کاوی
6- کاوش محتوای وب
6-1- انواع کاوش محتوا در وب
6-1-1- طبقه بندی
6-1-2- خوشه بندی
6-1-3- سایر انواع کاوش محتوا در وب
6-2- رویکردهای کاوش محتوا در وب
6-3- الگوریتم های کاوش محتوا در وب
6-3-1- درخت تصمیم
6-3-2- شبکه عصبی
6-3-3- سایر الگوریتم های کاوش
7- کاوش ساختار وب
7-1- مدل های بازنمایی ساختار وب
7-1-1- مدل های مبتنی بر گراف
7-1-2- مدل های مارکو
7-2- الگوریتم های کاوش ساختار وب
7-2-1- HITS
7-2-2- Page Rank
7-2-3- الگوریتم جریان بیشینه
7-2-4- Average Clicks
7-3- کاربردهای کاوش ساختار وب
7-3-1- تشخیص اجتماعات وب
7-3-2- پیمایش وب
8- کاوش استفاده از وب
8-1- انواع داده های استفاده از وب
8-1-1- داده های سرورهای وب
8-1-2- داده های سرورهای پراکسی
8-1-3- داده های کلاینت
8-2- پیش پردازش داده های استفاده از وب
8-2-1- پاکسازی داده
8-2-2- تشخیص و بازسازی نشست
8-2-3- بازیابی ساختار و محتوا
8-2-4- قالب بندی داده
8-3- روش های کاوش استفاده از وب
8-3-1- قوانین انجمنی
8-3-2- الگوهای ترتیبی
8-3-3- خوشه بندی
8-4- کاربردهای کاوش استفاده از وب
8-4-1- خصوصی سازی محتوای وب
8-4-2- پیش بازیابی
8-4-3- بهبود طراحی سایت های وب
9- کاربردهای وب کاوی
9-1- تجارت الکترونیکی
9-2- موتورهای جستجو
9-3- حراجی در وب
نتیجه گیری
فهرست منابع
فهرست مطالب
عنوان صفحه
فصل اول بازیابی اطلاعات
1-1) مقدمه.........................................................................9
1-2) بازیابی اطلاعات........................................................... 10
1-3) متدهای بازیابی........................................................... 14
1-4) سیستم بازیابی اطلاعات............................................... 18
1-4-1) معماری کلی یک سیستم بازیابی اطلاعات..................... 18
1-5) ارزیابی سیستم بازیابی اطلاعات..................................... 20
1-5-1) ارزیابی مجموعههای بازیابی رتبهبندی نشده.....................20
1-5-2) ارزیابی نتایج بازیابی رتبهبندی شده................................23
فصل دوم انواع مدلهای بازیابی اطلاعات
2-1) مقدمه..............................................................................29
2-2) مدلهای ذخیره و بازیابی متنی. .............................................29
2-2-1) مدل بولین. ....................................................................30
2-2-1-1) ساخت یک فهرست وارونه..............................................33
2-2-1-2) ساختار دادهای postings list
2-2-1-3) پردازش پرسوجوی بولین. .................................................37
2-2-2) مدل احتمالی.................................................................... 39
2-2-2-1) مروری بر نظریهی احتمال. ..................................................39
2-2-2-2) اصول رتبهبندی احتمالی. ..................................................40
2-2-2-3) انواع مدلهای احتمالی...................................................... 41
2-2-2-3-1) مدل استقلال باینری. ......................................................41
2-2-2-3-1-1) استخراج یک تابع رتبهبندی برای واژههای پرسوجو.............. 42
2-2-2-3-1-2) تخمینهای احتمال در تئوری.......................................... 45
2-2-2-3-1-3) تخمینهای احتمال در عمل........................................... 46
2-2-2-3-2) مدلهای مبتنی بر ساختار درختی وابستگیهای بین واژهها.......47
2-2-2-3-3) مدل غیرباینری Okapi BM25
2-2-2-3-4) مدلهای مبتنی بر شبکههای بیزی. ......................................49
2-2-3) مدل زبانی.............................................................................. 50
2-2-3-1) اتوماتای متناهی و مدلهای زبانی. ..........................................50
2-2-3-2) انواع مدلهای زبانی. .............................................................53
2-2-3-3) توزیع چندجملهای روی کلمات.................................................. 54
2-2-3-4) مدل احتمالی پرسوجو. ..........................................................55
2-2-3-4-1) استفاده از مدلهای زبانی احتمالی پرسوجو در بازیابی اطلاعات.. 55
2-2-3-4-2) تخمین احتمال پرسوجو. .......................................................57
2-2-4) مدل فضای برداری. ......................................................................60
2-2-4-1) فراوانی واژه و وزندهی............................................................. 60
2-2-4-1-1) فراوانی مدرک معکوس........................................................... 61
2-2-4-1-2) وزندهی ............................................................................. 62
2-2-4-2) مدل فضای برداری برای امتیازدهی. ...............................................63
2-2-4-2-1) ضربهای نقطهای و محاسبهی تشابه کسینوسی. .......................63
2-2-4-2-2) پرسوجوها به عنوان بردارها........................................................66
2-2-4-2-3) الگوریتمی برای محاسبهی امتیازهای برداری. ................................68
2-2-4-3-2) نرمالسازی tf ماکزیمم. ...............................................................71
2-2-4-3-3) رویههای وزندهی پرسوجو و مدرک.. ............................................72
2-2-4-4) نرمالسازی مدرک بر محور طول. ......................................................73
3-2) خوشهبندی در بازیابی اطلاعات................................................................ 84
3-3) روشهای خوشهبندی بخشبندی (غیرسلسلهمراتبی)..................................86
3-3-2) الگوریتم خوشهبندی LBG. ......................................................................
3-4) روشهای خوشهبندی سلسلهمراتبی....................................................... 94
3-4-1) خوشهبندی سلسلهمراتبی متراکم. .......................................................95
3-4-1-1) خوشهبندی به روش Single-link.
3-4-1-2) خوشهبندی به روش Complete-Link.
3-4-1-3) خوشهبندی به روش Average-Link.
3-4-1-4) خوشهبندی به روش Group Average Link
3-4-1-5) خوشهبندی به روش Median Distance
3-4-2) خوشهبندی تقسیمکننده................................................101
3-4-2-1) Bisecting K-means..........102
واژهنامه...................................................................................103
منابع. .....................................................................................109
فهرست اشکال
فهرست جداول