بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005

بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005

پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

 

چکیده

امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.

داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی ,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.

در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم.

کلمات کلیدی ،کلاس بندی ، خوشه بندی ، پیش بینی ، تخمین

 

مقدمه

امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .

داده کاوی یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .


 

تعداد صفحات 217 word

 

* چکیده

* فصــل اول- مقدمه ای بر داده کاوی

* 1-1-مقدمه

* 1-2-عامل مسبب پیدایش داده کاوی

* 1-3-داده کاوی و مفهوماکتشاف دانش(KDD)

* 1-3-1-تعریف داده کاوی

* 1-3-2- فرآیند داده‌کاوی

* 1-3-3-قابلیت های داده کاوی

* 1-3-4-چه نوع داده‌هایی مورد کاوش قرار می گیرند؟

* 1-4- وظایف داده کاوی

* 1-1-4-کلاس بندی

* 1-4-2- مراحل یک الگوریتم کلاس‌بندی

* 1-4-3-انواع روش‌های کلاس‌بندی

* 1-4-3-1- درخت تصمیم

* 1-4-3-1-1- کشف تقسیمات

* 1-4-3-1-2- دسته بندی با درخت تصمیم

* 1-4-3-1-3-انواع درخت‌های تصمیم

* 1-4-3-1-4- نحوه‌ی هرس کردن درخت

* 1-4-3-2- نزدیکترین همسایگی_ K

* 1-4-3-3-بیزی

* 1-4-3-3-1 تئوری بیز

* 1-4-3-3-2 -دسته بندی ساده بیزی

* 1-4-3-4- الگوریتم‌های ژنتیک در فصل دو با آن آشنا می شویم

* 1-4-3-5-شبکه‌های عصبی

* 1-4-4- ارزیابی روش‌های کلاس‌بندی

* -2-4-1پیش بینی

* 1-4-3-انواع روش‌های پیش بینی

* 1-4-3-1- رگرسیون

* 1-4-3-1 -1- رگرسیون خطی

* 1-4-3-1-2-رگرسیون منطقی

* 1-4-3- خوشه بندی

* 1-4-3-1- تعریف فرآیند خوشه‌بندی

* 1-4-3-2-کیفیت خوشه‌بندی

* 1-4-3-3-روش ها و الگوریتم‌های خوشه‌بندی

* 1-4-3-3-1-روش های سلسله‌مراتبی

* 1-4-3-3-1-1- الگوریتم های سلسله مراتبی

* 1-4-3-3-1-1-1-الگوریتم خوشه بندی single-linkage

* 1-4-3-3-2-الگوریتم‌های تفکیک

* 1-4-3-3-3-روش‌های متکی برچگالی

* 1-4-3-3-4-روش‌های متکی بر گرید

* 1-4-3-3-5-روش‌‌های متکی بر مدل

* 1-4-4- تخمین

* 1-4-4-1- درخت تصمیم

* 1-4-4-2- شبکه ی عصبی

* 1-4-5-سری های زمانی

* 1-5-کاربردهای داده کاوی

* 1-6-قوانین انجمنی

* 1-6-1-کاوش قوانین انجمنی

* 1-6-2-اصول کاوش قوانین انجمنی

* 1-6-3-اصول استقرا در کاوش قوانین انجمنی

* 1-6-4-الگوریتم Apriori

* 1-7-متن کاوی

* 1-7-1- مقدمه

* 1-7-2- فرآیند متن کاوی

* 1-7-3- کاربردهای متن کاوی

* 1-7-3-1- جستجو و بازیابی

* 1-7-3-2-گروه بندی و طبقه بندی داده

* 1-7-3-3-خلاصه سازی

* 1-7-3-4- روابط میان مفاهیم

* 1-7-3-5- یافتن و تحلیل ترند ها

* 1-7-3-5- برچسب زدن نحوی (POS)

* 1-6-2-7-ایجاد تزاروس و آنتولوژی به صورت اتوماتیک

* 1-8-تصویر کاوی

* 1-9- وب کاوی

* فصل دوم -الگوریتم ژنتیک

* 1-2-مقدمه

* 2-2-اصولالگوریتمژنتیک

* 2-2-1-کد گذاری

* 2-2-1-1-روش های کد گذاری

* 2-2-1-1-1-کدگذاری دودویی

* 2-2-1-1-2-کدگذاری مقادیر

* 2-2-1-1-3-کدگذاری درختی

* 2-2-2- ارزیابی

* 2-2-3-انتخاب

* 2-2-3-1-انتخاب گردونه دوار

* 2-2-3-2-انتخاب رتبه ای

* 2-2-3-3-انتخاب حالت استوار

* 2-2-3-4-نخبه گزینی

* 2-2-4-عملگرهای تغییر

* 2-2-4-1-عملگر Crossover

* 2-2-4-2-عملگر جهش ژنتیکی

* 2-2-4-3-احتمالCrossover و جهش

* 2-2-5-کدبرداری

* 2-2-6-دیگر پارامترها

* 2-4-مزایای الگوریتم های ژنتیک

* 2-5- محدودیت های الگوریتم های ژنتیک

* 2-6-چند نمونه از کاربرد های الگوریتم های ژنتیک

* 2-6-1-یک مثال ساده

* فصل سوم-شبکه های عصبی

* 3-1-چرا از شبکه های عصبی استفاده می کنیم؟

* 3-2-سلول عصبی

* 3-3-نحوه عملکرد مغز

* 3-4-مدل ریاضی نرون

* 3-5-آموزش شبکه‌های عصبی

* 3-6-کاربرد های شبکه های عصبی

* فصل چهارم - محاسبات نرم

* 4-1-مقدمه

* 4-2-محاسبات نرمچیست ؟

* 4-2-1-رابطه

* 4-2-2-مجموعه های فازی

* 4-2-2-1-توابع عضویت

* 4-2-2-2- عملیات اصلی

* 4-2-3-نقش مجموعه­های فازی در داده­کاوی

* 4-2-3-1- خوشه بندی

* 4-2-3-2- خلاصه­ سازی داده­ها

* 4-2-3-3- تصویر کاوی

* 4-2-4- الگوریتمژنتیک

* 4-2-5-نقش الگوریتم ژنتیک در داده کاوی

* 4-2-5-1- رگرسیون

* 4-2-5-2-قوانین انجمنی

* 4-3-بحث و نتیجه گیری

* فصل پنجم - ابزارهای داده کاوی

* 5-1- نحوه ی انتخاب ابزارداده کاوی

* 5-2-1-ابزار SPSS-Clemantine

* 5-2-3-ابزار KXEN

* 5-2-4-مدل Insightful

* 5-2-5-مدل Affinium

* 5-3- چگونه می توان بهترین ابزار را انتخاب کرد؟

* 5-4-ابزار های داده کاوی که در 2007 استفاده شده است

* 5-5-داده کاوی با sqlserver 2005

* 5-5-1-اتصال به سرورازمنوی

* 5-5-2- ایجاد Data source

* 5-5-3- ایجادData source view

* 5-5-4- ایجاد Mining structures

* 5-5-5- Microsoft association rule

* 5-5-6- Algorithm cluster

* 5-5-7- Neural network

* 5-5-8-Modle naive-bayes

* 5-5-9-Microsoft Tree Viewer

* 5-5-10-Microsoft-Loistic-Regression

* 5-5-11-Microsoft-Linear-Regression

* فصل ششم - نتایج دادهکاوی با SQL SERVER2005روی بانک اطلاعاتی دانشگاه آزاد قوچان

* ·1-6-نتایج Data Mining With Sql Server 2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان

* 1-6-1-Microsoft association rule

* 1-6-2- Algorithm cluster

* 1-6-3- Neural network

* 1-6-4- Modle naive-bayes

* 1-6-5-Microsoft Tree Viewer

* 7-1-نتیجه گیری

* منابع وماخذ

 


خرید و دانلود بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005

پایان نامه بررسی جنبه های مختلف Web Data Mining

عنوان پایان نامه: بررسی جنبه های مختلف Web Data Mining

فرمت فایل: word

تعداد صفحات: 92

شرح مختصر:

در عصر حاضر Web Mining محیط اینترنت جهانی را تبدیل به محیطی کاربردی تر کرده است.که کاربران میتوانند سریعتر و راحتتر اطلاعات مورد نیازشان را پیدا کنند که شامل :کشف و تحلیل داده ، مستندات وmulti media از محیط اینترنت جهانی میباشد ,Web Mining از جزئیات سند ومحتویات سند و ساختار Hyper Link برای کمک به کاربر جهت مشاهده اطلاعات مورد نیازش استفاده میکند.

وب و موتورهای جستجو خودشان شامل اطلاعات ارتباطی درباره ی مستندات هستند و Web Mining این ارتباطات را کشف میکند و به سه بخش تقسیم بندی مینماید.

- در اولین بخش Web Content Mining، موتورهای جستجو محتویات را با کلمات کلیدی تعریف میکنندومی شناسند.پیدا کردن کلمات کلیدی محتوا و پیدا کردن یک ارتباط بین محتوای صفحه ی وب و محتوای سوال کاربر، Content Mining گفته میشود.

- Hyper Linksاطلاعاتی را درباره ی سایر مستندات روی وب که در سند دیگری مهم هستند تهیه میکند.این لینکها عمقی را به سند اضافه میکنند و حالت چند بعدی که از خصوصیات وب است ایجاد میکنند. کاوش این ساختار لینک دومین بخش یعنی Web Structure Mining است.

- در نهایت ارتباطی با سایر مستندات روی وب که بوسیله ی جستجوی قبلی شناخته شده اند، وجود دارد. این ارتباط در صفحه های جستجو (log) و دستیابی ذخیره میشود. کاوش این Log ها سومین بخش یعنی Web Usage Mining را تشکیل میدهد.

درک کاربر اغلب یک بخش مهم از Web Mining است. تحلیل جستجوهای قبلی کاربر ،شکلی که کاربر ترجیح میدهد اطلاعات پیدا شده را ببیندو سرعت در پاسخ ممکن است در پاسخ دادن به پرس و جوی کاربر موثر باشد.

Web Mining در ماهیت نظم خاصی دارد.پل زدن بین فیلدهایی مثل اطلاعات بازگشتی ،پردازش زبانهای طبیعی، استخراج اطلاعات ،Machine Learning، پایگاه داده ،داده کاوی ،ذخیره ی داده ، طراحی رابط کاربر و Visual کردن .

تکنیکهای Web Mining کاربردهای عملی در M-commerce ،E-commerce ، E-Government ،E-learning ، آموزش از راه دور ، آموزش سازمانی،تشکیلات مجازی ، مدیریت دانش و کتابخانه ی دیجیتال دارد.

در این تحقیق ما به بررسی جنبه های مختلف Web Data Mining میپردازیم.

فهرست مطالب

فصل اول : داده کاوی و وب.. 3

مقدمه4

طبقه بندی Web mining. 5

داده کاوی و visualization در اینترنت.. 7

کاوش الگو. 8

وب کاوی در E-Commerce. 9

فصل دوم : پردازشها و تکنیکهایweb data mining. 11

مقدمه11

مراحل Data mining. 16

مراحل جستجو. 17

پردازش روی نتایج. 18

جنبههای واسط کاربر. 19

خروجیهای data mining web:21

پیاده سازیهای data mining web:23

فصل سوم : کاوش پایگاه داده های وب.. 29

مقدمه30

جستجو در پایگاه دادةها در وب.. 30

داده کاوی شیئی – رابطهای. 31

اشتراک داده در مقابل داده کاوی در وب.. 31

کاوش پایگاههای دادة نیمه ساختیافته32

کاوش و سپس ادغام33

Web mining و Meta data. 34

کاوش متادیتا35

انبار و کاوش.. 35

متادیتا برای کاوش چند رسانهای. 36

متا دیتا برای web mining. 36

کاوش پایگاه دادههای توزیع شده، ناهمگن ، وراثتی و متحد در وب.. 37

ماژولهایی از DP برای داده کاوی. 37

داده کاوی روی پایگاه داده توزیع شده38

کاوش و سپس اجتماع. 38

کاوش interoperating و مخزن. 39

همکاری میان عاملهای کاوش.. 39

واسط برای مجتمع سازی. 40

معماریها وweb data mining. 41

ماژولهای داده کاوی مثل اشیاء41

فصل چهارم : بازیابی اطلاعات و داده کاوی در وب.. 44

مقدمه45

موتورهای جستجوگر. 46

ماژولهای موتورهای جستجو. 46

web data mining برای موتورهای جستجو. 47

پویش داده های چند گانه وب.. 48

کاوش متن. 49

کاوش مستقیم روی دادههای غیرساخت یافته50

کاوش تصویر. 51

کاوش ویدئو. 52

کاوشAudio :53

کاوش مستقیم داده با فرمت صدا53

کاوش نوع داده ی چند رسانه ای. 54

سیستم سوال/جواب و داده کاوی وب.. 54

زبانهایMark up و داده کاوی وب.. 55

خلاصه56

فصل پنجم : مدیریت اطلاعات و داده کاوی وب.. 57

مقدمه58

همکاری بین عاملهای کاوش.. 58

مدیریت دانشها و داده کاوی وب.. 59

مدیریت دانش و داده کاوی وب.. 60

محاسبات بیسیم و داده کاوی وب.. 61

کیفیت سرویس و داده کاوی وب.. 62

اجتماع سرویسهای وب و داده کاوی. 63

فصل ششم : کاوش الگوهای کاربردی و ساختار روی وب.. 64

مقدمه65

تحلیل الگوهای کاربردی و روندهای پیشبینی. 65

خروجیها و تکنیکهای web usage mining:66

web mining برای e-commerce. 75

کاوش ساختار روی وب.. 76

بازبینی web structure mining. 76

جمع بندی و نتیجه گیری. 77

گرافیک سه بعدی چیست ؟79

کارت گرافیک سه بعدی. 80

کارت گرافیک سه بعدی. 83

نتیجه گیری. 90

مراجع 91


خرید و دانلود پایان نامه بررسی جنبه های مختلف Web Data Mining

فرصت ها و چالش های داده کاوی در شهر الکترونیکی

عنوان مقاله: فرصت­ها و چالش­های داده­ کاوی در شهر الکترونیکی

قالب بندی: word

قیمت: 2800 تومان

شرح مختصر:

فناوری اطلاعات و ارتباطات خصوصا اینترنت، به ­صورت فعال حکومت­ها را در قرن بیست و یکم به­ شدت تغییر­ داده است. داده ­کاوی یکی از دستاورد­های فناوری اطلاعات و ارتباطات برای بهبود تحلیل­ها و تصمیمات سازمانی و استراتژی­های مدیریتی می­باشد. ادبیات بسیار وسیعی روی داده­ کاوی و تکنولوژی­های بکارگیری موثر آن وجود­ دارد. در سال­های اخیر، شهر الکترونیک توجه بسیاری از محققان را به­ خود جلب­ کرده­ است. در واقع شهر الکترونیک از استفاده موثر دولت از تکنولوژی­های پیشرفته اطلاعات و ارتباطات و از طریق کانل­های اطلاعاتی مختلف همچون تلفن، اینترنت و ایستگاه­های عمومی کامپیوتری، ناشی می­ شود. هر روزه حجم عظیمی از داده­ های دسترسی کاربران در سیستم­ های شهر الکترونیک تولید می­شوند. کاوش این داده­ها در تجزیه و تحلیل­های دولت، پیشگویی­ها، استراتژی­ها، کنترل و برنامه­ ریزی­های عملیاتی و تاکتیکی تاثیر­گذار هستند. داده­ کاوی در شهر الکترونیک نقش مهمی در تنظیم اهداف دولتی، کشف رفتار شهروندان و تخمین زمینه­ های فعالیت آینده آنها دارد. البته در نقش این داده­ ها در موفقیت حکومت نباید گزافه­ گویی کرد. زیرا اتوماتیزه­ کردن عوامل داده­ کاوی در خدمات شهر الکترونیک، هنوز نیازمند حل­کردن بعضی مشکلات است. در اینجا برای فهم بهتر از اهمیت و جایگاه داده­کاوی در شهر الکترونیک، مطالعه ­ای شامل کاربرد­های داده ­کاوی و چالش­های پیاده­ سازی موفق آن در شهر الکترونیک، توسعه­ داده ­شده­ است. این مطالعه می­تواند منافعی را در اختیار سهام­داران مختلف و صاحبان اختیار که نیاز به دستگیری دانش مخفی و ضمنی از شهروندان، سازمان­ها و یا کسب و کار­ها دارند، قرار دهد.


خرید و دانلود فرصت ها و چالش های داده کاوی در شهر الکترونیکی

پایان نامه داده کاوی و کاربرد آن در تشخیص بیماری

دسته: مهندسی فناوری اطلاعات, مهندسی کامپیوتر

عنوان پایان نامه : پایان نامه داده کاوی و کاربرد آن در تشخیص بیماری

قالب بندی : PDF

قیمت: 2800 تومان

فهرست :

فصل اول

مقدمه

شرح و بیان مسئله

هدف تحقیق

اهمیت و کاربرد نتایج تحقیق

محدودیت

تعریف عملیاتی واژگان

فصل دوم : مفاهیم داده کاوی

تاریخچه

موضوع داده کاوی چیست؟

تعاریف داده کاوی

تفاوت داده کاوی و آنالیزهای آماری

کاربرد های داده کاوی

چند مثال در مورد مفهوم داده کاوی

مراحل داده کاوی

مرحله اول: Business Understanding

مرحله دوم: Data Understanding

جمع آوری داده ها

بحث شرح و توصیف داده ها

مرحله سوم: Data Preparation

Data selecting :انتخاب داده

مرحله چهارم: Modelling

مرحله پنجم: Evaluation

مرحله ششم: Deployment

مفاهیم اساسی در داده کاوی

Bagging

Boosting

MetaLearning

عناصر داده کاوی

تکنیک های داده کاوی

دسته بندی

خوشه بندی

رگرسیون گیری

تجمع وهمبستگی

درخت تصمیم گیری

الگوریتم ژنتیک

شبکه های عصبی مصنوعی

گام نهایی فرآیند داده کاوی،گزارش دادن است

تکنولوژی های مرتبط با داده کاوی

انبار داده

OLAP

محدودیت ها

فصل سوم : کاربرد داده کاوی در پزشکی

داده کاوی در عرصه سلامت

استراتژی های داده کاوی

نمونه هایی از کاربرد داده کاوی در سلامت

شرح مختصر:

امروزه در دانش پزشکی جمع آوری داده های فراوان در مورد بیماری های مختلف از اهمیت فراوانی برخوردار است. مراکز پزشکی با مقاصد گوناگونی به جمع آوری این داده ها می پردازند . تحقیق روی این داده ها و به دست آوردن نتایج و الگوهای مفید در رابطه با بیماری ها ،یکی از اهداف استفاده از این داده ها است . حجم زیاد این داده ها و سردرگمی حاصل از آن مشکلی است که مانع رسیدن به نتایج قابل توجه می شود . بنابراین از داده کاوی برای غلبه بر این مشکل و به دست آوردن روابط مفید بین عوامل خطر زا در بیماری ها استفاده می شود. این مقاله به معرفی داده کاوی وکاربردآن در صنعت پزشکی (پیش بینی بیماری) با استفاده از الگوریتم های داده کاوی به همراه نرم افزارهای مرتبط با آن پرداخته است.


خرید و دانلود پایان نامه داده کاوی و کاربرد آن در تشخیص بیماری

پایان نامه داده کاوی Data Mining

چکیده:

در دو دهه قبل توانایی­های فنی بشر برای تولید و جمع­آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب­و­کار، علوم، خدمات­ دولتی و پیشرفت در وسائل جمع­آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره­ای، در این تغییرات نقش مهمی دارند.

بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی­های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. داده­کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده­کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می­کنند، که این دانش به صورت ضمنی در پایگاه داده­های عظیم، انباره­داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.

به لحاظ اینکه در چند سال اخیر مبحث داده­کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرم­افزار­های آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.

در این مقاله درفصل مروری بر داده­کاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه داده­ها را ذکر کردیم که داده­کاوی یکی از مراحل آن است.

در فصل 2 یکی از شیوه­های داده­کاوی که از سبد خرید گرفته شده­ است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته­بندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح می­دهیم و در آخر آن دو را با هم مقایسه می­کنیم .

در فصل 3 مباحث وب­کاوی و متن­کاوی را که در بسیاری از مراجع جزء کاربردهای داده­کاوی به حساب می­آید شرح داده خواهد شد.