بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان
چکیده
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی ,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.
در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم.
کلمات کلیدی ،کلاس بندی ، خوشه بندی ، پیش بینی ، تخمین
مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
تعداد صفحات 217 word
* چکیده
* فصــل اول- مقدمه ای بر داده کاوی
* 1-1-مقدمه
* 1-2-عامل مسبب پیدایش داده کاوی
* 1-3-داده کاوی و مفهوماکتشاف دانش(KDD)
* 1-3-1-تعریف داده کاوی
* 1-3-2- فرآیند دادهکاوی
* 1-3-3-قابلیت های داده کاوی
* 1-3-4-چه نوع دادههایی مورد کاوش قرار می گیرند؟
* 1-4- وظایف داده کاوی
* 1-1-4-کلاس بندی
* 1-4-2- مراحل یک الگوریتم کلاسبندی
* 1-4-3-انواع روشهای کلاسبندی
* 1-4-3-1- درخت تصمیم
* 1-4-3-1-1- کشف تقسیمات
* 1-4-3-1-2- دسته بندی با درخت تصمیم
* 1-4-3-1-3-انواع درختهای تصمیم
* 1-4-3-1-4- نحوهی هرس کردن درخت
* 1-4-3-2- نزدیکترین همسایگی_ K
* 1-4-3-3-بیزی
* 1-4-3-3-1 تئوری بیز
* 1-4-3-3-2 -دسته بندی ساده بیزی
* 1-4-3-4- الگوریتمهای ژنتیک در فصل دو با آن آشنا می شویم
* 1-4-3-5-شبکههای عصبی
* 1-4-4- ارزیابی روشهای کلاسبندی
* -2-4-1پیش بینی
* 1-4-3-انواع روشهای پیش بینی
* 1-4-3-1- رگرسیون
* 1-4-3-1 -1- رگرسیون خطی
* 1-4-3-1-2-رگرسیون منطقی
* 1-4-3- خوشه بندی
* 1-4-3-1- تعریف فرآیند خوشهبندی
* 1-4-3-2-کیفیت خوشهبندی
* 1-4-3-3-روش ها و الگوریتمهای خوشهبندی
* 1-4-3-3-1-روش های سلسلهمراتبی
* 1-4-3-3-1-1- الگوریتم های سلسله مراتبی
* 1-4-3-3-1-1-1-الگوریتم خوشه بندی single-linkage
* 1-4-3-3-2-الگوریتمهای تفکیک
* 1-4-3-3-3-روشهای متکی برچگالی
* 1-4-3-3-4-روشهای متکی بر گرید
* 1-4-3-3-5-روشهای متکی بر مدل
* 1-4-4- تخمین
* 1-4-4-1- درخت تصمیم
* 1-4-4-2- شبکه ی عصبی
* 1-4-5-سری های زمانی
* 1-5-کاربردهای داده کاوی
* 1-6-قوانین انجمنی
* 1-6-1-کاوش قوانین انجمنی
* 1-6-2-اصول کاوش قوانین انجمنی
* 1-6-3-اصول استقرا در کاوش قوانین انجمنی
* 1-6-4-الگوریتم Apriori
* 1-7-متن کاوی
* 1-7-1- مقدمه
* 1-7-2- فرآیند متن کاوی
* 1-7-3- کاربردهای متن کاوی
* 1-7-3-1- جستجو و بازیابی
* 1-7-3-2-گروه بندی و طبقه بندی داده
* 1-7-3-3-خلاصه سازی
* 1-7-3-4- روابط میان مفاهیم
* 1-7-3-5- یافتن و تحلیل ترند ها
* 1-7-3-5- برچسب زدن نحوی (POS)
* 1-6-2-7-ایجاد تزاروس و آنتولوژی به صورت اتوماتیک
* 1-8-تصویر کاوی
* 1-9- وب کاوی
* فصل دوم -الگوریتم ژنتیک
* 1-2-مقدمه
* 2-2-اصولالگوریتمژنتیک
* 2-2-1-کد گذاری
* 2-2-1-1-روش های کد گذاری
* 2-2-1-1-1-کدگذاری دودویی
* 2-2-1-1-2-کدگذاری مقادیر
* 2-2-1-1-3-کدگذاری درختی
* 2-2-2- ارزیابی
* 2-2-3-انتخاب
* 2-2-3-1-انتخاب گردونه دوار
* 2-2-3-2-انتخاب رتبه ای
* 2-2-3-3-انتخاب حالت استوار
* 2-2-3-4-نخبه گزینی
* 2-2-4-عملگرهای تغییر
* 2-2-4-1-عملگر Crossover
* 2-2-4-2-عملگر جهش ژنتیکی
* 2-2-4-3-احتمالCrossover و جهش
* 2-2-5-کدبرداری
* 2-2-6-دیگر پارامترها
* 2-4-مزایای الگوریتم های ژنتیک
* 2-5- محدودیت های الگوریتم های ژنتیک
* 2-6-چند نمونه از کاربرد های الگوریتم های ژنتیک
* 2-6-1-یک مثال ساده
* فصل سوم-شبکه های عصبی
* 3-1-چرا از شبکه های عصبی استفاده می کنیم؟
* 3-2-سلول عصبی
* 3-3-نحوه عملکرد مغز
* 3-4-مدل ریاضی نرون
* 3-5-آموزش شبکههای عصبی
* 3-6-کاربرد های شبکه های عصبی
* فصل چهارم - محاسبات نرم
* 4-1-مقدمه
* 4-2-محاسبات نرمچیست ؟
* 4-2-1-رابطه
* 4-2-2-مجموعه های فازی
* 4-2-2-1-توابع عضویت
* 4-2-2-2- عملیات اصلی
* 4-2-3-نقش مجموعههای فازی در دادهکاوی
* 4-2-3-1- خوشه بندی
* 4-2-3-2- خلاصه سازی دادهها
* 4-2-3-3- تصویر کاوی
* 4-2-4- الگوریتمژنتیک
* 4-2-5-نقش الگوریتم ژنتیک در داده کاوی
* 4-2-5-1- رگرسیون
* 4-2-5-2-قوانین انجمنی
* 4-3-بحث و نتیجه گیری
* فصل پنجم - ابزارهای داده کاوی
* 5-1- نحوه ی انتخاب ابزارداده کاوی
* 5-2-1-ابزار SPSS-Clemantine
* 5-2-3-ابزار KXEN
* 5-2-4-مدل Insightful
* 5-2-5-مدل Affinium
* 5-3- چگونه می توان بهترین ابزار را انتخاب کرد؟
* 5-4-ابزار های داده کاوی که در 2007 استفاده شده است
* 5-5-داده کاوی با sqlserver 2005
* 5-5-1-اتصال به سرورازمنوی
* 5-5-2- ایجاد Data source
* 5-5-3- ایجادData source view
* 5-5-4- ایجاد Mining structures
* 5-5-5- Microsoft association rule
* 5-5-6- Algorithm cluster
* 5-5-7- Neural network
* 5-5-8-Modle naive-bayes
* 5-5-9-Microsoft Tree Viewer
* 5-5-10-Microsoft-Loistic-Regression
* 5-5-11-Microsoft-Linear-Regression
* فصل ششم - نتایج دادهکاوی با SQL SERVER2005روی بانک اطلاعاتی دانشگاه آزاد قوچان
* ·1-6-نتایج Data Mining With Sql Server 2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان
* 1-6-1-Microsoft association rule
* 1-6-2- Algorithm cluster
* 1-6-3- Neural network
* 1-6-4- Modle naive-bayes
* 1-6-5-Microsoft Tree Viewer
* 7-1-نتیجه گیری
* منابع وماخذ
عنوان پایان نامه: بررسی جنبه های مختلف Web Data Mining
فرمت فایل: word
تعداد صفحات: 92
شرح مختصر:
در عصر حاضر Web Mining محیط اینترنت جهانی را تبدیل به محیطی کاربردی تر کرده است.که کاربران میتوانند سریعتر و راحتتر اطلاعات مورد نیازشان را پیدا کنند که شامل :کشف و تحلیل داده ، مستندات وmulti media از محیط اینترنت جهانی میباشد ,Web Mining از جزئیات سند ومحتویات سند و ساختار Hyper Link برای کمک به کاربر جهت مشاهده اطلاعات مورد نیازش استفاده میکند.
وب و موتورهای جستجو خودشان شامل اطلاعات ارتباطی درباره ی مستندات هستند و Web Mining این ارتباطات را کشف میکند و به سه بخش تقسیم بندی مینماید.
- در اولین بخش Web Content Mining، موتورهای جستجو محتویات را با کلمات کلیدی تعریف میکنندومی شناسند.پیدا کردن کلمات کلیدی محتوا و پیدا کردن یک ارتباط بین محتوای صفحه ی وب و محتوای سوال کاربر، Content Mining گفته میشود.
- Hyper Linksاطلاعاتی را درباره ی سایر مستندات روی وب که در سند دیگری مهم هستند تهیه میکند.این لینکها عمقی را به سند اضافه میکنند و حالت چند بعدی که از خصوصیات وب است ایجاد میکنند. کاوش این ساختار لینک دومین بخش یعنی Web Structure Mining است.
- در نهایت ارتباطی با سایر مستندات روی وب که بوسیله ی جستجوی قبلی شناخته شده اند، وجود دارد. این ارتباط در صفحه های جستجو (log) و دستیابی ذخیره میشود. کاوش این Log ها سومین بخش یعنی Web Usage Mining را تشکیل میدهد.
درک کاربر اغلب یک بخش مهم از Web Mining است. تحلیل جستجوهای قبلی کاربر ،شکلی که کاربر ترجیح میدهد اطلاعات پیدا شده را ببیندو سرعت در پاسخ ممکن است در پاسخ دادن به پرس و جوی کاربر موثر باشد.
Web Mining در ماهیت نظم خاصی دارد.پل زدن بین فیلدهایی مثل اطلاعات بازگشتی ،پردازش زبانهای طبیعی، استخراج اطلاعات ،Machine Learning، پایگاه داده ،داده کاوی ،ذخیره ی داده ، طراحی رابط کاربر و Visual کردن .
تکنیکهای Web Mining کاربردهای عملی در M-commerce ،E-commerce ، E-Government ،E-learning ، آموزش از راه دور ، آموزش سازمانی،تشکیلات مجازی ، مدیریت دانش و کتابخانه ی دیجیتال دارد.
در این تحقیق ما به بررسی جنبه های مختلف Web Data Mining میپردازیم.
فهرست مطالب
فصل اول : داده کاوی و وب.. 3
مقدمه4
طبقه بندی Web mining. 5
داده کاوی و visualization در اینترنت.. 7
کاوش الگو. 8
وب کاوی در E-Commerce. 9
فصل دوم : پردازشها و تکنیکهایweb data mining. 11
مقدمه11
مراحل Data mining. 16
مراحل جستجو. 17
پردازش روی نتایج. 18
جنبههای واسط کاربر. 19
خروجیهای data mining web:21
پیاده سازیهای data mining web:23
فصل سوم : کاوش پایگاه داده های وب.. 29
مقدمه30
جستجو در پایگاه دادةها در وب.. 30
داده کاوی شیئی – رابطهای. 31
اشتراک داده در مقابل داده کاوی در وب.. 31
کاوش پایگاههای دادة نیمه ساختیافته32
کاوش و سپس ادغام33
Web mining و Meta data. 34
کاوش متادیتا35
انبار و کاوش.. 35
متادیتا برای کاوش چند رسانهای. 36
متا دیتا برای web mining. 36
کاوش پایگاه دادههای توزیع شده، ناهمگن ، وراثتی و متحد در وب.. 37
ماژولهایی از DP برای داده کاوی. 37
داده کاوی روی پایگاه داده توزیع شده38
کاوش و سپس اجتماع. 38
کاوش interoperating و مخزن. 39
همکاری میان عاملهای کاوش.. 39
واسط برای مجتمع سازی. 40
معماریها وweb data mining. 41
ماژولهای داده کاوی مثل اشیاء41
فصل چهارم : بازیابی اطلاعات و داده کاوی در وب.. 44
مقدمه45
موتورهای جستجوگر. 46
ماژولهای موتورهای جستجو. 46
web data mining برای موتورهای جستجو. 47
پویش داده های چند گانه وب.. 48
کاوش متن. 49
کاوش مستقیم روی دادههای غیرساخت یافته50
کاوش تصویر. 51
کاوش ویدئو. 52
کاوشAudio :53
کاوش مستقیم داده با فرمت صدا53
کاوش نوع داده ی چند رسانه ای. 54
سیستم سوال/جواب و داده کاوی وب.. 54
زبانهایMark up و داده کاوی وب.. 55
خلاصه56
فصل پنجم : مدیریت اطلاعات و داده کاوی وب.. 57
مقدمه58
همکاری بین عاملهای کاوش.. 58
مدیریت دانشها و داده کاوی وب.. 59
مدیریت دانش و داده کاوی وب.. 60
محاسبات بیسیم و داده کاوی وب.. 61
کیفیت سرویس و داده کاوی وب.. 62
اجتماع سرویسهای وب و داده کاوی. 63
فصل ششم : کاوش الگوهای کاربردی و ساختار روی وب.. 64
مقدمه65
تحلیل الگوهای کاربردی و روندهای پیشبینی. 65
خروجیها و تکنیکهای web usage mining:66
web mining برای e-commerce. 75
کاوش ساختار روی وب.. 76
بازبینی web structure mining. 76
جمع بندی و نتیجه گیری. 77
گرافیک سه بعدی چیست ؟79
کارت گرافیک سه بعدی. 80
کارت گرافیک سه بعدی. 83
نتیجه گیری. 90
مراجع 91
عنوان مقاله: فرصتها و چالشهای داده کاوی در شهر الکترونیکی
قالب بندی: word
قیمت: 2800 تومان
شرح مختصر:
فناوری اطلاعات و ارتباطات خصوصا اینترنت، به صورت فعال حکومتها را در قرن بیست و یکم به شدت تغییر داده است. داده کاوی یکی از دستاوردهای فناوری اطلاعات و ارتباطات برای بهبود تحلیلها و تصمیمات سازمانی و استراتژیهای مدیریتی میباشد. ادبیات بسیار وسیعی روی داده کاوی و تکنولوژیهای بکارگیری موثر آن وجود دارد. در سالهای اخیر، شهر الکترونیک توجه بسیاری از محققان را به خود جلب کرده است. در واقع شهر الکترونیک از استفاده موثر دولت از تکنولوژیهای پیشرفته اطلاعات و ارتباطات و از طریق کانلهای اطلاعاتی مختلف همچون تلفن، اینترنت و ایستگاههای عمومی کامپیوتری، ناشی می شود. هر روزه حجم عظیمی از داده های دسترسی کاربران در سیستم های شهر الکترونیک تولید میشوند. کاوش این دادهها در تجزیه و تحلیلهای دولت، پیشگوییها، استراتژیها، کنترل و برنامه ریزیهای عملیاتی و تاکتیکی تاثیرگذار هستند. داده کاوی در شهر الکترونیک نقش مهمی در تنظیم اهداف دولتی، کشف رفتار شهروندان و تخمین زمینه های فعالیت آینده آنها دارد. البته در نقش این داده ها در موفقیت حکومت نباید گزافه گویی کرد. زیرا اتوماتیزه کردن عوامل داده کاوی در خدمات شهر الکترونیک، هنوز نیازمند حلکردن بعضی مشکلات است. در اینجا برای فهم بهتر از اهمیت و جایگاه دادهکاوی در شهر الکترونیک، مطالعه ای شامل کاربردهای داده کاوی و چالشهای پیاده سازی موفق آن در شهر الکترونیک، توسعه داده شده است. این مطالعه میتواند منافعی را در اختیار سهامداران مختلف و صاحبان اختیار که نیاز به دستگیری دانش مخفی و ضمنی از شهروندان، سازمانها و یا کسب و کارها دارند، قرار دهد.
دسته: مهندسی فناوری اطلاعات, مهندسی کامپیوتر
عنوان پایان نامه : پایان نامه داده کاوی و کاربرد آن در تشخیص بیماری
قالب بندی : PDF
قیمت: 2800 تومان
فهرست :
فصل اول
مقدمه
شرح و بیان مسئله
هدف تحقیق
اهمیت و کاربرد نتایج تحقیق
محدودیت
تعریف عملیاتی واژگان
فصل دوم : مفاهیم داده کاوی
تاریخچه
موضوع داده کاوی چیست؟
تعاریف داده کاوی
تفاوت داده کاوی و آنالیزهای آماری
کاربرد های داده کاوی
چند مثال در مورد مفهوم داده کاوی
مراحل داده کاوی
مرحله اول: Business Understanding
مرحله دوم: Data Understanding
جمع آوری داده ها
بحث شرح و توصیف داده ها
مرحله سوم: Data Preparation
Data selecting :انتخاب داده
مرحله چهارم: Modelling
مرحله پنجم: Evaluation
مرحله ششم: Deployment
مفاهیم اساسی در داده کاوی
Bagging
Boosting
MetaLearning
عناصر داده کاوی
تکنیک های داده کاوی
دسته بندی
خوشه بندی
رگرسیون گیری
تجمع وهمبستگی
درخت تصمیم گیری
الگوریتم ژنتیک
شبکه های عصبی مصنوعی
گام نهایی فرآیند داده کاوی،گزارش دادن است
تکنولوژی های مرتبط با داده کاوی
انبار داده
OLAP
محدودیت ها
فصل سوم : کاربرد داده کاوی در پزشکی
داده کاوی در عرصه سلامت
استراتژی های داده کاوی
نمونه هایی از کاربرد داده کاوی در سلامت
شرح مختصر:
امروزه در دانش پزشکی جمع آوری داده های فراوان در مورد بیماری های مختلف از اهمیت فراوانی برخوردار است. مراکز پزشکی با مقاصد گوناگونی به جمع آوری این داده ها می پردازند . تحقیق روی این داده ها و به دست آوردن نتایج و الگوهای مفید در رابطه با بیماری ها ،یکی از اهداف استفاده از این داده ها است . حجم زیاد این داده ها و سردرگمی حاصل از آن مشکلی است که مانع رسیدن به نتایج قابل توجه می شود . بنابراین از داده کاوی برای غلبه بر این مشکل و به دست آوردن روابط مفید بین عوامل خطر زا در بیماری ها استفاده می شود. این مقاله به معرفی داده کاوی وکاربردآن در صنعت پزشکی (پیش بینی بیماری) با استفاده از الگوریتم های داده کاوی به همراه نرم افزارهای مرتبط با آن پرداخته است.
چکیده:
در دو دهه قبل تواناییهای فنی بشر برای تولید و جمعآوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسبوکار، علوم، خدمات دولتی و پیشرفت در وسائل جمعآوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهوارهای، در این تغییرات نقش مهمی دارند.
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژیهای جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. دادهکاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی دادهکاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی میکنند، که این دانش به صورت ضمنی در پایگاه دادههای عظیم، انبارهداده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.
به لحاظ اینکه در چند سال اخیر مبحث دادهکاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرمافزارهای آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.
در این مقاله درفصل مروری بر دادهکاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه دادهها را ذکر کردیم که دادهکاوی یکی از مراحل آن است.
در فصل 2 یکی از شیوههای دادهکاوی که از سبد خرید گرفته شده است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دستهبندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح میدهیم و در آخر آن دو را با هم مقایسه میکنیم .
در فصل 3 مباحث وبکاوی و متنکاوی را که در بسیاری از مراجع جزء کاربردهای دادهکاوی به حساب میآید شرح داده خواهد شد.