بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005
پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان
چکیده
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی ,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.
در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم.
کلمات کلیدی ،کلاس بندی ، خوشه بندی ، پیش بینی ، تخمین
مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
تعداد صفحات 217 word
* چکیده
* فصــل اول- مقدمه ای بر داده کاوی
* 1-1-مقدمه
* 1-2-عامل مسبب پیدایش داده کاوی
* 1-3-داده کاوی و مفهوماکتشاف دانش(KDD)
* 1-3-1-تعریف داده کاوی
* 1-3-2- فرآیند دادهکاوی
* 1-3-3-قابلیت های داده کاوی
* 1-3-4-چه نوع دادههایی مورد کاوش قرار می گیرند؟
* 1-4- وظایف داده کاوی
* 1-1-4-کلاس بندی
* 1-4-2- مراحل یک الگوریتم کلاسبندی
* 1-4-3-انواع روشهای کلاسبندی
* 1-4-3-1- درخت تصمیم
* 1-4-3-1-1- کشف تقسیمات
* 1-4-3-1-2- دسته بندی با درخت تصمیم
* 1-4-3-1-3-انواع درختهای تصمیم
* 1-4-3-1-4- نحوهی هرس کردن درخت
* 1-4-3-2- نزدیکترین همسایگی_ K
* 1-4-3-3-بیزی
* 1-4-3-3-1 تئوری بیز
* 1-4-3-3-2 -دسته بندی ساده بیزی
* 1-4-3-4- الگوریتمهای ژنتیک در فصل دو با آن آشنا می شویم
* 1-4-3-5-شبکههای عصبی
* 1-4-4- ارزیابی روشهای کلاسبندی
* -2-4-1پیش بینی
* 1-4-3-انواع روشهای پیش بینی
* 1-4-3-1- رگرسیون
* 1-4-3-1 -1- رگرسیون خطی
* 1-4-3-1-2-رگرسیون منطقی
* 1-4-3- خوشه بندی
* 1-4-3-1- تعریف فرآیند خوشهبندی
* 1-4-3-2-کیفیت خوشهبندی
* 1-4-3-3-روش ها و الگوریتمهای خوشهبندی
* 1-4-3-3-1-روش های سلسلهمراتبی
* 1-4-3-3-1-1- الگوریتم های سلسله مراتبی
* 1-4-3-3-1-1-1-الگوریتم خوشه بندی single-linkage
* 1-4-3-3-2-الگوریتمهای تفکیک
* 1-4-3-3-3-روشهای متکی برچگالی
* 1-4-3-3-4-روشهای متکی بر گرید
* 1-4-3-3-5-روشهای متکی بر مدل
* 1-4-4- تخمین
* 1-4-4-1- درخت تصمیم
* 1-4-4-2- شبکه ی عصبی
* 1-4-5-سری های زمانی
* 1-5-کاربردهای داده کاوی
* 1-6-قوانین انجمنی
* 1-6-1-کاوش قوانین انجمنی
* 1-6-2-اصول کاوش قوانین انجمنی
* 1-6-3-اصول استقرا در کاوش قوانین انجمنی
* 1-6-4-الگوریتم Apriori
* 1-7-متن کاوی
* 1-7-1- مقدمه
* 1-7-2- فرآیند متن کاوی
* 1-7-3- کاربردهای متن کاوی
* 1-7-3-1- جستجو و بازیابی
* 1-7-3-2-گروه بندی و طبقه بندی داده
* 1-7-3-3-خلاصه سازی
* 1-7-3-4- روابط میان مفاهیم
* 1-7-3-5- یافتن و تحلیل ترند ها
* 1-7-3-5- برچسب زدن نحوی (POS)
* 1-6-2-7-ایجاد تزاروس و آنتولوژی به صورت اتوماتیک
* 1-8-تصویر کاوی
* 1-9- وب کاوی
* فصل دوم -الگوریتم ژنتیک
* 1-2-مقدمه
* 2-2-اصولالگوریتمژنتیک
* 2-2-1-کد گذاری
* 2-2-1-1-روش های کد گذاری
* 2-2-1-1-1-کدگذاری دودویی
* 2-2-1-1-2-کدگذاری مقادیر
* 2-2-1-1-3-کدگذاری درختی
* 2-2-2- ارزیابی
* 2-2-3-انتخاب
* 2-2-3-1-انتخاب گردونه دوار
* 2-2-3-2-انتخاب رتبه ای
* 2-2-3-3-انتخاب حالت استوار
* 2-2-3-4-نخبه گزینی
* 2-2-4-عملگرهای تغییر
* 2-2-4-1-عملگر Crossover
* 2-2-4-2-عملگر جهش ژنتیکی
* 2-2-4-3-احتمالCrossover و جهش
* 2-2-5-کدبرداری
* 2-2-6-دیگر پارامترها
* 2-4-مزایای الگوریتم های ژنتیک
* 2-5- محدودیت های الگوریتم های ژنتیک
* 2-6-چند نمونه از کاربرد های الگوریتم های ژنتیک
* 2-6-1-یک مثال ساده
* فصل سوم-شبکه های عصبی
* 3-1-چرا از شبکه های عصبی استفاده می کنیم؟
* 3-2-سلول عصبی
* 3-3-نحوه عملکرد مغز
* 3-4-مدل ریاضی نرون
* 3-5-آموزش شبکههای عصبی
* 3-6-کاربرد های شبکه های عصبی
* فصل چهارم - محاسبات نرم
* 4-1-مقدمه
* 4-2-محاسبات نرمچیست ؟
* 4-2-1-رابطه
* 4-2-2-مجموعه های فازی
* 4-2-2-1-توابع عضویت
* 4-2-2-2- عملیات اصلی
* 4-2-3-نقش مجموعههای فازی در دادهکاوی
* 4-2-3-1- خوشه بندی
* 4-2-3-2- خلاصه سازی دادهها
* 4-2-3-3- تصویر کاوی
* 4-2-4- الگوریتمژنتیک
* 4-2-5-نقش الگوریتم ژنتیک در داده کاوی
* 4-2-5-1- رگرسیون
* 4-2-5-2-قوانین انجمنی
* 4-3-بحث و نتیجه گیری
* فصل پنجم - ابزارهای داده کاوی
* 5-1- نحوه ی انتخاب ابزارداده کاوی
* 5-2-1-ابزار SPSS-Clemantine
* 5-2-3-ابزار KXEN
* 5-2-4-مدل Insightful
* 5-2-5-مدل Affinium
* 5-3- چگونه می توان بهترین ابزار را انتخاب کرد؟
* 5-4-ابزار های داده کاوی که در 2007 استفاده شده است
* 5-5-داده کاوی با sqlserver 2005
* 5-5-1-اتصال به سرورازمنوی
* 5-5-2- ایجاد Data source
* 5-5-3- ایجادData source view
* 5-5-4- ایجاد Mining structures
* 5-5-5- Microsoft association rule
* 5-5-6- Algorithm cluster
* 5-5-7- Neural network
* 5-5-8-Modle naive-bayes
* 5-5-9-Microsoft Tree Viewer
* 5-5-10-Microsoft-Loistic-Regression
* 5-5-11-Microsoft-Linear-Regression
* فصل ششم - نتایج دادهکاوی با SQL SERVER2005روی بانک اطلاعاتی دانشگاه آزاد قوچان
* ·1-6-نتایج Data Mining With Sql Server 2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان
* 1-6-1-Microsoft association rule
* 1-6-2- Algorithm cluster
* 1-6-3- Neural network
* 1-6-4- Modle naive-bayes
* 1-6-5-Microsoft Tree Viewer
* 7-1-نتیجه گیری
* منابع وماخذ