داده کاوی، مفاهیم و کاربرد پروژه

عنوان پروژه : داده کاوی، مفاهیم و کاربرد پروژه

قالب بندی: word

قیمت: 2500 تومان

تعداد صفحات: 101

شرح مختصر:

امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کردواطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .

با استفاده از پرسش های ساده در SQL و ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .

از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .

داده کاوی یکی از مهمترین این روشها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .

در داده کاوی از بخشی از علم آمار به نام تحلیل اکتشافی داده ها استفاده می شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون حجم انبوه داده ها تاکید می شود . علاوه بر این داده کاوی با هوش مصنوعی و یادگیری ماشین نیز ارتباط تنگاتنگی دارد ، بنابراین می توان گفت در داده کاوی تئوریهای پایگاه داده ها ، هوش مصنوعی ، یادگیری ماشین و علم آمار را در هم می آمیزند تا زمینه کاربردی فراهم شود .

باید توجه داشت که اصطلاح داده کاوی زمانی به کار برده می شود که با حجم بزرگی از داده ها ، در حد مگا یا ترابایت ، مواجه باشیم . در تمامی منابع داده کاوی بر این مطلب تاکید شده است .

هر چه حجم داده ها بیشتر و روابط میان آنها پیچیده تر باشد دسترسی به اطلاعات نهفته در میان داده ها مشکلتر می شود و نقش داده کاوی به عنوان یکی از روشهای کشف دانش ، روشن تر می گردد .

فهرست:

چکیده

مقدمه

فصل اول –مفاهیم داده کاوی

مدیریت ذخیره سازی و دستیابی اطلاعات

ساختار بانک اطلاعاتی سازمان

داده کاوی (Data Mining)

مفاهیم پایه در داده کاوی

تعریف داده کاوی

مراحل فرایند کشف دانش از پایگاه داده ها

الگوریتم های داده کاوی

آماده سازی داده برای مدل سازی

درک قلمرو

ابزارهای تجاری داده کاوی ToolsDM Commercial

منابع اطلاعاتی مورد استفاده

محدودیت های داده کاوی

حفاظت از حریم شخصی در سیستم‌های داده‌کاوی

فصل دوم : کاربردهای داده کاوی

کاربرد داده کاوی در کسب و کار هوشمند بانک.

داده کاوی درمدیریت ارتباط بامشتری

کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی

داده کاوی و مدیریت موسسات دانشگاهی

داده کاوی و مدیریت بهینه وب سایت ها

داده‌کاوی و مدیریت دانش

کاربرد داده‌کاوی در آموزش عالی

فصل سوم – بررسی موردی1: وب کاوی

معماری وب کاوی

مشکلات ومحدودیت های وب کاوی در سایت های فارسی زبان

محتوا کاوی وب

فصل چهارم – بررسی موردی 2 : داده کاوی در شهر الکترونیک

زمینه داده کاوی در شهر الکترونیک

کاربردهای دادهکاوی در شهر الکترونیک.

چالشهای داده کاوی در شهر الکترونیک.

مراجع و ماخذ



خرید و دانلود داده کاوی، مفاهیم و کاربرد پروژه

داده کاوی یک ابزار آنالیز مدیریتی

عنوان مقاله: داده کاوی یک ابزار آنالیز مدیریتی

قالب بندی: pdf

شرح مختصر: داده کاوی فرآیندی تحلیلی برای کاوش داده های طر احی شده است،که در جستجوی الگوهای سازگار، یا روابط سیستماتیک بین متغیرها است، و سپس به تائید این یافته ها با استفاده از الگوهای تشخیص داده شده می پردازد . استخراج اطلاعات مناسب از میان انبوه داده ها و تبدیل آنها به دانش مورد نیاز سازمانها، بویژه در تصمیم گیر ی های سازمانی ، نیازمند استفاده از روش های نوین در این حوزه است . داده کاوی یکی از این ابزار و رویکردهاست که در فضای مدیریت دانش سازمان ها به کشف دانش از پایگاه داده ها کمک می کند. این مقاله به بررسی ویژگی های منحصر به فرد این حوزه از فناوری و تکنیکهای استفاده از آن را نشان می دهد.


خرید و دانلود داده کاوی یک ابزار آنالیز مدیریتی

پایان نامه کامپیوتر سیستم های پشتیبان تصمیم گیری هوشمند

چکیده

دنیای امروز با انبوهی از مسائل تصمیم گیری مواجه است. این واژه ها طیف گسترده ای از نظریه ها و رویکردهای تصمیم گیری را ارائه می کنند. طرفداران بکارگیری الگوهای ریاضی، این شیوه ها را دقیق ترین و بهترین راه دستیابی به تصمیم بهینه، می دانند. در نقطه مقابل ، طراحان رویکردهای مبتنی بر نظریه های ادراکی از تطابق بیشتر روشهای خود با دنیای واقعی سخن می گویند و گروه سومی از صاحبنظران ومدیران نیز وجود دارند که هیچ یک از این دو را باور ندارند! هرسه گروه برای خود دلایلی دارند و شواهدی را برای پشتیبانی از نظریات خود ارائه می کنند. ایا می توان به الگویی که این نظریه های به ظاهر متضاد، را با منطق واحدی تفسیر کند،دست یافت؟ امروز سیستم های پشتیبان تصمیم گیری دوران گذار تکاملی خود را می گذراند و همانند هر سیستم نابالغ دیگری امیزه ای از توانمندیها و ناتوانیها، بیمها و امیدواریها، طرفداران ومنتقدان را به همراه خود دارد. در چنین شرایطی انسان می بایستی دستاوردهای عینی راتجربه و افقهای ذهنی را نظاره کند و این رویکردی است که امروز واقعی را به فردای ارمانی پیوند می زند. کارشناسان ستادی ، معاونان و مشاوران همه درتلاشند تا مدیران را درجهت تصمیم گیری صحیح کمک کنند. شما حتی اگر با این نظر که، مدیریت یعنی تصمیم گیری، موافق نباشید، قطعا این واقعیت که تصمیم گیری بخش مهمی از نقش مدیر و منشا تاثیرنگرش های او در سازمان است را تجربه کرده اید. با این همه ، در میان انبوهی از فعالیتهای ستادی و سیستم های عریض و طویلی که برای حمایت از تصمیم-گیری وجود دارد، نهایتا مدیرکسی است که در اوج تنهایی تصمیم می گیرد! چرا سیستم پشتیبان تصمیم گیری هنوز نتوانسته است نقش موثری را در تصمیم گیری مدیران ایفا کند؟ پروفسور رکس براون استاد تصمیم گیری، دانشگاه جرج میسون امریکاست. وی بیش از 18 سال است که به امر مشاوره مدیریتی اشتغال دارد و تاکنون بیش از 80 کتاب و مقاله منتشر ساخته است. پروفسور براون در مقاله ای می نویسد: "من سالیان دراز است که با مدیران ارشد دولتی کار می کنم ،با این حال نمی توانم ادعا کنم که تعداد زیادی از مشتریان خود را به تصمیم متفاوت و یا بهتری هدایت کرده باشم و فکر نمی کنم دیگران هم شرایط بهتری از این داشته باشند. وی می افزاید: "امکانات کمک تصمیم گیری اعم از رویکردهای کمی و یا ادراکی اثرات بسیار محدودی در تصمیم گیریها داشته-اند".امروزه درحالی که بسیاری از سازمانها توسعه سیستم های پشتیبان تصمیم گیری را در راس برنامه های خود قرار داده اند، برخی از مدیران با پروفسور براون هم عقیده و نسبت به سیستم های پشتیبان تصمیم گیری بی اعتماد هستند. هر دو گروه، برای خود دلایلی دارند وشواهدی را هم برای پشتیبانی از نظریات خود ارائه می کنند. ایا سیستم های پشتیبانی، به بلوغ کافی برای پشتیبانی از تصمیم گیری مدیران رسیده اند؟

 

 

تعداد صفحات 173 word

 

مقدمه. 2

تصمیمگیری و سیستمهای پشتیبان تصمیمگیری.. 2

زمینه های علمی سیستم های پشتیبان تصمیم گیری.. 3

1-1- تصمیم گیری ‏ 5

1-2- دسته بندی مسائل تصمیم. 10

1-2-1- دسته بندی مسائل تصمیم بر مبنای ساختار مسئله. 10

1-2-2- دسته بندی مسائل تصمیم بر مبنای سطوح تصمیم گیری.. 11

1-3- فرایند تصمیم گیری.. 12

1-4- سیستم های پشتیبان تصمیم گیری.. 17

1-4-2- خصوصیات سیستم های پشتیبان تصمیم گیری.. 20

1-4-3- انواع سیستم های پشتیبان تصمیم گیری.. 21

1-5- روش های پشتیبان تصمیم گیری.. 22

1-5-1-بهینه سازی.. 23

1-5-2- تصمیم گیری چندمعیاره: 23

1-5-3- داده کاوی.. 23

1-5-4- استدلال مبتنی بر مورد CBR.. 23

1-5-5- درخت تصمیم. 25

2-1- زیر سیستم مدیریت داده 29

2-1-1- پایگاه داده 30

2-1-2- سیستم مدیریت پایگاه داده 33

2-1-3- ساختار پرس و جو. 34

2-1-4- راهنما 34

2-2- زیر سیستم مدیریت مدل. 34

2-2-1- پایگاه مدل. 35

2-2-2- ابزارهای مدل سازی.. 37

2-2-3- سیستم مدیریت پایگاه مدل. 37

2-2-4- فهرست مدل. 38

2-2-5- اجرا مدل، مجتمع کردن و فرمان دادن. 38

2-4- زیر سیستم مدیریت پایگاه دانش... 41

2-5- طبقه بندی سیستم های پشتیبان تصمیم گیری.. 43

3-1- مدل سازی MSS. 46

3-2- مدل های ایستا و پویا 51

3-2-1- انالیز ایستا 52

3-2-2- انالیز پویا 52

3-3- قطعیت، عدم قطعیت و ریسک... 53

3-3-1- تصمیم گیری درشرایط قطعی.. 53

3-3-2- تصمیم گیری در شرایط عدم قطعیت.. 54

3-3-3- تصمیم گیری در شرایط ریسک... 54

3-4- نمودارهای تاثیرات.. 55

3-5- نرم افزار 56

3-6- مدل سازی MSS با صفحات گسترده 57

3-7- تجزیه وتحلیل تصمیم برای تعدادی پیشنهاد (جدول تصمیم و درخت تصمیم) 60

3-7-1- جدول تصمیم. 61

3-7-2- درخت تصمیم. 63

8- ساختار مدل های ریاضی MSS. 63

3-9-1- اهداف چندگانه. 67

3-9-2- انالیز حساسیت ها 68

3-9-4- جستجوی هدف.. 70

3-10- روش های جستجوی حل مسئله. 72

4-1- نوع و منابع داده 77

4-2- جمع اوری داده، مسائل وکیفیت.. 79

4-3- سیستم های مدیریت پایگاه داده در سیستم های پشتیبان تصمیم گیری.. 81

4-4- انبارداده 81

4-4-1- تفاوت انبار داده و پایگاه داده 84

4-5-1- مدل داده رابطه ای، مدل داده چندبعدی.. 93

4-5-2- حجم های داده ای.. 94

4-5-3- شماهای داده ای.. 95

4-5-4- طراحی پایگاه داده چندبعدی انبارداده 97

4-6- داده کاوی.. 99

4-6-1- مراحل داده کاوی.. 104

4-6-2- خلاصه سازی و به تصویر دراوردن داده ها 105

4-6-3- مدل های پیش بینی داده ها 108

4-6-4- مدل ها و الگوریتم های داده کاوی.. 108

5-2- سیستم خبره 123

5-3- ساختار سیستم خبره 126

5-3-1- معماری سیستم خبره 128

5-3-2- انواع روش های برنامه نویسی و ارتباط با سیستم های خبره 130

5-4- دانش... 131

5-4-1- قواعد. 131

5-4-2- شبکه های معنایی.. 133

5-4-3- قاب.. 133

5-4-4- منطق.. 133

5-5- روش های استنتاج. 134

5-5-1- انواع روش های استنتاج. 135

5-6- ابزارهای ایجاد سیستم خبره 136

6-1- تاریخچه. 139

6-2- دسته بندی سیستمهای پشتیبانی تصمیم بالینی: 143

6-2-1- دسته بندی سیستمهای پشتیبان تصمیم گیری از دید پزشکان. 143

6-2-2- انواع سیستمهای پشتیبانی تصمیم در پزشکی از لحاظ روش و سیستم مورد استفاده 144

6-2-3- انواع مدل های پشتیبانی تصمیم. 144

6-3- ابزار کسب دانش... 145

6-4- مکانیسم های استنباطی استفاده شده درCDSS. 147

6-5- پشتیبانی تصمیم با ابزارهای پیش بینی ساده 149

6-6- طراحی مفهومی DSS برای تشخیص و درمان بیماری.. 151

6-6-1- شبکه بیزین.. 152

6-6-2- درخت تصمیم. 153

6-6-3- شبکه عصبی.. 153

6-6-4- الگوریتم های ژنتیک... 154

6-6-5- شبکه های احتمالاتی علی (سببی) 154

6-6-6- جدول تصمیم. 155

6-6-7- استدلال مبتنی بر مورد. 156

6-6-8- سیستم های مبتنی بر قانون. 156

6-6-9- شرط منطقی.. 157

منابع و مراجع167


خرید و دانلود پایان نامه کامپیوتر سیستم های پشتیبان تصمیم گیری هوشمند

طراحی سیستم پیشنهاددهنده موسیقی ایرانی با استفاده از داده‌کاوی

عنوان تحقیق:طراحی سیستم پیشنهاد دهنده موسیقی ایرانی با استفاده از داده‌کاوی

فرمت فایل: word

تعداد صفحات: 89

شرح مختصر:

به دلیل رشد بی‌رویه فایل‌های موسیقی و ایجاد کتابخانه‌های عظیم دیجیتال، بازیابی اطلاعات موسیقی و سازمان‌دهی آن بر اساس نوع ژانر یا خواننده و یا حالت و ... تبدیل به چالشی مهم شده است. علاوه بر آن افراد ذائقه‌های مختلفی در انتخاب موسیقی دارند و یا در شرایط مختلف نیازهای متفاوتی به نوع و حالت موسیقی دارند که با توجه به حجم زیاد موسیقی یافتن فایل‌هایی که مرتبط با ذائقه و یا نیاز افراد باشد کاری دشوار به نظر می‌رسد از همین روست که در سال‌های اخیر توجه خاصی به بازیابی اطلاعات موسیقی شده است. هم اکنونفراداده‌یی نظیر نام فایل، خواننده، اندازه فایل، تاریخ وژانر به صورت معمول در رده‌بندی و بازیابی این رکوردها مورد استفاده قرار می‌گیرد. اما این دسته‌بندی‌ها پاسخ‌گوی نیاز دنیای امروز نیست.

هدف اصلی این پایان­نامه بهبود روش‌های پیشنهاددهی موسیقی با استفاده ازویژگی‌هایمحتواییو همچنین مدیریت پروفایل‌های مشتری می‌باشد. در راستای دست یافتن به این هدفرده‌بندی فایل‌های موسیقی در کلاس‌هایی مانند خواننده و ژانر و یافتن موسیقی‌هایی که از نظر موسیقیای به هم شباهت دارند و همچنین پیشنهاد بر اساس مشتری‌هایی که ذائقه‌های مشترک دارند را می‌توان به خدمت گرفت. در این پایان‌نامه در جهت رسیدن به اهداف ذکر شده، یکی ازکارهای انجام گرفته یافتن یک ویژگی رده­بندی جدید به نام Area Method of Moment می­باشد. این ویژگی بالاترین درصد کارایی را در رده‌بندی ژآنر به دست داده است. علاوهبراین، با استفاده از همین ویژگی‌هایی که نشان‌دهنده یک ویژگی موسیقیای خاص است میزان شباهت فایل‌های موسیقی به هم اندازه‌گیری شده و به کاربران پیشنهاد شده که با توجه به بازخورد کاربران به ارزیابی میزان صحت می‌پردازد. در ادامه برای به خدمت گرفتن روش Collaborative flittering به ارائه معیاری جدید در یافتن شباهت میان پروفایل‌هامی‌پردازیم. به دلیل این که هدف اصلی این پایان‌نامه کار کردن بر روی موسیقی ایرانی است، بنابراین به علت عدم وجود مجموعه داده مناسب، برای شروع مناسب، ایجاد مجموعه داده مناسب در اولویت تحقیق قرار گرفته است. شایان ذکر است که برای ارزیابی و دریافت بازخورد مشتریان، برنامه کاربردی با ویژگی‌های مذکور پیاده سازی شده است.

از آنجایی که در دنیای رقابتی امروز یافتن موسیقی مورد پسند افراد در صنعت فروش موسیقی از اهمیت بالایی برخوردار استروش‌های پیشنهاد شده در این تحقیق می‌تواند بسیار کاربردی باشد. با توجه به نتایج به دست آمده دراین تحقیق، امید آن می­رود که کمپانی‌های فروش موسیقی آن‌ها را در سطح تجاری مورد استفاده قرار دهند. همچنین روش‌های ارائه شده در این سیستم پیشنهاددهنده می‌تواند برای سایر سیستم‌های پیشنهاددهنده نیز مورد استفاده قرار گیرد.

 فهرست مطالب

عنوان صفحه

فصلاول:مقدمه

1-1 مقدمه2

1-2تعریف مساله2

1-3اهداف و دستاوردها4

1-4ساختارپایان نامه5

فصل دوم: بر متون گذشته مرور

2-1 مقدمه8

2-2موسیقی و ویژگی‌های آن8

2-2-1موسیقی چیست8

2-2-2ویژگی‌های صوتی موسیقی9

2-2-3تولید موسیقی10

2-3استخراج ویژگی‌های محتوایی از فایل صوتی13

2-3-1انواع ویژگی‌ها13

2-3-2 تقسیم بندی ویژگی‌ها از نظر طول فریم27

2-4 مجموعه داده‌ها28

2-5رده‌بندی موسیقی28

2-5-1رده‌بندی28

2-5-2رده‌بندی در متون گذشته31

2-6سیستم‌هایپیشنهاددهنده35

2-6-1انواع سیستم‌های پیشنهاددهنده35

2-6-2سیستم‌های پیشنهاد دهنده موسیقی37

2-7 نتیجه38

فصلسوم:روش پیشنهادی

3-1مقدمه40

3-2 تولید مجموعه داده از موسیقی ایرانی41

3-2-1جمع‌آوری داده‌ها و فرا داده‌ها و پیش پردازش41

3-2-2استخراج ویژگی‌ها42

3-2-3ویژگی‌های مجموعه داده‌ها43

3-3 ویژگی Area Method Of Moment of MFCC46

3-3-1عملگر Area Method Of Moment47

3-3-2روش محاسبه Area Method Of Moment of MFCC49

3-4معرفیمعیار شباهت پروفایل جدید49

3-4-1معیار شباهت پروفایل50

3-5برنامه کاربردی پیشنهاددهنده موسیقی52

3-5-1پیشنهاد دهی بر اساس شباهت موسیقی55

3-5-2پیشنهاد دهی بر اساس شباهت پروفایل56

3-6نتیجه57

فصل چهارم: ارزیابی

4-1مقدمه59

4-2ارزیابی برتریمجموعه داده تولید شده59

4-3ارزیابیویژگیArea Method Of Moment of MFCC61

4-3-1رده‌بندی سبک61

4-3-2رده‌بندی دستگاه‌های موسیقی سنتی66

4-3-3پیشنهاددهی با استفاده از ویژگی Area Method Of Moment of MFCC68

4-4ارزیابی معیار شباهت پروفایل69

4-5نتیجه69

فصلپنجم:نتیجه گیری و کارهای آینده

5-1مقدمه71

5-2دستاوردهای تحقیق72

5-3محدودیت­های تحقیق73

5-4کارهای آینده73

 فهرست شکل ها

عنوان صفحه

شکل2-1-فلوچارت محاسبه هیستوگرامضرب17

شکل 2-2- نمونه هیستوگرا مضرب17

شکل2-2-معیارspectral fluxبرایspeechتقریبابالاترازاین مقدار برایmusicاست.25

شکل2-4-درصدفریم‌های با انرژی پایین26

شکل2-5-یک نمونه درخت تصمیمگیری29

شکل3-1- پراکندگی تعدادویژگی‌هادردسته‌های مختلف44

شکل3-2- پراکندگی تعدادآهنگ‌هابرای سبک‌های مختلف45

شکل3-3- پراکندگی تعدادآهنگ‌هابرای دستگاه‌های مختلف46

شکل3-4-روش محاسبهArea Method of Moments of MFCC49

شکل3-5- شمای کلی از برنامه کاربردی54

شکل3-6- لیست موسیقی‌های در اختیارک اربر54

شکل3-7- مراحل انتخاب موسیقی براساس شباهت فایل‌های موسیقی55

شکل3-8- پیشنهاد دهی براساس شباهت موسیقی‌ها56

شکل3-9- پیشنهاد براساس شباهت پروفایل‌های مشتریان57

شکل4-1- درصد صحت برای هر ژانردردو آزمایش60

شکل4-2- معیارRecall- precision وF-measureبرای سبک‌های مختلف64

شکل4-3- معیارRecall- precision وF-measureبرای سبک‌های مختلف66

شکل4-4- معیارRecall- precision وF-measureبرای دستگاه‌های مختلف68

 فهرست جداول

عنوان صفحه

جدول2-1طبقه بندی ویژگی‌ها14

جدول2-2 تقسیم بندی بر اساس طول فریم استخراج27

جدول2-3مرور متون گذشته در ارتباط با رده‌بندی موسیقی31

جدول2-4مرور متون گذشته سیستم پیشنهاددهنده37

جدول3-1اطلاعات کلی از مجموعه داده43

جدول3-2پراکندگی تعداد ویژگی‌ها در دسته‌های مختلف44

جدول4-1 درصد صحت برای هر ژانر در دو آزمایش60

جدول4-2مجموعه آزمایش های انجام شده و ویژگی های آن37

جدول4-3مجموعه‌ها ویژگی‌های به کار رفتهدر آموزش درخت تصمیمی63

جدول4-4معیار Recall- precision وF-measure برای سبک مختلف63

جدول4-5مجموعه‌ها ویژگی‌های به کار رفته در آموزش درخت تصمیمی65

جدول4-6 معیار Recall- precision وF-measure برای موسیقی غربی65

جدول4-7 مجموعه‌ها ویژگی‌های به کار رفته در آموزش درخت تصمیمی67

جدول4-8معیار Recall- precision وF-measure برای دستگاه‌های مختلف67

جدول4-9 بازخورد به دست آمده از افراد69

جدول4-10 کارایی معیار پیشنهاد شده69

 


خرید و دانلود طراحی سیستم پیشنهاددهنده موسیقی ایرانی با استفاده از  داده‌کاوی

داده کاوی: مفاهیم، روشها، کاربردها، آینده

عنوان مقاله: داده کاوی: مفاهیم، روشها، کاربردها، آینده

قالب بندی: word

قیمت: 2300 تومان

فهرست:

  • مقدمه

معرفی داده‌کاوی و دلایل پیدایش آن

تعاریف داده کاوی

جایگاه داده‌کاوی در علوم کامپیوتر

 

  • طبقه بندی روش های داده کاوی

1. داده کاوی توصیفی یا توصیف کننده

2. داده کاوی پیشگویانه

  • مراحل و اجزای یک فرآیند داده‌کاوی

1. بیان مسئله و فرموله کردن فرضیه

2. انتخاب و جمع آوری داده ها

3. تبدیل و پیش پردازش داده ها

4. برآورد مدل یا کاوش در داده ها

5. تفسیر نتیجه یا تفسیر مدل و رسیدن به نتایج

  • آماده سازی داده ها

1. مدل استاندارد داده ها

2. دو وظیفه اصلی در آماده سازی داده ها

  • تبدیل و تغییر وضعیت داده های خام

1. نرمال سازی

1-1 مقیاس دهی اعشاری

2-1 نرمال سازی حداقل-حداکثر

3-1 نرمال سازی انحراف معیار

2. یکنواخت سازی داده ها

3. تفاضل ها و نسبت ها

  • مفهوم داده های از دست رفته و راه حل جبران داده های از دست رفته
  • مفهوم و روش های تشخیص داده های نامنطبق

1. روش های آماری 2. تشخیص داده های نامنطیق برمبنای فاصله 3. روش ها و تکنیک های برمبنای انحراف

  • کاهش داده ها
    1. اعمال اصلی در فرایند کاهش داده ها
    2. یافته های حاصل از کاهش داده ها

2-1 کاهش زمان محاسبه.

2-2 افزایش یادگیری در دقت پیشگویانه/توصیفی.

2-3 سادگی در ارائه مدل داده کاوی.

  • روش های نمونه گیری برای نمونه های بزرگ

1. نمونه گیری سیستمی.

2. نمونه گیری تصادفی.

3. نمونه گیری لایه ای.

4. نمونه گیری معکوس.

 


خرید و دانلود داده کاوی: مفاهیم، روشها، کاربردها، آینده