استفاده از روشهای داده کاوی برای پیش بینی سطح خسارت مشتریان بیمه بدنه اتومبیل

عنوان پایان نامه: استفاده از روشهای داده کاوی برای پیش بینی سطح خسارت مشتریان بیمه بدنه اتومبیل

فرمت فایل: word

تعداد صفحات: 40

شرح مختصر: امروزه نقش مشتریان از حالت پیروی از تولید کننده ،به هدایت سرمایه گذاران ، تولید کنند گان و حتی پژوهش گران و نوآوران مبدل گشته است ،به همین دلیل سازمان ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه ریزی کنند .تاکنون از برخی روش های آماری و یادگیری ماشینی برای این منظور استفاده شده است که البته این روش ها به تنهایی دارای محدودیت هایی هستند که در این پژوهش سعی شده است تا با بهره گیری از روش های مختلف داده کاوی تا حد ممکن این محدودیت ها از بین برده و بر طبق آن ،چارچوبی برای شناسایی مشتریان بیمه بدنه اتومبیل ارایه شود . در واقع هدف این است تا مشتریانی را که بیشتر به یکدیگر شبیه هستند دسته بندی و با استفاده از این دسته ها و ویژگی های آن ،میزان خطر پذیری هر دسته را پیش بینی کرد . حال با استفاده از این معیار (میزان خطر پذیری هر دسته) و نوع بیمه نامه مشتری می توان میزان خسارت او را پیش بینی کرد که این معیار می تواند کمک شایانی برای شناسایی مشتریان و سیاست گذاری های تعرفه بیمه نامه باشد . برای این منظور، از روش داده کاوی ،درخت تصمیم برای ایجاد مدل پیش بینی خطر پذیری مشتریان در صنعت بیمه استفاده شده است .فن درخت تصمیم برای این منظور نتایج بهتری را به دست اورده است.

فهرست مطالب

چکیده1

1-1- مقدمه. 2

1-2- تاریخچه داده کاوی.. 2

1-3- روشهای پیشین و فعالیت های مرتبط با پژوهش... 4

1-4- مدیریت ذخیره سازی و دستیابی اطلاعات.. 5

1-5- ساختار بانک اطلاعاتی سازمان :7

1-6- داده کاوی :((Data Mining. 7

1-6-1- داده کاوی چیست؟. 7

1-6-2- مفاهیم پایه در داده کاوی.. 8

1-6-3- تعریف داده کاوی.. 8

1-6-4- برخی از این تعاریف عبارتند از :8

1-6-4-1- مراحل فرایند کشف دانش از پایگاه داده ها9

1-7- تفسیر نتیجه. 9

1-8- انبارش داده ها9

1-9- انتخاب داده ها10

1-10- تبدیل داده ها10

1-11- عملیات های داده کاوی.. 10

1-11-1- مدل سازی پیشگویی کننده11

1-11-2- تقطیع پایگاه داده ها12

1-11-3- تحلیل پیوند. 12

1-11-4- تشخیص انحراف.. 12

1-12- الگوریتم های داده کاوی.. 13

1-12-1- دسته بندی.. 14

1-12-2-رگرسیون. 15

1-12-3- سری‌های زمانی.. 16

1-12-4- پیش بینی.. 16

1-12-5- تکنیک های روش توصیفی.. 16

1-12-6- قوانین انجمنی.. 16

1-12-7- خلاصه سازی (تلخیص)17

1-12-8- مدل‌سازی وابستگی (تحلیل لینک)17

1-12-9- خوشه بندی.. 18

1-12-9-1- معیارهای ارزیابی الگوریتم‌های خوشه بندی.. 18

1-12-9-2- طبقه بندی روش‌های خوشه بندی.. 19

1-12-10- الگوریتم Apriori19

1-12-11- الگوریتم K-Means20

1-12-11- 1-گام ‌های الگوریتم k-means20

1-12-11-2- ویژگی‌های الگوریتم k-means20

1-12-11-3- رفع اشکالات الگوریتم k-means:21

1-12-12- شبکه های عصبی.. 21

1-12-13- درخت تصمیم. 22

1-13- روش پیشنهادی.. 23

1-14- جامع آماری و نمونه آماری.. 23

1-15- مراحل پژوهش... 23

1-16-پیش پردازشداده ها25

1-17- معرفی مشخصه ها26

1-18- مشخصه هدف.. 27

1-19- انتخاب مشخصه. 27

1-20- نرم افزارهای داده کاوی.. 27

1-21- پیاده سازی مدل های داده کاوی.. 30

1-21-1- درخت تصمیم. 30

1-21-2- تحلیل درخت تصمیم. 30

منابع 34

شکل 1-1- دسته بندی پژوهش ها در زمینه ی داده کاوی.. 4

شکل 1-2- نمودار پردازش اطلاعات.. 6

شکل1-3- مدیریت داده ها6

شکل 1-4- ساختار بانک اطلاعاتی.. 7

شکل 1-5- تجزیه و تحلیل KDD. 8

شکل 1-6- یک شبکه عصبی با یک لایه پنهان. 22

شکل 1-7- مراحل پژوهش... 25

شکل 1-8- درخت تصمیم. 31

شکل 1-9- درخت تصمیم. 32

شکل 1-10- درخت تصمیم 33

 


خرید و دانلود استفاده از روشهای داده کاوی برای پیش بینی سطح خسارت مشتریان بیمه بدنه اتومبیل

سیستم های اطلاعات مدیریت

عنوان مقاله : سیستم های اطلاعات مدیریت

قالب بندی : PDF

قیمت : 2400 تومان

شرح مختصر : امروزه تجارت ثانیه به ثانیه دگرگون میشود و ساختاری پیچیده تر به خود میگیرد. در این شرایط، مدیران با انبوهی از اطلاعات مواجه هستند که این اطلاعات باید تحلیل، قابل فهم، نگهداری و بازیابی گردد. وقتی مدیر یک سازمان می خواهد تصمیم بگیرد، داده های فراوانی که اغلب مفید نیستند، در اختیارش قرار می‌گیرد. این داده ها باید پالایش و معنی‌دار شوند و به اطلاعات مفید تبدیل شوند. اینجا است که نیاز به سیستمهای اطلاعات مدیریت احساس می شود. دانش سیستمهای اطلاعات مدیریت، اطلاعات مربوط به زمان گذشته و حال را گردآوری میکند، امکان پیشبینی آینده را فراهم میآورد و اطلاعات مورد نیاز مدیران را در اختیار آنها قرار میدهد تا بتوانند تصمیمات مقتضی را اتخاذ کنند. همانطور که از عبارت تعریف کننده اش پیداست، به سه بحث گسترده ی مدیریت، اطلاعات و سیستم پیوند خورده است. برای این منظور این مقاله در فصلهای مجزا، سه مقوله ی اساسی را مورد بحث قرار میدهد و در نهایت به شرح اختصاصی MIS میپردازد.


خرید و دانلود سیستم های اطلاعات مدیریت

مقایسه دقت تکنیکهای کلاسه بندی در داده کاوی با استفاده از دیتاست پزشکی

چکیده

در این مطالعه ، 5 روش کلاسه بندی متداول ، درخت تصمیم ، بیزین ، k نزدیکترین همسایه ، شبکه های عصبی و ماشین بردار پشتیبان بر روی شش مجموعه ی داده ی پزشکی سرطان سینه ، هپاتیت ، تیروئید ، دیابت ، تومور اولیه و بیماری قلبی مورد تست و ارزیابی قرار گرفتند.معیار ارزیابی میزان دقت هر روش بوده و برای تست هر روش از نرم افزار weka با مقادیر پیش فرض استفاده گردید.نتایج حاصله نشان می دهد .که اگر چه بعضی از کلاسه بندی ها نسبت به بقیه بهتر عمل می کنند ولی بطور کلی هیچ روش کلاسه بندی وجود ندارد که روی تمام مجموعه داده های مذکور از دقت بهتری برخوردار باشد و برای هر مجموعه داده یک روش کلاسه بندی خاص نسبت به سایر روش ها از دقت مطلوبی برخوردار می باشد.

مقدمه

استفاده از داده کاوی در پزشکی یکی از زمینه های پرکاربرد داده کاوی محسوب می شود که در سال های اخیر تحقیقات و مطالعات زیادی پیرامون ان انجام شده است. دسته مهمی از مسائل در علم پزشکی مربوط به تشخیص بیماری ها می باشد که بر اساس ازمایشات مختلف بر روی بیمار انجام می گیرد. هنگامی که تعداد پارامترها در تشخیص بیماری زیاد شود ممکن است تشخیص بیماری حتی برای یک متخصص خبره پزشکی نیز به سختی امکانپذیر باشد. همین دلیل موجب شده است که در چند دهه اخیر ابزار تشخیص کامپیوتری با هدف کمک به پزشک مورد استفاده قرار گیرد تا به نحوی بی نظمی را از داده ها خارج کند.

در این پژوهش 5 روش متداول کلاسه بندی بر روی شش مجموعه داده ی پزشکی مورد تست و ارزیابی قرار می گیرد.معیار ارزیابی روش های کلاسه بندی میزان دقت هر روش می باشد.در تست روش ها از نرم افزار داده کاوی weka با مقادیر پیش فرض برای هر الگوریتم استفاده می گردد.

 

تعداد صفحات 82 word 

 

فهرست مطالب

فصل یکم مفاهیم داده کاوی.. 1

مقدمه. 2

1-1- مروری بر کشف دانش و داده کاوی.. 3

1-2 عوامل پیدایش داده کاوی.. 4

1-3 مراحل کشف دانش.... 7

1-3-1 استخراج داده ها 8

1-3-2 اماده کردن داده ها 9

1-3-3 مهندسی الگوریتم و تعیین استراتژ ی های کاوش... 10

1-3-3 اجرای الگوریتم کاوش و ارزیابی نتایج.. 11

1-4 جایگاه داده کاوی در میان علوم مختلف... 15

1-5 داده کاوی چه کارهایی نمی تواند انجام دهد. 17

1-6 داده کاوی و انباره داده ها 18

1-7 داده کاوی و OLAP. 20

1-8 کاربرد یادگیری ماشین و امار در داده کاوی.. 21

1-9 روش های یادگیری.. 22

1-10 روش های کاوش... 23

فصل دوم کلاسه بندی و پیشگویی.. 25

2-1 کلاسه بندی.. 26

2-2 انواع روش های کلاسه بندی.. 30

2-3 ارزیابی روش های کلاسه بندی.. 31

فصل سوم تکنیک های کلاسه بندی معروف.. 33

3-1 درخت تصمیم.. 34

3-2 بیزین.. 35

3-2-1 تئوری بیز. 36

3-2-2 نحوه کلاسه بندی به روش بیز ساده. 37

3-3 روش کلاسه بندی نزدیکترین k- همسایه. 41

3-4 روش کلاسه بندی شبکه های عصبی.. 43

3-5 روش کلاسه بندی ماشین بردار پشتیبان.. 50

فصل چهارم مقایسه و ارزیابی تکنیک های کلاسه بندی.. 52

4-1 مجموعه داده های مورد استفاده. 53

4-1-1 مجموعه داده سرطان سینه Wisconsin. 53

4-1-2 مجموعه داده هپاتیت... 54

4-1-3 مجموعه داده هیپوتیروئید( پرکاری تیروئید) 54

4-1-4 مجموعه داده دیابت... 55

4-1-5 مجموعه داده تومور اولیه. 55

4-1-6 مجموعه داده بیماری قلبی.. 56

4-2 نرم افزار Weka. 56

4-2-1 معرفی نرم افزار weka. 57

4-3 تست روشها 59

فصل پنجم نتیجه گیری.. 62

نتیجه. 63

پیوست... 64

پیوست الف - اموزش نرم افزار weka. 64

یوست ب- روش ارزیابی k- تکه برابر. 71

منابع.. 72

 

فهرست اشکال

شکل 1-1-داده کاوی به عنوان یک مرحله از فرایند کشف دانش.... 4

شکل1-2-سیر تکاملی صنعت پایگاه داده. 5

شکل 1-3-معماری یک نمونه از سیستم داده کاوی.. 13

شکل 1-4-استخراج داده ها از انبار داده ها 19

شکل 1-5-استخراج داده ها از چند پایگاه داده. 19

شکل 1-6- انواع یادگیری استنتاجی.. 22

شکل 2-1-مثالی از فرایند دو مرحله ای کلاسه بندی.. 28

شکل 2-2-عملکرد کلاسه بندی.. 29

شکل 3-1-نمونه ای از یک درخت تصمیم.. 34

شکل 3-3- شبکه عصبی با یک لایه نهان.. 44

شکل 3-4- الگوریتم Backpropagation. 45

شکل 3-5- یک گره در لایه نهان یا خروجی.. 46

شکل 3-6-مثالی از کلاسه بندی SVM... 51


خرید و دانلود مقایسه دقت تکنیکهای کلاسه بندی در داده کاوی با استفاده از دیتاست پزشکی

تکنینکهای خوشه بندی

عنوان مقاله: تکنینکهای خوشه بندی CLUSTERING TECHNIQUES

قالب بندی: word

تعداد صفحات: 33

شرح مختصر:

هدف این گزارش فراهم کردن مطالعه ای جامع، از تکنیکهای متفاوت خوشه بندی، در داده کاوی است. خوشه بندی, تقسیم داده ها به گروههایی از اشیا مشابه است. هر گروه، خوشه نامیده می شود، که اشیاء هر خوشه به یکدیگر شبیه بوده ونسبت به اشیاء دیگر خوشه ها شبیه نیستند. نمایش داده ها با تعداد خوشه های کم، به الزام باعث از بین رفتن جزئیاتخواهد شد (شبیه از دست رفتن اطلاعات، در فشرده سازی)، اما این کار باعث ساده سازی مسائل می شود. تکنیک خوشه بندی، تعداد زیادی از اشیاء داده ای را با تعداد کمی خوشه، نمایش می دهد، بنابراین این تکنیک، داده ها را با خوشه های شان مدل می کند. به لحاظ مدلسازی داده ها ریشه های ایجاد تکنیک خوشه بندی، ریاضیات، آمار و آنالیزعددی می باشد. ازدیدگاه یادگیری ماشین ، خوشه ها مترادف با الگوهای مخفی ، جستجو برای یافتن خوشه ها یعنی یادگیری بی سرپرست ، و سیستم حاصل بیانگر مفهوم داده ، می باشد. بنابراین، خوشه بندی یادگیری بی سرپرست مفهوم داده مخفی،می باشد.

داده کاوی با پایگاه داده های بزرگ، نیازهای سخت محاسباتی به تکنیک آنالیز خوشه ها تحمیل می کند. این چالش و راه حل های ارائه شده برای آن در داده کاوی، مورد توجه این گزارش می باشد.

فهرست مطالب:

١- مقدمه

٢- معرفی داده کاوی

2-1 چه چیزی سبب پیدایش داده کاوی شده است؟

2-2داده کاوی چیست؟

2-3چه نوع الگوهایی با داده کاوی قابل دریافت هستند؟

٣- تکنیکهای داده کاوی

3-1 تکنیک توصیف مشخصه

3-2 آنالیز تداعی

3-3 کلاس بندی و پیش بینی

3-4 آنالیز خوشه ها

3-5 آنالیز عدم توافق

3-6 آنالیز سیر تکامل

4- تکنیک خوشه بندی

4-1 علائم نشانه گذاری

4-2 شرح مختصر تاریخجه تکنیک خوشه بندی

4-3 دسته بندی الگوریتمهای خوشه بندی

4-4 شرح دسته بندی الگوریتمهای خوشه بندی

4-5 نتایج مهم

۵- خوشه بندی سلسله مراتبی

5-1 اندازهء اتصال

5-2 خوشه بندی سلسله مراتبی با اشکال دلخواه خوشه

5-3 افراز تقسیمی دودویی

5-4 دیگر توسعه ها

6-روشهای افرازی بازمکانی

6-1 خوشه بندی احتمالاتی

6-2روشهای مبتنی بر k- میانه

6-3 روشهای مبتنی برk-متوسط

٧- افراز بر اساس تراکم

7-1اتصال مبتنی برتراکم

7-2تابع تراکم

٨- جمع بندی

 


خرید و دانلود تکنینکهای خوشه بندی

یادگیری ماشین

عنوان پایان نامه: یادگیری ماشین (Machin learning)

پروژه پایانی دوره کارشناسی - رشته مهندسی نرم افزار

قالب بندی: word

تعداد صفحات: 172

فهرست مطالب:

1. فصل 1 یادگیری ماشین

1-1 چکیده

1-2 یادگیری چیست؟

1-3 نگاهی به فردا

1-4 یادگیری ماشین

1-4-1 هدف

1-5 ماشین یادگیرنده

1-5-1 روند تکاملی ماشین های یادگیرنده

1-5-2 انواع ماشین های یادگیرنده

1-5-3 اجزاء ماشین های یادگیرنده

1_5_4 مشکلات ماشین های یادگیرنده

1-6 روشهای یادگیری عامل

1-7 مسائل اساسی یادگیری

1-8 روند عملیاتی

1-9 قوانین یادگیری

1-9-1 روش AQ11

1-9-2روش CN2

1-9-3 درخت تصمیم

1-10 طراحی یک سیستم یادگیری

1-10-1 انتخاب Training Experience

1-10-2 انتخاب تابع هدف

1-10-3 انتخاب نحوه نمایش تابع هدف

1-10-4 انتخاب الگوریتم شبیه سازی

1-10-5 طراحی نهایی

1-11 کاربردهای ماشین های یادگیرنده

1-12 تکنیک های یادگیری ماشین

1-12-1 درخت تصمیم گیری

1-12-2 شبکه های عصبی

1-12-3 منطق فازی

1-12-4 یادگیری از طریق منطق مخاسباتی

1-12-5 محاسبات تکاملی

1-12-5-1 الگوریتم ژنتیک

1-12-6 یادگیری تقویتی

 فصل 2 داده کاوی

مقدمه

2-1 تعریف تئوریک از داده کاوی

2-2 جایگاه داده کاوی

2-2-1 چند واقعیت

2-3 مراحل یک فرایند داده کاوی

2-4 پایه های یک فرایند داده کاوی

2-5 کاربردهای داده کاوی

2-6 مقوله کاهش ابعاد داده

2-6-1 پروسه کشف دانش از پایگاه داده

2-6-2 ویژگی های KDD

2-6-3 استخراج داده ها

2-6-4 آماده کردن داده ها

2-6-5 مهندسی داده ها

2-6-6 مهندسی الگوریتم و تعیین استراتژی های کاوش

2-7 زبان های پرسشی داده کاوی

2-8 کلاسه بندی و پیشگویی داده ها

2-8-1 انواع روشهای کلاسه بندیگ

2-8-2 مراحل یک الگوریتم کلاسه بندی

2-8-3 ارزیابی روشهای کلاسه بندی

2-9 خوشه بندی

2-9-1 تعریف فرایند خوشه بندی

2-9-2 کیفیت خوشه بندی

2-9-3 روش ها و الگوریتم های خوشه بندی

2-9-4 دسته بندی ویژگی های الگوریتم های خوشه بندی

2-10 داده کاوی با استفاده از استنتاج و یادگیری بیزی

2-10-1 تئوری بیز

2-10-2 اصل طول توصیف مینیمم

2-10-3 الگوریتم Gibbs

2-10-4 طبقه بندی ساده بیزی

2-10-5 تخمین زدن احتمالات

2-10-6 الگوریتم EM

نتیجه گیری

 فصل 3 شبکه های عصبی

مقدمه

3-1 تاریخچه

3-2 ایده پیدایش شبکه های عصبی

3-3 پباهن با مغز

3-4 روش کار نرون ها

3-5 مدل ریاضی

3-6 پیاده سازی های الکترونیکی نرون ها مصنوعی

3-7 عملیات شبکه های عصبی

3-8 آموزش شبکه های عصبی

3-9 آموزش تطبیقی

3-10 تفاوت شبکه های عصبی با روش های محاسباتی متداول و سیستم های خبره

3-11 انواع یادگیری برای شبکه های عصبی

3-11-1 باناظر

3-11-2 تشدیدی

3-12 زمینه‌ای در مورد perceptron

3-12-1 قدرت protron

3-12-2 دنباله های protron

3-13 قضیه بنیادی دنباله ها

3-14 کاربردهای شبکه های عصبی مصنوعی

3-15 مزیت شبکه های عصبی

3-16 قوانین فعال سازی

نتیجه

 فصل 4 الگوریتم ژنتیک

مقدمه

4-1 الگوریتم ژنتیک چیست؟

4-2 طبیعت ایده اولیه

4-3 رابطه تکامل طبیعی با هوش مصنوعی

4-4 چارچوب کلی الگوریتم های ژنتیک

4-4-1 شرط پایان الگوریتم

4-5 روش های نمایش

4-6 عملگرهای الگوریتم ژنتیک

4-6-1 تابع سازگاری

4-6-2 انتخاب

4-6-3 CrossOver

4-6-4 موتاسیون ( جهش )

4-6-5 جایگزینی

4-7 مزایا و معایب

4-8 کاربردهای الگوریتم ژنتیک

4-8-1 نمونه ای از کاربرد در مسائل بهینه سازی مهندسی نفت

4-8-2 کاربرد الگوریتم ژنتیک در شبکه های عصبی

4-8-3 هایپر هیوریستیک

4-9 روند الگوریتم ژنتیک با یک نمونه ساده

نتیجه

 


خرید و دانلود یادگیری ماشین