دانلود پایان نامه هوش تجاری _کارشناسی نرم افزار کامپیوتر
( قابل ویرایش )
چکیده:
درعصر حاضر شرکتها و سازمانها دیگر به جمعآوری و ذخیره اطلاعات در پایگاه دادههای عظیم نمیاندیشند، اکنون دغدغه اصلی شرکتها استفاده موثر از دادههای زیادی است که در پایگاه دادههای بزرگ ذخیره شدهاست.
سازمانها دیگر روی ذخیره رکوردهای اطلاعاتی حجیم سرمایه گذاری نمیکنند، بلکه برای سازمانها اطلاعات نهفتهای که در این رکوردها وجود دارد ارزشمند است، اطلاعاتی که به مدیران در تصمیمگیریهای کلان سازمان کمک میکند و میتواند وضعیت سازمان را در آینده پیشبینی کند.
هماکنون نیاز به سیستمهایی که روی تجزیه و تحلیل دادهها کار میکنند و از دادهها گزارشهای واقعی میگیرند، بیش از پیش احساس میشود، سیستمهایی که تحلیل پیچیده روی دادهها انجام میدهند.
چنین سیستمهایی، هوش تجاری نام دارند که در این پایاننامه به آن میپردازیم.
سیستمهای هوش تجاری، معانی مستتر در دادههای ذخیرهشده در پایگاه دادهها را بیرون میکشند و از آنها برای اتخاذ تصمیمات درست استفاده میکنند، در واقع تفسیر دادهها و استفاده از آنها برای اتخاذ تصمیمهای تجاری و تبدیل دادهها به شکل قابل تفسیر را هوش تجاری میگویند.
در این پروژه ابتدا به معرفی هوش تجاری و ابزارها و مفاهیم آن پرداخته شده است، سپس بخش پیادهسازی پروژه در BIDSو شیرپوینت تشریح شدهاست.
واژههای کلیدی
هوش تجاری، انبار داده، دادهگاه، پردازش تحلیلی برخط، پردازش تراکنشی برخط، دادهکاوی، سیستمهای تصمیمیار.
پس از ثبت ایمیل در محل مشخص شده پایین مطلب
و ادامه عملیات خرید لینک دانلود نمایش داده شده
و به ایمیل شما نیز ارسال می شود.
تعداد صفحه: 130
فرمت: docx ( قابل ویرایش )
چکیده
حجم بزرگ داده ها به تنهایی به مدیران سازمان ها در تصمیم سازی و تصمیم گیری هیچ کمکی نمی کند، بلکه باعث سردرگمی مدیران سازمان ها نیز می شود.بنابراین مدیریت داده های خام و تبدیل داده های خارجی و داخلی سازمان به اطلاعات و دانش با استفاده از تکنیک های گوناگون،نقش اساسی و محوری دارد.از تکنیک های معروف در این زمینه داده کاوی است،که می تواند بر روی بانک اطلاعاتی انجام شود و دانش مورد نیاز را بدست آورد.در فصل اول به بررسی این مفهوم پرداختیم. کاوش خوشه ها نیز یکی از تکنیک های حائز اهمیت در زمینه رو به رشد،معروف به داده کاوی اکتشافی می باشد که در رشته های گوناگون مهندسی و علمی از قبیل زیست شناسی،روان شناسی،پزشکی،بازاریابی،کامپیوتر و نقشه برداری ماهواره ای به کار گرفته شده است. این مفهوم در فصل های سوم و چهارم دنبال شده است.در فصل سوم به یکی از الگوریتم های خوشه بندی به نام CStree پرداخته شده و نقاط ضعف این الگوریتم نیز مطرح شده است .تحلیل خوشه ها،اطلاعات را بوسیله یک ساختار اساسی مختصر بدو شکل گروه بندی تنها یا گروه بندی سلسله مراتبی سازماندهی می نماید.خوشه بندی ،ابزاری برای اکتشاف ساختارهایی از درون داده هاست که نیاز به هیچ فرضی از آنها نیست.این روش در هوش مصنوعی و شناسایی الگو،یادگیری بدون ناظر نامیده می شود.الگوریتم های خوشه بندی گوناگونی برای استخراج دانش از درون مجموعه اطلاعات مختلف وجود دارد.اما عموما این الگوریتم ها حساس به داده های مورد آزمایش و برخی پارامترهای اولیه می باشند،لذا نتایج حاصل از آنها وابسته به ساختار داده ها می باشد.تاکنون الگوریتمی ارائه نشده است که بتواند هر گونه ساختار داده ای را استخراج نماید. یکی دیگر از پدیده های نوظهور در دنیای اطلاعات،داده های جریانی می باشند.این پدیده که در فصل چهارم مطرح شده است،اشاره به حجم وسیعی از اطلاعات انباشته شده دارد که محدودیت های فراوانی برای پردازش ایجاد کرده اند.اندازه این داده ها بیش از حافظه اصلی،یکی از این موانع می باشد.لذا می بایست الگوریتم های جدیدی برای برخورد با این گونه داده ها توسعه یابند
تعداد صفحات 112 word
فهرست مطالب
تقدیم به: 3
تقدیر و تشکر. 4
فصل اول مقدمه ای بر داده کاوی. 1
1-1 مقدمه 2
1-2عامل مسبب پیدایش داده کاوی. 2
1-3داده کاوی و مفهوم اکتشاف دانش (K.D.D) 3
1-3-1 تعریف داده کاوی. 5
2-3-1 فرایند دادهکاوی. 6
1-3-3 قابلیتهای داده کاوی. 7
4-3-1 چه نوع دادههایی مورد کاوش قرار می گیرند؟ 8
4-1 وظایف داده کاوی. 9
1-4-1 کلاس بندی. 10
2-4-1 مراحل یک الگوریتم کلاسبندی. 11
3-4-1 انواع روشهای کلاسبندی. 11
1-3-4-1 درخت تصمیم. 12
1-1-3-4-1 کشف تقسیمات.. 13
2-1-3-4-1 دسته بندی با درخت تصمیم. 15
3-1-3-4-1 انواع درختهای تصمیم. 17
4-1-3-4-1 نحوهی هرس کردن درخت.. 17
2-3-4-1 بیزی. 18
1-2-3-4-1 تئوری بیز. 20
2-2-3-4-1 دسته بندی ساده بیزی. 22
4-4-1 ارزیابی روشهای کلاسبندی. 28
4-1-6 انواع روشهای پیش بینی. 29
1-4-6-1 رگرسیون. 29
1-4-6-1-1 رگرسیون خطی. 29
1-4-6-1-2 رگرسیون منطقی. 31
1-4-7 تخمین. 32
فصل دوم خوشه بندی. 34
2 1-تعریف فرایند خوشهبندی. 35
2-2 روش ها و الگوریتمهای خوشهبندی. 36
2-3 روش و الگوریتم سلسله مراتبی. 37
2 3-1-روش های سلسلهمراتبی. 37
2 3-2-الگوریتم های سلسله مراتبی. 38
2-3-3- الگوریتم خوشه بندی single-linkage. 39
2 3-4-الگوریتمهای تفکیک... 45
3-5-2روشهای متکی برچگالی. 46
3-7-2 روشهای متکی بر مدل. 47
فصل سوم خوشه بندی CS tree. 48
3-1مقدمه 49
3-2 مروری بر روش های خوشه بندی جریان داده 50
3-3 خوشه بندی توری جریان داده 52
3-1-3 مروری بر روش خوشه بندی توری CS tree. 53
3-2- 3 بررسی نقاط ضعف الگوریتم CS tree. 56
3-4 الگوریتم پیشنهادی. 60
3-1-4 بازتعریف مفهوم همسایگی و رفع مشکل تقسیم بی معنی خوشه ها 63
3-5 اصلاح روند بروز رسانی خوشه ها 66
3-6 اصلاح ساختار نمایش خوشه ها 67
فصل چهارم جریان داده و مدل های ان. 69
4-1 مقدمه 70
4-2 کاربردهای داده های جریانی. 71
4-2-1 شبکه های حسگر. 71
4-2-2 تحلیل ترافیک شبکه 72
4-2-3 محرک های مالی. 73
4-2-4 تحلیل تراکنش ها 73
4-3 مدل داده های جریانی. 74
4-4 زیربنای نظری. 75
4-4-1 تکنیک های مبتنی بر داده 76
4-4-1-1 نمونه برداری. 76
4-4-1-2 پراکنده ساختن بار 77
4-4-1-3 طراحی اولیه 77
4-4-1-4 ساختمان داده خلاصه 78
4-4-1-5 انبوه سازی. 78
4-4-2 تکنیک های مبتنی بر وظیفه 78
4-4-2-1 الگوریتم های تخمین. 79
4-4-2-2 الگوریتم های مبتنی بر پنجره 79
4-4-2-3 الگوریتم های دانه دانه سازی نتایج. 80
4-5 خوشه بندی داده های جریانی. 80
4-5-1 بهبود روش های سنتی. 81
4-5-1-1 الگوریتم CLARANS. 82
4-5-1-2 الگوریتم BIRCH.. 84
4-5-2 ظهور تکنیک های جدید. 87
4-5-2-1 الگوریتم مبتنی بر چگالی DBSCAN.. 87
4-5-2-2 الگوریتم مبتنی بر گریدSTING.. 90
4-6 بحث در مورد الگوریتم ها 93
4-6-1 ایا توسعه روش های سنتی درست است؟ 93
4-6-2 روش های جدید چه پیشنهاداتی دارند؟ 94
منابع. 96
فهرست اشکال
شکل 1-1 فرآینده داده کاوی.. 7
شکل1-2 نمونه یک درخت تصمیم.. 13
شکل 1-3 یک تقسیم بندی خوب ، درجه خلوص را برای فرزندان افزایش می دهد. 15
شکل 3-1 تقسیم خوشه های با معنی به زیر خوشه های بی معنی.. 58
شکل3-2 خطاهای روش Cs tree در ترکیب خوشه های یک بعدی و ایجاد خوشه های چند بعدی- قسمت A خطا در تعداد خوشه ها ، قسمت B خطا در شکل خوشه ها، قسمت C خطا در مرز خوشه ها59
شکل3 -3 روی هم افتادگی خوشه ها در بروز رسانی به روش Cs tree. 60
شکل 4-2 الگوریتم خوشه بندیCLARA.. 82
شکل 4-3 الگوریتم خوشه بندیCLARANS . 84
شکل 4-4 الگوریتم خوشه بندیBIRCH.. 86
شکل 4-6 الگوریتم خوشه بندی.STING.. 92
عنوان مقاله: طراحی SPAM: ابزاری برای کاوش در شبکة گستردة جهانی
قالب بندی: word
تعداد صفحات: 19
قسمتی از متن:
ما در «عصر اطلاعات» زندگی میکنیم، عصری که در آن انسانها بیش از هر زمان دیگری در گذشته داده و اطلاعات تولید و منتشر میکنند. در واقع اطلاعاتی که در اختیار ما قرار دارد خیلی بیشتر از آن است که بتوانیم آن را تجزیه و تحلیل کنیم. به این ترتیب انتخاب منابع مورد نظر کاربر از این حجم ریاد اطلاعات روز به روز مشکلتر می شود، که این مسئله به دلایل مختلفی است که از آن جمله می توان به موارد زیر اشاره کرد:
1- وب خیلی بزرگ و متنوع است. مطالعهای[1] نشان داده است که بیش از 10 بیلیون صفحه با دسترسی عمومی در وب وجود دارد. علاوه بر این، تقریباً هر ماه 6 ترا بایت اطلاعات جدید به وب اضافه میشود.
2- داده های وب به سرعت در حال تغییرند. در حینی که وب به سرعت از لحاظ اندازه رشد می کند، اطلاعات آن هم مدام تغییر میکنند و به روز میشوند.
3- وب خیلی بد سازماندهی شده است. گر چه ممکن است بخشهای کوچکی از وب خوب سازماندهی شده باشند و به خوبی نگهداری شوند اما کل وب کاملاً غیر ساخت یافته است.
علاوه بر اینها وب کاربران خیلی متفاوتی داردو هرکاربری ممکن است تنها به بخش کوچکی از وب علاقمند باشد. در نتیجه، کاربران بر خط مشکلات زیادی در یافتن اطلاعات موردنظرشان دارند.
موتورهای جستجو به کاربران در یافتن منابع اطلاعاتی مرتبط کمک میکنند. اما موتورهای جستجو دارای مشکلات زیادی هستند. یک عنوان ممکن است صدها یا هزاران سند را شامل شود که باعث میشود موتور جستجو تعداد زیادی سند شامل اسناد غیرمرتبط برگرداند. تعداد زیادی از اسنادی که کاملاً به عنوان مورد نظر وابسته هستند هم ممکن است دارای کلمات کلیدی که آن موضوع را تعریف میکند، نباشند.