عنوان پایان نامه: بررسی جنبه های مختلف Web Data Mining
فرمت فایل: word
تعداد صفحات: 92
شرح مختصر:
در عصر حاضر Web Mining محیط اینترنت جهانی را تبدیل به محیطی کاربردی تر کرده است.که کاربران میتوانند سریعتر و راحتتر اطلاعات مورد نیازشان را پیدا کنند که شامل :کشف و تحلیل داده ، مستندات وmulti media از محیط اینترنت جهانی میباشد ,Web Mining از جزئیات سند ومحتویات سند و ساختار Hyper Link برای کمک به کاربر جهت مشاهده اطلاعات مورد نیازش استفاده میکند.
وب و موتورهای جستجو خودشان شامل اطلاعات ارتباطی درباره ی مستندات هستند و Web Mining این ارتباطات را کشف میکند و به سه بخش تقسیم بندی مینماید.
- در اولین بخش Web Content Mining، موتورهای جستجو محتویات را با کلمات کلیدی تعریف میکنندومی شناسند.پیدا کردن کلمات کلیدی محتوا و پیدا کردن یک ارتباط بین محتوای صفحه ی وب و محتوای سوال کاربر، Content Mining گفته میشود.
- Hyper Linksاطلاعاتی را درباره ی سایر مستندات روی وب که در سند دیگری مهم هستند تهیه میکند.این لینکها عمقی را به سند اضافه میکنند و حالت چند بعدی که از خصوصیات وب است ایجاد میکنند. کاوش این ساختار لینک دومین بخش یعنی Web Structure Mining است.
- در نهایت ارتباطی با سایر مستندات روی وب که بوسیله ی جستجوی قبلی شناخته شده اند، وجود دارد. این ارتباط در صفحه های جستجو (log) و دستیابی ذخیره میشود. کاوش این Log ها سومین بخش یعنی Web Usage Mining را تشکیل میدهد.
درک کاربر اغلب یک بخش مهم از Web Mining است. تحلیل جستجوهای قبلی کاربر ،شکلی که کاربر ترجیح میدهد اطلاعات پیدا شده را ببیندو سرعت در پاسخ ممکن است در پاسخ دادن به پرس و جوی کاربر موثر باشد.
Web Mining در ماهیت نظم خاصی دارد.پل زدن بین فیلدهایی مثل اطلاعات بازگشتی ،پردازش زبانهای طبیعی، استخراج اطلاعات ،Machine Learning، پایگاه داده ،داده کاوی ،ذخیره ی داده ، طراحی رابط کاربر و Visual کردن .
تکنیکهای Web Mining کاربردهای عملی در M-commerce ،E-commerce ، E-Government ،E-learning ، آموزش از راه دور ، آموزش سازمانی،تشکیلات مجازی ، مدیریت دانش و کتابخانه ی دیجیتال دارد.
در این تحقیق ما به بررسی جنبه های مختلف Web Data Mining میپردازیم.
فهرست مطالب
فصل اول : داده کاوی و وب.. 3
مقدمه4
طبقه بندی Web mining. 5
داده کاوی و visualization در اینترنت.. 7
کاوش الگو. 8
وب کاوی در E-Commerce. 9
فصل دوم : پردازشها و تکنیکهایweb data mining. 11
مقدمه11
مراحل Data mining. 16
مراحل جستجو. 17
پردازش روی نتایج. 18
جنبههای واسط کاربر. 19
خروجیهای data mining web:21
پیاده سازیهای data mining web:23
فصل سوم : کاوش پایگاه داده های وب.. 29
مقدمه30
جستجو در پایگاه دادةها در وب.. 30
داده کاوی شیئی – رابطهای. 31
اشتراک داده در مقابل داده کاوی در وب.. 31
کاوش پایگاههای دادة نیمه ساختیافته32
کاوش و سپس ادغام33
Web mining و Meta data. 34
کاوش متادیتا35
انبار و کاوش.. 35
متادیتا برای کاوش چند رسانهای. 36
متا دیتا برای web mining. 36
کاوش پایگاه دادههای توزیع شده، ناهمگن ، وراثتی و متحد در وب.. 37
ماژولهایی از DP برای داده کاوی. 37
داده کاوی روی پایگاه داده توزیع شده38
کاوش و سپس اجتماع. 38
کاوش interoperating و مخزن. 39
همکاری میان عاملهای کاوش.. 39
واسط برای مجتمع سازی. 40
معماریها وweb data mining. 41
ماژولهای داده کاوی مثل اشیاء41
فصل چهارم : بازیابی اطلاعات و داده کاوی در وب.. 44
مقدمه45
موتورهای جستجوگر. 46
ماژولهای موتورهای جستجو. 46
web data mining برای موتورهای جستجو. 47
پویش داده های چند گانه وب.. 48
کاوش متن. 49
کاوش مستقیم روی دادههای غیرساخت یافته50
کاوش تصویر. 51
کاوش ویدئو. 52
کاوشAudio :53
کاوش مستقیم داده با فرمت صدا53
کاوش نوع داده ی چند رسانه ای. 54
سیستم سوال/جواب و داده کاوی وب.. 54
زبانهایMark up و داده کاوی وب.. 55
خلاصه56
فصل پنجم : مدیریت اطلاعات و داده کاوی وب.. 57
مقدمه58
همکاری بین عاملهای کاوش.. 58
مدیریت دانشها و داده کاوی وب.. 59
مدیریت دانش و داده کاوی وب.. 60
محاسبات بیسیم و داده کاوی وب.. 61
کیفیت سرویس و داده کاوی وب.. 62
اجتماع سرویسهای وب و داده کاوی. 63
فصل ششم : کاوش الگوهای کاربردی و ساختار روی وب.. 64
مقدمه65
تحلیل الگوهای کاربردی و روندهای پیشبینی. 65
خروجیها و تکنیکهای web usage mining:66
web mining برای e-commerce. 75
کاوش ساختار روی وب.. 76
بازبینی web structure mining. 76
جمع بندی و نتیجه گیری. 77
گرافیک سه بعدی چیست ؟79
کارت گرافیک سه بعدی. 80
کارت گرافیک سه بعدی. 83
نتیجه گیری. 90
مراجع 91
مقاله مدلسازی و ارزیابی سیستم های کامپیوتری
اصل مقاله + ترجمه + فایل پاورپوینت
یبایسارزیابی عملکرد نرم افزارهای NoSQL Big-Data با استفاده از مدلهای مالتیفرمالیسم
با ظهور Web 2.0، مقدار دادههایی که توسط خدمات تحت وب با مقیاس بزرگ مدیریت میشوند، به طور نمایی افزایش یافته و چالشها و الزامات زیرساختی جدیدی را ایجاد کرده است. این موضوع به پارادایمهای برنامهنویسی و انتخابهای ساختاری مثل کاهش نقشه و پایگاه دادههای NoSQL انجامیده است، که از دو ویژگی عمدهی غیرمعمول سیستمهای توزیعشدهی عظیم که از آنها تحت عنوان معماریهای بزرگداده یاد میشود تشکیل شده است. زیرساختهای اساسی کامپیوتری معمولاً با الزامات پیچیدهای روبرو هستند، که ناشی از نیاز به بهرهوری و سرعت در پردازش مجموعه دادههای در حال رشد عظیم میباشد. این امر با بهره برداری از فناوریهای جدیدی چون مقیاسبندی خودکار و تدارک نسخهی دوم برای محیطهای ابری حاصل میشود.
با وجود این که مشکل اصلی کاربردهایی که برشمرده شدند عملکردها است، اما در حال حاضر نتایج ارزیابی عملکردی بسیار کمی در دسترس است. در این فعالیت، بر بررسی چگونگی ارزیابی عملکرد کاربردها با استفاده از زبان جستار Apache Hive برای پایگاههای دادهی NoSQL که روی زیرساخت کاهش نقشهی Apache Hadoop ساخته میشوند تمرکز میکنیم.
این مقاله یک برنامهی کاربردی و زبان مدلسازی اختصاصی را ارائه میکند که در درجهی اول چگونگی امکان ساده کردن فرآیند مدلسازی، و سپس چگونگی کاهش شکاف معنایی بین منطق مدلسازی و دامنه با استفاده از مدلسازی مالتیفرمالیسم را نشان میدهد.
کلمات کلیدی: مدلسازی مالتیفرمالیسم، بزرگداده، ارزیابی عملکرد
عنوان مقاله: سیستمهای مدیریت محتوا
گزارش درس: پایگاه داده ی پیشرفته
گروه فناوری اطلاعات، دانشکده ی برق و کامپیوتر، پردیس دانشکده های فنی، دانشگاه تهران
قالب بندی: word
تعدادصفحات: 37
قسمتی از متن:
البته موارد دیگری نیز به عنوان محتوا در نظر گرفته می شوند. مثلاً در [4] از کارکرد[1] نیز به عنوان محتوا اسم برده شده است و کارکرد را به عنوان کارهایی که انجام می دهیم معرفی می کند. مثلاً کارکرد در وب کدهایی است که در صفحه ی وب و یا وب سرور(کدهای مربوط به انجام تراکنشهای مالی، ارسال اطلاعات، انجام محاسبات و غیره) قرار می گیرند.
معمولا محتوا را در اجزایی به نام مولفه های محتوا[2] در مخزن[3] نگهداری میکنند و در مواقع نیاز این اجزا با یکدیگر ترکیب شده و محتوای نهایی را به وجود می آورند.
فهرست مطالب:
1 مقدمه. 2
2 محتوا چیست ؟. 2
3 تاریخچه ی سیستمهای مدیریت محتوا4
4 تعریف سیستم مدیریت محتوا9
5 مزایای یک سیستم مدیریت محتوا10
6 تشریح ساختمان یک سیستم مدیریت محتوا14
6-1 تولیدمحتوا15
6-2 مدیریت محتوا16
6-3 نشر. 19
6-4 نمایش و نحوه ارائه محتوا20
7 چه موقع به یک سیستم مدیریت محتوا نیاز داریم؟. 21
8 ملاحظات طراحی سیستم مدیریت محتوا24
9 سیستمهای مدیریت محتوای بنگاهی.. 26
10 مقایسه ی راه حلهای موجود در بازار ECM... 29
11 IBM DB2 Enterprise Content manager 31
منابع 35
عنوان پایان نامه: داده کاوی در صنعت بانکداری
پروژه کارشناسی-رشته مهندسی فناوری اطلاعات و کامپیوتر
فرمت فایل: word
تعداد صفحات: 138
شرح مختصر:
امروزه با گسترش روزافزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روشهایی همچون داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها امری غیر قابل اجتناب است. سازمانها با استفاده از داده کاوی میتوانندفرآیندهای تصمیم گیری را بهبود بخشند. داده کاوی سبب میشود که سازمانها ازسطح داده به سطوح بالاتر دانش و الگوهای ناشناخته برسند.
در این میان بانکها اساساً از پایگاههای داده متعدد و گستردهای برخوردار هستند که حاوی اطلاعات مربوط به مبادلات و جزئیات دیگر مربوط به مشتریانشان است. داده کاوی به نوبهی خود در راستای حل مسائل موجود در کسب و کار در صنعت بانکداری و مالی آن هم به واسطه ی یافتن الگوها، روابط علی و معلولی و روابط حاکم در قیمتهای بازار و اطلاعات کسب و کار مشتریان به کار میرود.
فهرست مطالب
عنوان صفحه
فصل 1 دانش نوین دادهکاوی
1-1. مقدمه ......................................... 1
1-2. تاریخچه داده کاوی .................................................................. 2
1-3. چرا داده کاوی لازم است؟ ...................................................................... 2
1-4. فرآیند کشف دانش و داده کاوی .................................... 3
1-5. معرفی برخی از روشهای داده کاوی .............................. 7
1-5-1. تحلیل انحراف .................................................. 8
1-5-2. نمایه سازی ............................................ 9
1-5-3. قوانین وابستگی .............................................. 10
1-5-4. تحلیل توالی ......................................... 13
1-5-5. خوشه بندی .............................................. 14
1-5-6. دسته بندی ......................................... 19
1-5-7. پیش بینی ......................................................... 21
فصل 2 کاربردهای داده کاوی در صنعت بانکداری
2-1. مقدمه ..................................................................... 23
2-2. داده کاوی در بازاریابی مدیریت ارتباط با مشتریان بانک ................................. 25
2-2-1. مدیریت ارتباط با مشتری و پروفایل سازی از آنها ........................ 27
2-2-2. مراقبت از مشتری ...................................................................... 32
2-2-3. داده کاوی و تحلیل رویگردانی مشتریان ........................................ 34
2-3. کاربرد داده کاوی در کشف تقلب و سوء استفاده های مالی ................................ 42
2-4. داده کاوی و پیش بینی عملکرد بانک ................................. 55
2-5. داده کاوی در ارزیابی اعتبار مشتریان بانک .............................. 60
2-6. کاربرد داده کاوی در ارزیابی عملکرد بانک ............................ 68
فصل 3 مثالهای عملی از کاربرد داده کاوی در صنعت بانکداری
3-1. کاربرد داده کاوی در بخشبندی مشتریان ........................... 74
3-1-1. مقدمه ................................................ 74
3-1-2. ارزش چرخه عمر مشتری، مفهوم تعاریف ................................. 76
3-1-3. استفاده از مدلهای خوشه بندی و CLV جهت بخشبندی مشتریان بانک ....................... 77
3-1-4. ارائه سرویس مناسب به مشتریان بالقوه ......................................... 81
3-2. رتبه بندی اعتبار متقاضیان دریافت وام با استفاده از تکنیکهای داده کاوی ................ 84
3-3. رتبه بندی اعتبار با استفاده از نسبتهای مالی ............................................ 88
3-4. بخشبندی دارندگان کارتهای اعتباری با استفاده از داده کاوی ............................. 90
3-4-1. پروژه طراحی بخشبندی رفتاری ............................................... 91
3-4-2. آماده سازی داده های مورد نیاز برای ساخت مدل ................................ 92
3-4-3. انتخاب جمعیت بخشبندی .................................. 93
3-4-4. شاخصهای کلیدی عملکرد درباره استفاده از کارتهای اعتباری .................. 93
3-5. سه گام اصلی فرآیند تحلیل ........................................... 97
3-6. گزارش، گام نهایی فرآیند داده کاوی .................................. 116
3-7. مزایا و معایب داده کاوی ........................................ 116
3-8. نتیجه گیری .................................. 118
فهرست اشکال
شکل 1-1. فرآیند کشف دانش ................................................ 6
شکل 1-2. عملکردهای داده کاوی .................................................... 8
شکل 1-3. تحلیل انحراف در یک پایگاه داده ................................... 9
شکل 1-4. نمونهای از توالی بازدیدهای وب ..................................... 14
شکل 1-5. نمونهای ساده از خوشه بندی مشتریان .................... 16
شکل 1-6. خوشه بندی با استفاده از K-means ................18
شکل 1-7. درخت تصمیمگیری برای دستهبندی مشتریان ................... 21
شکل 1-8. رگرسیون خطی ساده ..................................... 22
شکل 2-1. مدیریت ارتباط با مشتری و داده کاوی ......................... 29
شکل 2-2. دوره های زمانی مختلف در مسأله رویگردانی مشتریان بانک ................. 36
شکل 2-3. دسته بندی انواع تقلب ............................................. 43
شکل 2-4. فراوانی مدلهای استفاده شده در کشف سوء استفاده های مالی ................. 46
شکل2-5. رتبه بندی اعتبار در صنعت بانکداری ............................ 61
شکل 2-6. DMU در فرآیند تحلیل پوششی داده ها ................. 71
شکل 2-7. شاخصهای خروجی مورد استفاده در تحلیل پوششی داده ها ............... 72
شکل 3-1. مدلسازی خوشه بندی مشتریان بانکها در Clementine ................................... 79
شکل 3-2. نتایج خوشه بندی مشتریان بر اساس روش SOM ............................. 79
شکل 3-3. توزیع شغلی مشتریان هر خوشه ................. 79
شکل 3-4. استفاه از الگوریتم Aprioriدر نرم افزار Clementine ........................... 82
شکل 3-5. فرآیند مدلسازی رتبه بندی اعتبار مشتریان بانکی در Clementine............... 86
شکل 3-6. مقایسه مدلهای رتبه بندی اعتبار با استفاده از منحنی Gain ................ 86
شکل 3-7. قواعد رفتاری حاصل از مدل رتبه بندی اعتبار ............................. 87
شکل 3-8. فرآیند مدلسازی Clementine ............................. 98
شکل 3-9. نمودار نمایه خوشه 1 ............................ 108
شکل 3-10. نمودار نمایه خوشه 2 ........................ 109
شکل 3-11. نمودار نمایه خوشه 3 .......................... 110
شکل 3-12. نمودار نمایه خوشه 4 ......................... 111
شکل 3-13. نمودار نمایه خوشه 5 ........................ 112
شکل 3-14. نمودار نمایه خوشه 6 ......................... 113
شکل3-15. نمودار نمایه خوشه 7 ....................... 114
شکل 3-16. نمودار نمایه خوشه 8 ............... 115
فهرست جداول
جدول 1-1. لیستی از محصولات و خدمات قابل ارائه در بانک..... 11
جدول 1-2. نمونه داده های مورد نیاز در مدلسازی مسأله دسته بندی .................... 20
جدول 2-1. پژوهشهای انجام شده در در زمینه کاربرد داده کاوی در تحلیل رویگردانی مشتریان ....... 42
جدول 2-2. پژوهشهای انجام شده در زمینه کاربرد داده کاوی در زمینه کشف تقلب ............. 55
جدول 2-3. پژوهشهای انجام شده در زمینه کاربرد داده کاوی در ارزیابی عملکرد بانک ......... 60
جدول 2-4. پژوهشهای انجام شده در زمینه کاربرد داده کاوی در ارزیابی اعتبار مشتریان ......... 68
جدول 3-1. پروفایلهای حاصل با استفاده از خوشه بندی .......................... 80
جدول 3-2. نمونه ای از قوانین وابستگی تولید شده در یک خوشه ............... 83
جدول 3-3. متغیرهای مورد استفاده در رتبه بندی اعتبار .................................. 85
جدول 3-4. بخشبندی کارتهای اعتباری، خلاصه روش اجرا ................................... 94
جدول 3-5. فیلدهای استفاده شده برای بخشبندی دارندگان کارتهای اعتباری ....................... 97
جدول 3-6. تصمیم گیری برای تعداد اجزای استخراجی با آزمودن جدول"واریانس" در PCA ........... 99
جدول 3-7. فهم و طبقه بندی اجزا با استفاده از ماتریس محوری اجزاء ......................... 100
جدول 3-8. تفسیر قوانین استخراج شده اجزاء ........................ 101
جدول 3-9. مراکز خوشه ها....................................... 102
جدول 3-10. میانگین درصد خریدها بر مبنای نوع کالا در خوشه ها ................. 103
جدول 3-11. میانگین تعداد خرید بر مبنای نوع کالا در خوشه ها ......................... 104
جدول 3-12. نمایه سازی خوشه ها بر مبنای شاخصهای عملکرد ............... 106
جدول 3-13. نمایه سازی خوشه ها بر مبنای مشخصه های جمعیت شناختی .............. 107
عنوان تحقیق: مقدمه ای بر داده کاوی
فرمت فایل: word
تعداد صفحات: 31
شرح مختصر:
در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند[1].
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده[1] و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش[2]، حصول دانش[3]، بازیابی اطلاعات[4]،محاسبات سرعت بالا[5] و بازنمایی بصری داده[6] . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد [2].
واژه های «داده کاوی» و «کشف دانش در پایگاه داده»[7] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1-1 نشان داده شده است.
فهرست مطالب
1 مقدمه ای بر دادهکاوی... 3
1-1 چه چیزی سبب پیدایش داده کاوی شده است؟. 4
1-2 مراحل کشف دانش.... 6
1-3 جایگاه داده کاوی در میان علوم مختلف... 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12
1-5 داده کاوی و انبار داده ها 13
1-6 داده کاوی و OLAP. 14
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15
2- توصیف داده ها در داده کاوی... 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها15
2-2 خوشه بندی 16
2-3 تحلیل لینک... 16
3- مدل های پیش بینی داده ها17
3-1 Classification. 17
3-2 Regression. 17
3-3 Time series. 18
4 مدل ها و الگوریتم های داده کاوی... 18
4-1 شبکه های عصبی 18
4-2 Decision trees. 22
4-3 Multivariate Adaptive Regression Splines(MARS). 24
4-4 Rule induction. 25
4-5 K-nearest neibour and memory-based reansoning(MBR). 26
4-6 رگرسیون منطقی... 27
4-7 تحلیل تفکیکی 27
4-8 مدل افزودنی کلی (GAM). 28
4-9 Boosting. 28
5 سلسله مراتب انتخابها29
منابع