کلیه نمونه سوالات امتحانی دو سال اخیر شامل :
1. سیستم عامل پیشرفته دکتر رحمانی - دو سری
2. شبکه های پیشرفته دکتر زرگری
3. الگوریتم های موازی دکتر سیدجوادی - سه سری
4. مهندسی نرم افزار پیشرفته دکتر محسن زاده - سه سری
5. پایگاه داده پیشرفته دکتر محسن زاده - چهار سری
6. سیستم های توزیع شده دکتر علی رضایی
7. مدلسازی و ارزیابی دکتر سیدجوادی - سه سری
8. روش تحقیق دکتر رضایی
9. سیستم عامل پیشرفته دکتر علی رضایی
10. پایگاه داده پیشرفته دکتر سلاجقه - دو سری
11. مباحث ویژه دکتر حسین زاده
نمونه سوالات تا تاریخ دی ماه 94 می باشد.
چکیده
پیاده سازی الگوریتم موازی درgpu
در سال های اخیر، افزایش روز افزون عملکرد کارت های گرافیکی، محققین را به فکر بهره گیری از توان پردازشی آنها در کاربردهای غیر گرافیکی انداخته است. درهمین راستا شاخه جدیدی در علوم کامپیوتر به نام محاسبات با اهداف همه منظوره روی واحد GPU ایجاد شده است ، هدف فعالان این عرصه بهره گیری از کارت گرافیک به عنوان یک کمک پردازنده محاسباتی در برنامه های غیرگرافیکی و برنامه های عمومی...
فهرست مطالب
عنوانصفحه
مقدمه........... 1
فصل اول: معرفیGpu و تفاوت ان با Cpu
مقایسه توانایی های GPU با CPU.................. 4
مقایسه سخت افزار GPUو CPU.............. 5
فناوری های ATI و NVIDIA....... 6
فصل دوم: پردازش موازی
مزایای و برتریهای CUDA:............ 9
محدودیتهای CUDA:............ 10
تکامل محاسبات GPU................ 10
توسعه فن اوری GPU................ 11
-GPU های اولیه............. 11
فصل سوم: محاسباتGPU
معماری محاسباتی تسلا............. 14
چند پردازندههای جریانی..... 15
حافظه های GPU.... چهار بخش تقسیم شده است:...... 15
نمونه SIMT.......... 16
فصل چهارم: پیشنیازهای کودا
پیشنیازهای کودا عبارتند از:.... 19
نخ ها............... 21
بلاک ها و گریدها.......... 23
گریدها، بلاک ها و تردها...... 24
معماری مجموعه دستور و اجرا نخ های موازی... 24
کرنل ها........ 25
مدیریت حافظه......... 26
فصل پنجم: برنامه نویسی موازی CUDA
حافظه ها :..... 31
مجموعه بردارCPU......... 58
مجموعه بردار GPU........ 60
فصل ششم: معرفی راه حل هایی برای رفع مشکل پردازنده
تعاون رشته ای............... 63
تقسیم بلوکهای موازی........................ 63
مجموع برداری: ردوکس (REDUX).................... 64
مجموع برداریGPUاستفاده کننده از رشته ها.............. 65
مجموعیک بردار بلندتر GPU................ 66
مجموع بردارهای بطور دلخواهانهبلندGPU............................ 69
موج دار کردن (ایجاد حلقه های موجی در)GPU با استفاده از رشته ها........................ 72
حافظه اشتراکی و همزمانسازی........ 78
ضرب نقطه ای............ 79
معادله................. 80
یک مرحله از کاهش جمع......... 84
خلاصه سازی کد بالا:.......... 87
بیت مپ حافظه مشترک....... 92
نتیجه گیری......... 96
مطالعه پیاده سازی و تحلیل الگوریتمهای کوتاهترین مسیر
شامل دو مقاله و ترجمه آن به همراه فایل doc
می توان الگوریتمهای کوتاهترین مسیر را به دو نوع تقسیم بندی کرد: کوتاهترین مسیر تک منبع و همه کوتاهترین مسیرهادر این مقاله بر آن هستیم تا از هر نوع یک الگوریتم را مورد بررسی و تحلیل قرار دهیم.در بحث الگوریتم همه کوتاهترین مسیرها، الگوریتمهای فراوانی برای یافتن همه کوتاهترین مسیرها وجود دارد. الگوریتم فلوید-وارشال یکی از متداول ترین و کارآمدترین آنها میباشد. در این مقاله یک نسخه موازی از این الگوریتم با توجه به تجزیه اصولی یک بعد ردیف ماتریس مجاورت ارائه میگردد. این الگوریتم با هر دو MPI و OpenMP پیاده سازی شده است. از نتایج بدست آمده چنین برمی آید که الگوریتم موازی بطور قابل ملاحظه ای برای گراف با اندازه بالا موثر بوده و پیاده سازی MPIاز نظر عملکرد پیاده سازی OpenMP الگوریتم موازی برتری دارد. هم چنین در بحث الگریتم تک منبع به الگوریتم دایجکسترا میپردازیم که الگوریتمی شناخته شده در بحث یافتن کوتاهترین مسیرsingle-source(تک منبع)در گراف میباشد.پس از معرفی الگوریتم موازی و ترتیبی دایجکسترا، میزان بهره وری اجرای موازی را مورد تحلیل قرار میدهیم و در پایان اجرای ترتیبی و موازی را با 4پیکربندی مختلف - که بر پایه پردازندههای Dual Core و i5 شکل گرفته است - از نظر مدت زمان اجرا مورد مالعه قرار میدهیم. نتایج به دست آمده به خوبی نشان میدهد که اجرای موازی الگوریتم دایجکسترا نسبت به اجرای ترتیبی دارای سرعت بیشتری در اجرا میباشد. سرانجام، همانطور که دادهها نشان خواهند داد، به دلیل آنکه الگوریتم دایجکسترا ذاتا یک الگوریتم ترتیبی است و اجرای موازی آن مشکل است، تنها 10درصد سرعت اجرای الگوریتم به صورت موازی نسبت به اجرای ترتیبی مزیت دارد.که به دلیل استفاده گسترده از این الگوریتم این میزان بهره وری در سرعت اجرا، یک نقطه ضعف بزرگ برای این الگوریتم به حساب میآید.