عنوان مقاله: طراحی SPAM: ابزاری برای کاوش در شبکة گستردة جهانی
قالب بندی: word
تعداد صفحات: 19
قسمتی از متن:
ما در «عصر اطلاعات» زندگی میکنیم، عصری که در آن انسانها بیش از هر زمان دیگری در گذشته داده و اطلاعات تولید و منتشر میکنند. در واقع اطلاعاتی که در اختیار ما قرار دارد خیلی بیشتر از آن است که بتوانیم آن را تجزیه و تحلیل کنیم. به این ترتیب انتخاب منابع مورد نظر کاربر از این حجم ریاد اطلاعات روز به روز مشکلتر می شود، که این مسئله به دلایل مختلفی است که از آن جمله می توان به موارد زیر اشاره کرد:
1- وب خیلی بزرگ و متنوع است. مطالعهای[1] نشان داده است که بیش از 10 بیلیون صفحه با دسترسی عمومی در وب وجود دارد. علاوه بر این، تقریباً هر ماه 6 ترا بایت اطلاعات جدید به وب اضافه میشود.
2- داده های وب به سرعت در حال تغییرند. در حینی که وب به سرعت از لحاظ اندازه رشد می کند، اطلاعات آن هم مدام تغییر میکنند و به روز میشوند.
3- وب خیلی بد سازماندهی شده است. گر چه ممکن است بخشهای کوچکی از وب خوب سازماندهی شده باشند و به خوبی نگهداری شوند اما کل وب کاملاً غیر ساخت یافته است.
علاوه بر اینها وب کاربران خیلی متفاوتی داردو هرکاربری ممکن است تنها به بخش کوچکی از وب علاقمند باشد. در نتیجه، کاربران بر خط مشکلات زیادی در یافتن اطلاعات موردنظرشان دارند.
موتورهای جستجو به کاربران در یافتن منابع اطلاعاتی مرتبط کمک میکنند. اما موتورهای جستجو دارای مشکلات زیادی هستند. یک عنوان ممکن است صدها یا هزاران سند را شامل شود که باعث میشود موتور جستجو تعداد زیادی سند شامل اسناد غیرمرتبط برگرداند. تعداد زیادی از اسنادی که کاملاً به عنوان مورد نظر وابسته هستند هم ممکن است دارای کلمات کلیدی که آن موضوع را تعریف میکند، نباشند.