Hamshahri Logo
ميز آنلاين نشريات انتشارات درباره ما ارتباط با ما جستجو نقشه سايت


ايران جهان
اقتصاد بورس
بزرگراه سايبر شهر مجازی
ارتباطات دانش و تکنولوژي
موسيقی سينما و تلويزيون
ورزش سلامت
آموزش هنر
مهارت‌های زندگی ديدگاه
انديشه قرآن کريم
سفر محيط زيست
پيشخوان کتاب
اجتماع مسکن
پليس حادثه
شهردار شورای شهر
شهر مسير
حمل ‌و‌ نقل مترو
فرهنگ تاريخ
ادبيات داستانی زنان
کودک و نوجوان تغذيه
عکس آب و هوا
سرگرمی

به روز شده: 21 بهمن 1388 ساعت 00:43  - ‏آمار بازدید سایت: آمار بازدید  RSS
صفحه اصلی ميز آنلاين
 
چطور موتورهاي جستجو كار مي‌كنند؟
آنلاين- همشهري‌آنلاين- هادي زجاجي:
وقتي جستجويي در يك موتور جستجوگر انجام و نتايج جستجو ارايه مي‌شود، كاربران در واقع نتيجه كار بخش‌هاي متفاوت موتور جستجوگر را مي‌بينند.

موتور جستجوگر قبلاً پايگاه داده‌اش را آماده كرده است و اين گونه نيست كه درست در همان لحظه‌ي جستجو، تمام وب را بگردد.

بسياري از خود مي‌پرسند كه چگونه ممكن است گوگل در كمتر از يك ثانيه تمام سايت‌هاي وب را بگردد و ميليون‌ها صفحه را در نتايج جستجوي خود ارايه كند؟

گوگل و هيچ موتور جستجوي ديگري توانايي انجام اين كار را ندارند. همه آنها در زمان پاسخ‌گويي به جستجوهاي كاربران، تنها در پايگاه داده‌اي كه در اختيار دارند به جستجو مي‌پردازند و نه در وب! موتور جستجوگر به كمك بخش‌هاي متفاوت خود، اطلاعات مورد نياز را قبلاً جمع‌آوري، تجزيه و تحليل مي‌كند، آنرا در پايگاه داده‌اش ذخيره مي‌نمايد و به هنگام جستجوي كاربر تنها در همين پايگاه داده مي‌گردد. بخش‌هاي مجزاي يك موتور جستجوگر عبارتند از:
Spider يا عنكبوت
Crawler يا خزنده
Indexer يا بايگاني كننده
Database يا پايگاه داده
Ranker يا سيستم رتبه‌بندي

الف: Spider (عنكبوت)
اسپايدر يا روبوت (Robot) نرم افزاري است كه كار جمع‌آوري اطلاعات مورد نياز يك موتور جستجو را بر عهده دارد. اسپايدر به صفحات مختلف سر مي‌زند، محتواي آنها را مي‌خواند، لينك‌ها را دنبال مي‌كند، اطلاعات مورد نياز را جمع‌آوري مي‌كند و آنرا در اختيار ساير بخش‌هاي موتور جستجوگر قرار مي‌دهد. كار يك اسپايدر، بسيار شبيه كار كاربران وب است. همانطور كه كاربران، صفحات مختلف را بازديد مي‌كنند، اسپايدر هم درست اين كار را انجام مي‌دهد با اين تفاوت كه اسپايدر كدهاي HTML صفحات را مي‌بيند اما كاربران نتيجه حاصل از كنار هم قرار گرفتن اين كدها را.

اسپايدر، به هنگام مشاهده صفحات، بر روي سرورها رد پا برجاي مي‌گذارد. شما اگر اجازه دسترسي به آمار ديد و بازديدهاي صورت گرفته از يك سايت و اتفاقات انجام شده در آن را داشته باشيد، مي‌توانيد مشخص كنيد كه اسپايدر كدام يك از موتورهاي جستجوگر صفحات سايت را مورد بازديد قرار داده است. يكي از فعاليت‌هاي اصلي كه در SEM انجام مي‌شود تحليل آمار همين ديد و بازديدها است.

اسپايدرها كاربردهاي ديگري نيز دارند، به عنوان مثال عده‌اي از آنها به سايت‌هاي مختلف مراجعه مي‌كنند و فقط به بررسي فعال بودن لينك‌هاي آنها مي‌پردازند و يا به دنبال آدرس ايميل (E-mail) مي‌گردند.

ب: Crawler (خزنده)
كراولر، نرم‌افزاري است كه به عنوان يك فرمانده براي اسپايدر عمل مي‌كند. كراولر مشخص مي‌كند كه اسپايدر كدام صفحات را مورد بازديد قرار دهد. در واقع كراولر تصميم مي‌گيرد كه كدام يك از لينك‌هاي صفحه‌اي كه اسپايدر در حال حاضر در آن قرار دارد، دنبال شود. ممكن است همه آنها را دنبال كند، بعضي‌ها را دنبال كند و يا هيچ كدام را دنبال نكند.

كراولر، ممكن است قبلاً برنامه‌ريزي شده باشد كه آدرس‌هاي خاصي را طبق برنامه در اختيار اسپايدر قرار دهد تا از آنها ديدن كند. دنبال كردن لينك‌هاي يك صفحه به اين بستگي دارد كه موتور جستجو چه حجمي از اطلاعات يك سايت را مي‌تواند (يا مي‌خواهد) در پايگاه داده‌اش ذخيره كند. همچنين ممكن است اجازه دسترسي به بعضي از صفحات به موتورهاي جستجوگر داده نشده باشد.

شما به عنوان دارنده سايت، همان طور كه دوست داريد موتورهاي جستجو اطلاعات سايت شما را با خود ببرند، مي‌توانيد آنها را از بعضي صفحات سايت‌تان دور كنيد و اجازه دسترسي به محتواي آن صفحات را به آنها ندهيد. موتور جستجو اگر مودب باشد قبل از ورود به هر سايتي ابتدا قوانين دسترسي به محتواي سايت را (در صورت وجود) در فايلي خاص بررسي مي‌كند و از حقوق دسترسي خود اطلاع مي‌يابد. تنظيم ميزان دسترسي موتورهاي جستجو به محتواي يك سايت توسط پروتكل Robots انجام مي‌شود. به عمل كراولر، خزش (Crawling) مي‌گويند.

تاریخ درج: 28 آبان 1385 ساعت 22:48 تاریخ تایید: 28 آبان 1385 ساعت 23:10 تاریخ به روز رسانی: 8 خرداد 1388 ساعت 20:03
 
مطالب مرتبط
ولفرام آلفا؛ رقیب جدید گوگل چطور پادكست بسازيم؟ چطور از اعتياد به رایانه خلاص شويم؟ چطور فیلم‌های آی‌مکس ساخته می‌شود؟ چطور اس ام اس (SMS) می‌فرستیم؟ مفاهيم: سبك الماس خبري چيست؟ ثبت 67 هزار دامنه‌ ir. موتورهاي جستجو و چالش‌هاي جهاني مفاهيم: سي ‌اس ‌اس (CSS‍ُُ) چيست؟ مفاهيم: XML چيست؟ مفاهيم: فشرده‌سازي تصوير در وب چيست؟ مفاهيم: Internic چيست؟ مفاهيم: پهنای باند چيست؟ مفاهيم: آر اس اس (RSS) چيست؟ چطور اتاق‌خواب كودك را بچينيم؟ چطور گوش زنگ مي‌ز‌ند؟ چطور سونامي به وجود مي‌آيد؟ چطور پير مي‌شويم؟ چطور با افسردگي مقابله كنيم؟ چطور اينترنت كار مي‌كند؟ چطور می‌خندیم؟ چطور مراقب کیف‌قاپ‌ها باشیم؟ چطور بستنی درست می شود؟ چطور فیلم‌های سیاه و سفید رنگی می‌شوند؟ چطور مراقب فرش زیر پایمان باشیم؟ چطور گرمازده نشویم؟ چطور منزل‌مان را از دزدي ايمن كنيم؟ چطور کودک‌مان را از مکیدن انگشت باز داریم؟ چطور اسکناس‌ در ماشین لباسشویی سالم مي‌ماند؟ چطور كودكان‌مان را از خطر دور کنیم؟ چطور با آتش مقابله كنيم؟ چطور با كامپيوتر كار كنيم؟
 
 
تمامی حقوق این سایت متعلق به موسسه همشهری است