تکامل وب و مقایسهء ابزارهای جستجو در اینترنت

چکیده
این مقاله تکامل وب را در رابطه با وب و فناوری‌های بازیابی اطلاعات بررسی می‌کند. در این بررسی بین عناصر مختلف وب در زمینهء نمایه‌سازی و صفحات جستجوی وب وجه تمایز وجود دارد. ده ابزار اصلی و مهم وب براساس معیارهای انتخاب و تعداد اتصال‌ها با یکدیگر مقایسه و ارزیابی شده‌اند. ابزارهای جستجو مانند راهنماها و موتورهای جستجوگر نیز مورد بررسی و مقایسه قرار گرفته‌اند.

کلیدواژه : وب، راهنماهای جستجوگر، موتورهای جستجوگر

مقدمه
کلمه اینترنت مخفف “Interconnected Networks” و به معنی شبکه‌های به‌هم‌مرتبط است. اینترنت سیستمی برای توزیع و تبادل اطلاعات در سطح جهان است که براساس آخرین آمار موجود در حال حاضر ۲۲۶ کشور به آن متصل هستند. این مجموعه به همراه فناوری‌های ساده کاربردی، سبب کاهش هزینهء نشر الکترونیکی شده است (۱).در هر صورت، وب یک عنصر منسجم و واضح مستقل نیست، بلکه دو عنصر مجزای وب وجود دارند: وب قابل‌رویت و دیدنی، و وب نامرئی و غیرقابل رویت(۲).
برای فهم کاربرد این دو عنصر و برای ارزیابی اطلاعات ضرورت دارد که از موضوع خارج شویم و ببینیم چگونه صفحات وب تولید می‌شوند.
دو نوع صفحهء وب وجود دارند: استاتیک و دینامیک.
صفحات وب استاتیک توسط طراح وب، در خدمات‌دهندهء وب نصب می‌شوند و برای هر کس و هر چیزی که وب سایت را مشاهده کند قابل دسترس‌اندو هر تغییری هم باید به صورت دستی انجام شود.
صفحات وب دینامیک توسط رایانه با به‌کارگیری دستورهای یک زبان دستنوشته(۱) و اغلب «سی‌جی‌آی‌جاوا»(۲)که به عنوان پلی بین سرویسگرهای پروتکل انتقال ابرمتن (۳) و کاربران وب عمل می‌کند، ایجاد می شود.
دستورهای یک زبان دستنوشته، نتایج را در یک صفحهء خالی وب جا می‌دهند و به کاربر، صفحهء وب دینامیک را ارائه می‌دهند. صفحات وب استاتیک اطلاعات عام و کلی را برای کاربر تهیه می‌کند، در حالی که صفحات وب دینامیک، اطلاعات منحصربه‌فرد را برای کاربر تهیه می‌نمایند. صفحات وب استاتیک برای همهء کاربران قابل رویت‌اند و در دسترس می باشند.
 

صفحات وب دینامیک

صفحات وب استاتیک

توسط رایانه تولید می‌شوند

دستی تولید می‌شوند.

اطلاعات منحصربه‌فرد است

اطلاعات عام و کلی است

قابل نمایه‌سازی نمی‌باشند

اکثر آن‌ها قابل نمایه‌سازی هستند

اولین مطالعه در موسسه تحقیقاتی «ان‌ئی‌‌سی» در پرینستون آمریکا در دسامبر سال ۱۹۹۷ نشان داد که صفحات وب قابل رویت، حداقل ۳۲۰ میلیون صفحهء وب را شامل می‌شوند، در حالی که دومین مطالعه تخمین زد که تعداد صفحات وب رشد کرده و به ۸۰۰ میلیون صفحه در فوریه سال ۱۹۹۹ رسیده‌اند. در هر صورت، اکثر ناشرین اطلاعاتشان را بر روی وب به وسیلهء پایگاه‌های اطلاعاتی بزرگ توزیع می‌کنند. این اطلاعات اساسا جنبه تجاری دارد (۲).
موتورهای جستجوگر(۴) و راهنماهای وب
۲. ۱. راهنماهای وب
چه تفاوتی بین راهنمای وب و موتور جستجو وجود دارد؟
راهنمای وب:
الف. فهرستی از سایت‌های وب که از قبل تعیین شده‌اند، می‌باشد؛
ب. توسط ویراستاران جمع‌آوری شده؛
ج. براساس موضوع و عنوان طبقه بندی شده؛
د. انتخابی است.
با توجه به این که راهنماهای وب توسط افراد جمع‌آوری می‌شوند, تصمیم‌گیری دربارهء کیفیت محتوای هر یک از سایت‌های وب قبلا انجام شده است. در نتیجه راهنماهای وب در اینترنت بسیار مورد مراجعه قرار می‌گیرند، زیرا کاربران به دنبال موضوعات خاصی در اینترنت هستند که این راهنماها، نقطهء شروع خوبی در تشخیص بهترین‌ها در وب می‌باشند.
در کاربرد راهنماهای وب، کاربر می‌تواند در بین فهرست‌‌های راهنما حرکت نماید. راهنماهای اصلی وب همچنین اجازهء عبور از دیگر موتورهای جستجو را هم می‌دهند. مثلا بزرگ‌ترین راهنمای وب، یعنی «یاهو»، اجازهء عبور از موتور های جستجوی دیگر را می‌دهد.
سایت‌‌های وبی که به وسیلهء راهنمای وب نمایه‌‌سازی شده‌اند، به علت روند تکمیل به صورت دستی، در آن راهنماها باقی می‌مانند؛ مگر این که به احتمال بسیار ضعیف به صورت دستی حذف شوند. در حالی که وجود دائمی یک لیست یا یک فهرست در موتور جستجو همیشه ضمانت نمی‌شود، اما ساختن و حضور دائمی یک فهرست در یک راهنمای وب مثل «یاهو» امکانپذیر می‌باشد.
۲. ۲. موتورهای جستجوگر
وقتی که یک موتور جستجوگر را به کار می‌برید، کاربر، پایگاه اطلاعاتی سایت‌های وب را جستجو می‌نماید. همه موتورهای جستجوگر دارای سه جزء ترکیبی هستند:
الف. «اسپایدرها»(۵)که سایت‌های وب را بررسی می‌کنند،
ب. فهرست‌ها و نمایه پایگاه اطلاعاتی؛
ج. نرم‌افزار بازیابی اطلاعات.

۲ . ۲ .۱. اسپایدرهای موتورهای جستجوگر
پایگاه اطلاعاتی موتورهای جستجوگر ابتدا توسط «اسپایدرها» ساخته می‌شود و توسط موتورهای جستجوگر به مأخذ اصلی اعزام می‌شود.«اسپایدرها» برنامه‌هایی هستند که وب را به دنبال صفحات جدید وب جستجو می‌نمایند، کلمات را نمایه‌سازی می‌کنند و اتصال را به صفحات برقرار می‌نمایند، سپس کلمات نمایه‌شده را با آد‌رسی که به یک صفحهء وب یا هر منبعی که بر روی وب جهانی و به طور کلی اینترنت قرار دارد اشاره می‌نماید,(۶) مقابله می‌کنند.
۲. ۲ .۲. نمایهء پایگاه اطلاعاتی موتور جستجو
این بخش عنصر اصلی از هر موتور جستجو است. این همان چیزی است که کاربر به دنبال آن است. در طی سال ۱۹۹۸ تعدادی از تولید‌کنندگان موتورهای جستجو آغاز به کار کردند. این شرکت‌ها نمایه‌ها را مطابق با معیارهای گوناگون ساختند. بطور مثال می توان از نمایهء «دایرکت هیل» و «گوگل» (۷) نام برد و نیز «نمایهء ‌نام‌های حقیقی» (۸) که شرکت‌ها را قادر می‌سازد واژه‌های کلیدی خود را برای حمایت از محصولات خود ثبت نمایند.
۲ . ۲ . ۳ . نرم‌افزار بازیابی اطلاعات
تمامی موتورهای جستجوگر، نرم‌افزار مختص به خود برای پاسخگویی به سوالات دارند.
موتورهای جستجوگر مطابق با قوانین مشابه به شرح زیر عمل می‌نمایند: هر سایت وب شامل کلمات یا واژه‌هایی است که سوءال کاربر را با آن‌ها مقابله می‌کند. و در صفحهء نمایش، به صورت فهرست‌وار نمایش می‌دهد و با توجه به سوال کاربر و ارتباط موضوعی، فهرستی از مطالب را طبقه‌بندی می‌نماید. تفاوت مختصری در چگونگی کار الگوریتم‌ها بین موتورهای جستجو وجود دارد، که دلیلی بر این مدعااست که کاربران، با یک پرسش واحد, از موتورهای مختلف نتایج متفاوتی را کسب می‌نمایند. در هر صورت، دلیل مهم دیگر اختلاف نتایج جستجو، نسبت پایین همپوشانی، در بین موتورهای جستجو‌گر می‌باشد.
۳ . پورتال‌ها
«پورتال»(۹) ها سایت‌های وبی هستند که خود عرضه‌کنندهء خدمت خاصی نیستند، ولی مراجعین را به صورت ساده و دوستانه به اطلاعات و سایت‌های موردعلاقه‌شان هدایت می‌کنند. «پورتال» ها نقاط اصلی برای راهبردهای تجارت الکترونیکی هستند و به تدریج از سال ۱۹۹۴ به وسیلهء سه نوع شرکت اینترنتی به وجود آمدند. این شرکت‌ها که نقش اساسی در توزیع زنجیرهء اطلاعاتی برای کاربر ایفا می‌کنند به شرح زیر می‌باشند:
الف. تولیدکنندگان خدمات اینترنتی(۱۰)
ب. سایت‌های جستجو(۱۱)
ج. تولیدکنندگان مرورگر(۱۲)
سایت «اکسایت»(۱۳) نمونه‌ای که از یک سایت پورتال موفق است(۱).
۴. توسعه و تکامل فناوری جستجو
همهء ما تکامل زندگی بشر بر روی کره خاکی را به خاطر داریم. همانطور که همگی ما می‌دانیم، شکل‌های مختلف زندگی سلولی برای مدت‌های بسیار طولانی قبل از تکامل زیستی وجود داشته است. در هر صورت هنگامی که به این نقطه از تکامل دست یافتیم، تغییرات به فرم سازمان‌یافتهء آن در مدت زمان کم‌تری به انجام رسید.
همین مطلب برای فناوری جستجوی وب نیز صادق است. با تاکید بر روی پور‌تالیزیشن و تجارت الکترونیکی، اولین نسل سایت‌های جستجو، عملاً و به تدریج فراموش شدند و این در حالی است که آن‌‌ها تا سال‌‌های متمادی، حکومت اصلی را به عهده داشتند؛ اما بدلیل این که نتوانستند خودشان را با تغییرات محیطی وفق بدهند، فراموش گردیدند و انواع جدیدی از تولیدکنندگان جستجو به بهره‌برداری رسیدند.

۴ .۱. موتورهای جستجوی ماورا
موتورهای جستجوی ماورا(۱۴) به کاربر این امکان را می‌دهند که از میان موتورهای جستجوی متعدد و راهنماهای وب به طور مقارن و همزمان، جستجو نماید (۲و۳).
محبوب‌ترین موتورهای جستجوی ماورا به شرح زیر می‌باشند:

– Dogpile ( www.dogpile.com )
– Mamma ( www.mamma.com )
– ۲Q ( www.2q.com )
– Infind ( www.infind.com )
– Insleuth ( www.isleuth.com )
– Surfy ( www.surfy.com  )
– Webtaxi ( www.webtaxi.com  )

۴ .۲. نسل اول موتورهای جستجو که توسط سایت‌های وب بصورت«اسپایدر», نمایه‌سازی را ایجاد کردند، انبوهی از واژه‌ها و کلمات را تجزیه و تحلیل نمودند. راهنماهای وب به طور دستی گردآوری شدند و از آوریل ۱۹۹۸ مورد بهره‌برداری قرار گرفتند: یکی از این راهنماها به نام «دایرکت هیل»(۱۵)یک حرکت ریشه ای را آغاز کرد و اصلاحاتی انجام داد و روش خود را «راه سوم»(۱۶) نامید.
این راهنمای وب ادعا می‌‌کرد که در زمان جستجو، کنترل با کاربر است و نتایج به صورت طبقه‌بندی شده بر روی سایت وب نمایان می‌شوند. این موتور جستجو، آنچنان که ادعا می‌کرد نتوانست خدمات منحصربه‌فردی را ارائه نماید. بنابراین موتور جستجوی دیگری به نام «هاتبات»(۱۷)به جای آن تولید شد (۲).
۴ .۳. جستجوی زبان طبیعی
همانطور که قبلا بحث شد، اولین نسل موتورهای جستجو با مقابلهء واژه‌هایی که توسط کاربران ارائه می‌شدند عمل می‌نمودند. آن‌ها به محتوای واژه‌های جستجو توجه نمی کردند. برای مثال به ارتباط منطقی بین واژه‌های جستجو و دیگر معناهای لغوی توجه نمی‌شد، به علاوه، لغات را به صورت تحت‌اللفظی جستجو می‌کردند و به واژه‌ها و توصیفگر‌های‌بولی‌ نظیر and, or, not توجه‌ نداشتند. دو موتور جستجوی جدید یکی پس از دیگری در طول یک هفته آغاز به کار کردند. این موتورهای جستجو، به شرح زیر زبان طبیعی را برای جستجو پیشنهاد کردند:
الف.Ask Jeeves www.askjeeves.com
این موتور جستجو در اول ژوئن سال ۱۹۹۸ شروع به کار کرد و به عنوان اولین موتور جستجوی زبان طبیعی بر روی اینترنت معرفی شد. این موتور جستجو سوءال کاربر را با استفاده از پایگاه اطلاعات هفت میلیونی سوءالات، پاسخ می‌داد. اگر هیچ گونه مقایسه‌ای وجود نداشت، سپس نزدیک‌ترین واژه از پایگاه برای کاربر ارائه می‌شد و سوءال می‌شد که مناسب‌ترین آن را انتخاب کند. این موتور جستجو همچنین کاربر را به موتورهای جستجوی دیگری نیز راهنمایی می‌کند، مانند «یاهو»، «لیکاس», «اینفوسیک» و «آلتاویستا».
ب. دومین موتور جستجو به نام Electric Monk چند هفته بعد آغاز به کارکرد. این موتور جستجو با استفاده از زبان طبیعی، الگوریتم سوءالات کاربران را پاسخ می‌گوید. این الگوریتم با استفاده از اصطلاحنامه، به واژه‌های مرتبط نیز توجه می‌کند. جستجو از طریق زبان طبیعی در این موتور جستجوگر، سپس به صورت سوءالات مرکّب بولی درآمد و به «آلتاویستا» تسلیم شد.
۴ .۴. تجزیه و تحلیل متکی بر اتصال
موتورهای جستجوی نسل اول برای ساخت نمایه‌های عظیم با هدف پاسخگویی به هر نوع سوال ساخته شدند. آن‌ها به محتوای هر صفحهء خاص تأکید داشتند که چگونه این صفحات به هم مربوط می‌شوند و اتصال می‌یابند. همانطور که قبلا گفته شد، روش نمایه‌سازی آن‌ها به دلیل بی‌توجهی به ترکیب زبان، ساخت جملات و مترادف‌ها با شکست روبرو شد.
تجزیه و تحلیل متکی بر اتصال سعی دارد که با بررسی ارتباط بین صفحات، بر این مشکلات فائق آید. موتورهای جستجوگر متکی بر اتصال به سرعت رشدکرده‌اند و از نظر کاربران اینترنت در حال حاضر از محبوبیت خاصی برخوردارند.
۴.۴.۱.«گوگل»(۱۸)
این موتور جستجوگر نیز مانند «یاهو» توسط دانشجویان دانشگاه استانفورد ایجاد شد این فناوری با استفاده از روشی با نام «رتبه‌بندی صفحه»(۱۹) وب، به دیگر موتورهای جستجو متصل می‌شود. اگر شما، به عنوان یک نویسندهء سایت وب، به دیگر سایت‌های وب از جهت اهمیت آن سایت‌ها متصل شوید، می توانید داوری‌ها و پیشنهادهایی دربارهء سایت ارائه دهید. همانطور که راهنماهای وب نظیر «یاهو» توسط ویراستاران به صورت دستی جمع‌آوری و تالیف گردیده‌اند. «گوگل» هم به دنبال اعلام قضاوت میلیون‌ها نویسندهء سایت وب به صورت خودکار طراحی شد.
البته این موتور جستجو در مقایسه با «یاهو» با سایت‌های وب بیش‌تری دسترسی دارد. در حقیقت برخلاف دیگر موتورهای جستجوگر، که هر چه نمایه‌های آن‌ها گسترده‌تر می‌شود، کم‌تر مفید واقع می‌شوند، «گوگل» ادعا دارد که با گستردگی نمایه‌ها و عظیم‌تر شدن آن‌ها، به نتایج بهتری دست یافته است. از دیگر موتورهای جستجو که با استفاده از الگوریتم طبقه‌بندی عمل می‌نمایند می‌توان از«هاتبات» و «اکسایت» نام برد. «گوگل» تنها موتور جستجویی است که به طور بسیار گسترده ای جستجو‌هایش متکی بر اتصال می‌باشند. تخمین زده شده که نمایهء این موتور جستجو‌گر بین ۷۰ تا ۱۰۰ میلیون صفحه می‌باشد، اما از طریق اتصال، قدرت دسترسی به بیش از ۳۰۰ میلیون صفحهء وب نیز به کاربر اینترنت داده می‌شود. دسترسی بیش‌تر و صحت نتایج جستجوی بیش‌تر سبب گردیده که این موتور جستجو در ردیف ده موتور جستجوی محبوب در شبکهء اینترنت قرار گیرد.
۴.۴.۲. (۲۰)Clever
با توجه به «نمایه‌نامهء استنادی علوم»(۲۱) (مطالعهء ارجاعی مقالات علمی با یکدیگر) clever جستجوی واژه‌های کلیدی را براساس تلفیق کلمات و ارتباط مطالب بررسی می‌نماید. این موتور جستجوگر نیز مانند «گوگل» با استفاده از اتصال، به سوءالات پاسخ می‌دهد. ولی برخلاف «گوگل» ابتدا سوءال را به دیگر موتور‌های جستجو نظیر «آلتاویستا» تسلیم می‌کند و سپس کاربر را به صفحاتی که از نتایج جستجو کسب شده‌اند راهنمایی می‌نماید. این موتور جستجو توسط شرکت «آی‌بی‌ام» ایجاد شده.
۴.۴.۳. Focused Crawler
یکی دیگر از موتورهای جستجویی که توسط شرکت،« آی‌بی‌ام» ایجاد شده. این موتور جستجو البته به اندازهء clever گسترش پیدا نکرد. برخلاف دیگر موتورهای جستجو نظیر «گوگل» و clever، این موتور جستجو مجموعه‌ای بسیار مناسب و در ارتباط با موضوع را از طریق وب جستجو می‌نماید. به زبانی دیگر، این موتور جستجو فقط سایت‌های وبی را جستجو می‌کند که در ارتباط با پرسش کاربر می‌باشند.
جستجوی گروه‌های خبری
در حالی که در حال حاضر وب به مثابه مخزن اولیهء دانش بشری بر روی اینترنت می‌باشد، تنها مخزن هم به حساب نمی‌آید. گروه‌های خبری، محلی است که گروهی از افراد، تجربیات، افکار و دانش خود را در مورد یک موضوع مورد علاقه، برای بازیابی اطلاعات به اشتراک می‌گذارند. تفاوت بین وب و گروه‌های خبری در این است که وب مجموعه‌ای از دانش بشری را به طور صریح و روشن ارائه می‌کند. در حالی که گروه‌های خبری مجموعه‌ای از دانش بشری را به طور ضمنی و غیرصریح ارائه می‌نمایند.
دانش صریح و روشن می‌تواند به افراد و موءسسات کمک کند تا از اطلاعات و تجارب گذشته برای برنامه‌ریزی آینده کمک بگیرند، اما دانش غیرصریح و ضمنی مجموعه‌ای از تجارب و عقاید و خلاقیت‌هایی است که برای استخراج اطلاعات صریح و روشن مورد نیاز می‌باشد.
آدرس بعضی از گروه های خبری تخصصی:

DejaNews ( www.dejanews.com )
Reference.com ( www.reference.com )
Liszt’s New groups directory ( https://liszt.com/news )

۴.۴.۴. اطلاعات شرکت‌ها
سایت‌های زیادی دربارهء معرفی شرکت‌ها و تولید‌کنندگان اطلاعات تجاری وجود دارند. هر محققی می‌تواند از این سایت‌ها بازدید کند. چنین سایت‌هایی دارای پایگاه‌های تجاری می‌باشند. یک برر‌سی بر روی نام‌های شرکت‌ها براساس عملکرد موتورهای جستجوگر پیشرو و راهنماهای وب برای انتقال نتایج مناسب برای پژوهشگران‌نشان‌داد‌که «سراچ انجین واچ»(۲۲)و«هاتبات‌» و «گوگل» در رده‌بندی، در رده‌های ابتدایی قرار می‌گیرند.
در آگوست ۱۹۹۹، موتور جستجو‌گر «جامپ»(۲۳) آغاز به کار نمود. این موتور جستجوگر دارای یک نمایهء تخصصی است که بر اطلاعات و خبرهای مربوط به شرکت‌ها تأکید دارد. این موتور جستجو‌گر فهرستی از شرکت‌ها، شامل اطلاعاتی نظیر عناوین شرکت‌ها، قدمت، زمینهء موضوعی و آدرس پست الکترونیکی و ثبت اختراعات، و شرکت‌های وابسته به آن شرکت را نیز معرفی می‌نماید (۲و۳).
۴.۴.۵. فایل‌های تصویری و چند‌رسانه ای
تقریباً ۷۰ درصد از صفحات وب غیرمتنی هستند. آنچه مسلم است کاربرد, مفاهیم را به همراه تصاویر بهتر از اطلاعات فقط به صورت متنی درک می‌نماید. سه موتور جستجوی تخصصی اصلی که فایل‌های تصویری و چند‌رسانه‌ای را ارائه می‌دهند، در این زمینه به شرح زیر می‌باشند.

Ditto ( www.ditto.com )
Scour ( www.scour.net )
Altavista photo finder( www.altavista.com )
 

مقایسهء ابزارهای جستجو در اینترنت
این روزها اینترنت منبع اصلی تهیهء منابع اطلاعاتی شناخته شده است. ابزارهای مهمی برای کمک به یافتن اطلاعات در این فضای اطلاعاتی وجود دارند. راهنماها و موتورهای جستجوگر پایگاه‌های اطلاعاتی هستند که به روند دریافت اطلاعات سرعت می‌بخشند. این ابزارها اسناد را با استفاده از زبان علامتگذاری ابرمتن(۲۴) جمع‌آوری، ذخیره و تنظیم می‌نمایند. قبل از ظهور اینترنت اکثر پایگاه‌های اطلاعاتی کتابشناختی نقش اصلی را در بازیابی اطلاعات ایفا می‌‌کردند. با توسعهء نرم‌افزارهای جستجو، اطلاعات علمی به راحتی قابل دستیابی شدند. تعداد ابزارهای جستجو در اینترنت به طور مداوم در حال رشد است. در این مقاله تعداد ده ابزار جستجو در اینترنت از قبیل راهنماها و موتور‌های جستجوگر براساس تعداد صفحات اتصال، انتخاب شده‌اند.
جدول یک: رده‌بندی موتورهای جستجوگر و راهنماها براساس تعداد صفحات اتصال به آن‌ها

تعداد صفحات اتصال به آن‌ها

نام موتورهای جستجوگر و راهنماها

۱۱۱۰۵۹۹

Yahoo

۴۵۸۲۳۹

Excite

۴۳۷۶۱۸

Lycos

۴۳۶۱۸۴

Webcrawler

۳۵۶۹۶۳

Infoseek

۳۵۰۰۸۵

Altavista

۲۳۸۶۶۸

Hotbot

۳۴۲۲۹

Nerdworld

۱۶۱۹۲

Alonetfind

۱۵۷۸۰

Northern light

معیارهای ارزیابی شامل جمع‌‌آوری اطلاعات و تجزیه و تحلیل اسناد و بازیابی اطلاعات بوده است.
 

واگذاری به صورت دستی

واگذاری به صورت‌خودکار

 

ابزارهای‌جستجو در اینترنت

 

 

زبان

 

کشور

شرح و توصیف

نشانی URL

 

عنوان

طبقه بندی موضوعی

بدون Meta‌tag

دارای

Meta‌tag

 

 

×

×

×

×

 

 

Yahoo

×

×

 

 

 

×

×

 

Excite

 

 

 

 

 

 

×

 

Lycos

×

×

 

 

 

×

×

 

Webcrawler

×

×

 

 

 

 

 

×

Infoseek

 

 

 

 

 

 

 

×

Altavista

 

 

 

 

 

 

 

×

Hotbot

 

 

×

×

×

×

 

 

Nerdworld

 

 

 

 

 

 

؟

؟

Aolnet find

 

 

 

 

 

 

×

 

Northern light

جدول ۲. مقایسهء ابزارهای جستجو و راهنماها در زمینه جمع‌آوری اطلاعات و تجزیه و تحلیل اسناد
نتایج ارزیابی ابزارهای جستجوی اینترنت با توجه به معیارهای اصلی بازیابی اطلاعات در جدول یک نشان داده شده است. شش معیار برای ارزیابی وجود دارد و حداکثر نمره ۶ می‌باشد.
تقریبا همهء ابزارهای جستجو چهار معیار اصلی را دارند. غیر از Nerdworld که از شش عملگر منطقی بولی فقط از OR استفاده می نماید,و «یاهو» که عملگر پرانتز را قبول نمی کند, اختلافات دیگری نیز وجود دارند. «اینفوسیک» از عملکرد ستاره (*) استفاده نمی‌کند و «لیکاس» و «وب کراولر» سیستم را ملزم می‌کنند که ستاره را به عنوان اولین حروف کلمات در جستجو استفاده نماید.

 

تنها ابزارهای جستجوی اینترنت که جستجوی کاملی را ارائه می دهند «لیکاس» و «اینفوسیک» هستند. با توجه به جستجو براساس طبقه‌بندی موضوعی، فقط دو راهنما یا دایرکتوری «یاهو» و Nedworld همهء صفحاتشان طبقه‌بندی و دسته‌بندی شده است. و Northen light تنها موتور جستجوگر می‌باشد که اجازهء جستجو براساس طبقه‌بندی را نمی دهد (۲).
در «نورثرن لایت» این امکان وجود دارد که به وسیلهء نواحی (۲۵)، جستجو انجام شود. در دیگر موتورهای جستجو‌گر این امکان کم‌تر وجود دارد. با توجه به جدول شماره ۳، «نورثرن لایت» از تعداد ۹ ناحیه شش ناحیه شامل: عنوان, نشانی، «یوآراِل», کشور، زبان، تاریخ، و نوع سازمان را جستجو می‌نماید.
رده‌بندی ابزارهای جستجوگر با توجه به تعداد نواحی قابل جستجو به ترتیب به شرح زیر می‌باشد:

(تاریخ، زبان, نشانی «یوآراِل»، عنوان)   Altavista
(تاریخ، نشانی «یورآراِل»، عنوان)   Yahoo
(زبان، نشانی «یوآراِل», عنوان)   Lycos
(کشور, نشانی «یوآراِل»، عنوان)   Infoseek
(منطقهء جغرافیایی، تاریخ، زبان)   Hotbot
(نوع سازمان، زبان)   Excite

و بالاخره سه ابزار جستجوی باقی‌مانده یعنی
Web Crawler, Nerdworld and Aolnet find
امکان جستجو از طریق نواحی را ارائه نمی‌دهند.
در اینجا باید توجه کرد مهم‌ترین نواحی مورد توجه در ارتباط با جستجو، عنوان، «نشانی» یوآراِل, و زبان می‌باشند.
هیچ اختلافی در میان موتورهای جستجوگر و راهنماها در مورد استفاده از ناحیه وجود ندارد. از تعداد دو راهنما در این مقاله، «یاهو» پنج ناحیهء قابل جستجو را پیشنهاد می‌کند و «نِرد وُرلد» هیچ ناحیه‌ای را پیشنهاد نمی‌نماید. ضمنا دیگر موتورهای جستجوگر نیز در مورد استفاده از نواحی ناهمگون هستند.
با توجه به قابلیت مرور(۲۶) و نظراندازی، موتورهای جستجوگر به شرح زیر امکان مرور و نظراندازی را ارائه می‌دهند.
«اکسایت»، «لیکاس»، «آلتاویستا», «هاتبات»، «نورثرن لایت». به موتورهای‌جستجوگر نظیر «نورترون لایت» و «آلتاویستا» امکان استفاده از ناحیهء کشوری را ارائه می‌دهند.
سه‌ابزار جستجو‌که‌قادرند دستورها(۲۷) را‌به کار‌ببرند شامل
«آلتاویستا», «هاتبات» و «اینفوسیک» می‌باشند. این سه موتور جستجوگر پس از جستجوی یک‌کلمه‌ای، فهرستی از واژه‌های ترکیبی را برای راهنمایی‌های بعدی و گسترش ارائه می‌دهند.
جدول شماره ۴ رده‌بندی ابزارهای جستجو در اینترنت و راهنماهای وب را براساس نمره‌های آن‌ها نشان می‌دهد. «نورثرن لایت» با کسب بالاترین نمره یعنی نمره ۱۳ در بالاترین رده، و «نردورلد» با کسب نمره ۲ در پایین‌ترین رده قرار دارند. تعداد‌زیادی از نمره‌ها نیز‌بین ۵/۱۱-۵/۱۰ هستند و به شرح زیر می‌باشند:
«آلتاویستا»،«لیکاس»،«اکسایت»,«انیفوسیک» و«هاتبات».

نمره

ابزارهای جستجو

۱۳

Northern light

۵/۱۱

Altavista

۱۱

Lycos

۵/۱۰

Excite

۵/۱۰

Infoseek

۵/۱۰

Hotbot

۹

Yahoo

۶

Webcrawler

۵/۵

Aolnetfind

۲

Nerdworld

درجه‌بندی موتورهای جستجوگر
نتیجه‌گیری

مهم‌‌ترین نتیجهء قابل توجه این است که هیچ ارتباطی بین محبوبیت و قابلیت جستجوی اطلاعات در میان ابزارهای جستجوی مورد مطالعه وجود ندارد. دو مثال واضح از این یافته‌ها «نورثرن لایت» و «یاهو» می‌باشند. اگر چه «نورثرن لایت» کم‌ترین شهرت و محبوبیت را در رده‌‌بندی از نظر اتصال دارا می‌باشد، این موتور جستجوگر اولین مقام را در رده‌بندی از نظر امکانات و قابلیت‌های بازیابی اطلاعات کسب نموده است. در حالی که «یاهو» یکی از محبوب‌ترین ابزارهای جستجو می‌باشد، ولی از نظر بازیابی اطلاعات، در ردهء پایینی قرار دارد.
این بررسی تفاوت عمده‌ای را بین موتورهای جستجوگر یا راهنماهای وب نشان نداد. در جمع‌آوری اطلاعات و تجزیه و تحلیل اسناد، راهنماها قابل اعتمادترند، زیرا سیستم‌های دستی استفاده می‌کنند. موتورهای‌جستجوگر نیز به دلیل‌استفاده از دستورهای(۲۸) زبان علامتگذاری فوق‌متن یا ابرمتن‌ها(۲۹) اهمیت دارند. هرچند روشن نیست که نتایج قابل‌توجهی را ارائه دهند.
اگرچه‌راهنماها‌و‌موتورهای‌جستجوگر پایگاه‌هایی هستند که صفحات زبان علامتگذاری فوق‌متن را فهرست می‌کنند، از نقطه نظر بازیابی اطلاعات، با توجه به دلایل زیر نسبت به پایگاه‌های اطلاعاتی کتابشناسی معمولی دارای امکانات کم‌تری هستند.
– تعدادی از ابزارهای جستجو تمامی امکانات موجود در پایگاه‌های‌ اطلاعاتی کتابشناختی معمولی را ندارند.
– محدود نمودن بازیابی به وسیله نواحی، چندان در ابزارهای جستجو در اینترنت رایج نیست.
– محققین سوءالاتی دربارهء نواحی عنوان نشانی که به یک صفحهء وب، یا هر منبعی بر روی وب جهانی و به طور کلی اینترنت اشاره می‌کند دارند، که تنها در نیمی از ابزارهای جستجو در اینترنت یافت می‌شوند. نه راهنماها که اطلاعات را از طریق پرسشنامه‌های واگذار شده کسب می‌نمایند و نه موتورهای جستجوگر که از صفحات زبان علامتگذاری فوق‌متن استفاده می‌کنند، در جستجوهایشان از نواحی استفاده نمی‌کنند.
–  مرور نمایه‌نامه‌ها یک شکل معمول و رایج نیست.
–  استفاده از معانی لغات کنترل شده در ابزارهای جستجوی اینترنت کاربردی ندارد (۲و۳).

 

فصلنامه اطلاع رسانی. دوره ۱۶، شماره ۳و۴

تالیف: جیران خوانساری
کارشناس ارشد کتابداری و اطلاع‌رسانی-مرکز اطلاع‌رسانی کتابخانه توانیر

پی‌نوشت‌ها

۱-Script
۲-Java common Gateway Interface (Jave Cgi)
۳-Search Engines
۴-Script
۵-Spiders
۶-URL (Uniform Resource Locator)
۷-Direct hill
۸-Google Real Names Index
۹-Portal
۱۰-Intetnet Service/Access Providers
۱۱-Search Sites
۱۲-Browser Providers Ultra Search Engines
۱۳-www.excite.com
۱۴-Ultra Search Engines
۱۵-www.directhil.com
۱۶-The Third way
۱۷-Hotbot
۱۸-www.google.com
۱۹-Page Rank
۲۰-www.almaden.ibm/cs/k53/clever.htm/
۲۱-Science Citation Index
۲۲-Search Engine Watch
۲۳-Jump
۲۴-Hrml (Hypet text Mark up language)
۲۵-Fields
۲۶-Browsing
۲۷-Meta tags
۲۸-Meta Tags
۲۹-hyprtext Mark up Language
 

منابع
۱-قاسم‌زاده، فریدون. آشنایی با اینترنت و تجارت الکترونیک. تهران: ابزار ایران و توسعه ارتباطات افرا، ۱۳۷۹

۲-Angeles Maldonado Martinez & Elena Fernandez Sanchez. “Comparing Internet Search Tools,” Online Information 99 Proceedings. London:1-9 Dec. 1999. 263-266
۳-Green, David “The evolution of web searching.” Online information 99 proceedings, 23rd International Online information Meetings, London: 7-9 December 1999. pp-251-258

 

 

 

 

به این مطلب امتیاز دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.