مجموع نظرات: ۰

یکشنبه ۳۱ خرداد ۱۴۰۵ - ۰۹:۱۷

۰ نفر

سفر به دوران پیش از گوگل و جست‌وجوهای ماجراجویانه!

میلیاردها صفحه وب بدون قفسه‌بندی و راهنما؛ این حکایت اینترنت در دهه ۹۰ میلادی بود! قبل از ظهور گوگل و الگوریتم PageRank، یافتن اطلاعات در این اقیانوس دیجیتال، ماجرایی طاقت‌فرسا بود که کاربران را به سفری در میان لیست‌های دست‌نویس و مودم‌های پر سروصدا می‌برد.

به گزارش همشهری آنلاین، تصور کنید وارد بزرگ‌ترین کتابخانه جهان شده‌اید؛ کتابخانه‌ای که میلیون‌ها کتاب در آن روی هم تلنبار شده‌اند، اما هیچ راهرویی شماره‌گذاری نشده، هیچ قفسه‌ای برچسب ندارد و از همه مهم‌تر، هیچ متصدی یا دفترچه راهنمایی برای پیدا کردن کتاب مورد نظرتان وجود ندارد. این دقیقاً همان حسی است که کاربران اولیه اینترنت در اوایل دهه ۱۹۹۰ میلادی تجربه می‌کردند.

به نقل از دیجیاتو، امروزه، ما با یک صفحه سفید و یک نوار جست‌وجوی ساده خو گرفته‌ایم که در کسری از ثانیه، پاسخ هر سوالی را از میان میلیاردها صفحه وب بیرون می‌کشد. اما پیش از آنکه گوگل (Google) در سال ۱۹۹۸ با الگوریتم جادویی «پیج‌رنک» (PageRank) خود، نظم را به این هرج‌ومرج بیاورد، جست‌وجو در اینترنت یک ماجراجویی واقعی، خسته‌کننده و گاهی ناامیدکننده بود. در آن روزها، پیدا کردن اطلاعات نیازمند دانستن آدرس‌های دقیق (URL) یا تکیه بر لیست‌های دست‌نویس و دهان‌به‌دهان بود.

این مقاله، یک سفر در زمان به دوران پیشا-گوگل است؛ به دورانی که صدای خراشیده مودم‌های دایال‌آپ (Dial-up) موسیقی متن ورود به دنیای دیجیتال بود و مهندسان جوان در دانشگاه‌های مختلف جهان، در حال ساختن اولین چراغ‌قوه‌ها برای روشن کردن این تاریکی بی‌انتها بودند. از آرچی تا آلتاویستا، بیایید ببینیم انسان‌ها در دهه ۹۰ چگونه راه خود را در اینترنت پیدا می‌کردند.

آرچی (Archie): تولد اولین جست‌وجوگر در زیرزمین دانشگاه مک‌گیل

تاریخچه جست‌وجو در اینترنت با وب شروع نمی‌شود، بلکه به دوران پیش از اختراع شبکه جهانی وب (WWW) برمی‌گردد. در سال ۱۹۹۰، آلن امتیج (Alan Emtage)، یک دانشجوی کارشناسی ارشد در دانشگاه مک‌گیل (McGill) در مونترال کانادا، وظیفه داشت تا فایل‌های نرم‌افزاری را برای دپارتمان کامپیوتر پیدا کند.

در آن زمان، اطلاعات روی سرورهای FTP (پروتکل انتقال فایل) ذخیره می‌شدند. اگر فایلی را می‌خواستید، باید می‌دانستید دقیقاً روی کدام سرور قرار دارد. امتیج که از جست‌وجوی دستی در میان سرورها خسته شده بود، برنامه‌ای نوشت که شبانه‌روز به سرورهای مختلف متصل می‌شد، لیست فایل‌های آن‌ها را می‌خواند و در یک پایگاه داده مرکزی ذخیره می‌کرد. او نام این ابزار را «آرچی» (Archie) گذاشت که در واقع مخفف کلمه Archive (آرشیو) بود که حرف v از آن حذف شده بود.

آرچی محتوای داخل فایل‌ها را نمی‌خواند، بلکه فقط نام آن‌ها را فهرست می‌کرد. با این حال، همین گام کوچک، انقلابی بزرگ بود. آرچی اولین موتور جستجوی جهان لقب گرفت و به کاربران اجازه داد به جای گشتن کورکورانه، نام یک فایل را جست‌وجو کنند و آدرس سرور آن را بیابند.

گوفر (Gopher) و ورونیکا (Veronica): شوخی‌های کمیک در دنیای آکادمیک

در سال ۱۹۹۲، دانشگاه مینه‌سوتا پروتکلی به نام گوفر (Gopher) را معرفی کرد. گوفر یک سیستم منو-محور بود که اسناد متنی را در اینترنت سازماندهی می‌کرد. اما با گسترش سرورهای گوفر، پیدا کردن اطلاعات در آن‌ها دوباره سخت شد.

اینجا بود که مهندسان دانشگاه نوادا ابزاری برای جست‌وجو در سیستم گوفر ساختند و در یک حرکت طنزآمیز، در پاسخ به موتور جست‌وجوی آرچی، نام آن را ورونیکا (Veronica) گذاشتند! (آرچی و ورونیکا نام شخصیت‌های یک مجموعه کمیک‌بوک بسیار معروف آمریکایی به نام Archie Comics هستند). ورونیکا مخفف عبارت طولانی و به شدت مهندسی‌شده Very Easy Rodent-Oriented Net-wide Index to Computerized Archives بود. مدت کوتاهی بعد، ابزار دیگری برای جست‌وجو در گوفر ساخته شد که جاگ‌هد (Jughead) نام گرفت تا پازل شخصیت‌های کمیک‌بوک آرچی در تاریخ اینترنت تکمیل شود.

ورود به عصر وب: وندکس (Wandex) و ظهور خزندگان دیجیتال

با معرفی شبکه جهانی وب توسط تیم برنرز-لی، اینترنت از حالت متن‌های ساده و لیست‌های FTP خارج شد و مفهوم «لینک دادن» (Hyperlink) شکل گرفت. در سال ۱۹۹۳، متیو گری (Matthew Gray) در موسسه فناوری ماساچوست (MIT)، اولین ربات وب یا خزنده‌ (Crawler) را با نام World Wide Web Wanderer طراحی کرد.

هدف اولیه این ربات، فقط اندازه‌گیری وسعت وب بود، اما به زودی ابزاری به نام وندکس (Wandex) از داده‌های آن برای ایجاد یک فهرست قابل جست‌وجو استفاده کرد. تقریباً در همان زمان، Aliweb (اولین موتور جست‌وجوی اختصاصی وب) نیز متولد شد، اما به دلیل نیاز به ثبت دستی سایت‌ها توسط مدیران، نتوانست مقیاس‌پذیر شود.

سال ۱۹۹۴ یک نقطه عطف تاریخی بود. تا پیش از این، موتورهای جست‌وجو فقط نام فایل‌ها یا عناوین صفحات (Title) را ایندکس می‌کردند. اگر کلمه مورد نظر شما در متن مقاله بود اما در عنوان ذکر نشده بود، هرگز آن را پیدا نمی‌کردید.

برایان پینکرتون (Brian Pinkerton)، دانشجوی دانشگاه واشنگتن، موتور جست‌وجوی WebCrawler را در بهار ۱۹۹۴ راه‌اندازی کرد. این اولین موتور جست‌وجویی بود که می‌توانست تمام کلمات داخل یک صفحه وب (Full-text search) را ایندکس کند. این تکنولوژی چنان محبوب شد که در روزهای اول، سرورهای دانشگاه زیر بار ترافیک کاربران از کار افتادند. وب‌کراولر استانداردی را تعریف کرد که تا به امروز اساس کار تمام موتورهای جست‌وجو است.

دایرکتوری یاهو (Yahoo! Directory): انسان‌ها در برابر ماشین‌ها

در اواخر سال ۱۹۹۴، دو دانشجوی دکتری در دانشگاه استنفورد به نام‌های جری یانگ (Jerry Yang) و دیوید فیلو (David Filo)، متوجه شدند که پیگیری سایت‌های جذاب در اینترنت بسیار سخت شده است. آن‌ها شروع به دسته‌بندی سایت‌های مورد علاقه خود در یک لیست سلسله‌مراتبی کردند. این لیست که ابتدا «راهنمای جری و دیوید برای شبکه جهانی وب» نام داشت، خیلی زود تغییر نام داد و یاهو (Yahoo) متولد شد.

یاهو در واقع مخفف Yet Another Hierarchical Officious Oracle (یک اوراکل رسمی و سلسله‌مراتبی دیگر) بود. نکته جالب اینجا بود که یاهو در ابتدا یک موتور جست‌وجوی ماشینی نبود! آن‌ها ارتشی از ویراستاران انسانی را استخدام کردند تا سایت‌ها را بررسی کنند و در دسته‌بندی‌های مشخص (مانند ورزش، هنر، تکنولوژی) قرار دهند. در دهه ۹۰، مردم برای جست‌وجو در اینترنت از الگوریتم‌ها استفاده نمی‌کردند، بلکه در دسته‌بندی‌های یاهو «وب‌گردی» (Surfing) می‌کردند. این رویکرد انسانی، یاهو را به پادشاه بلامنازع اینترنت در دهه ۹۰ تبدیل کرد.

آلتاویستا (AltaVista): غولی که می‌توانست گوگل باشد

اگر یک موتور جست‌وجو وجود داشته باشد که بتوان آن را نماد قدرت مهندسی در اواسط دهه ۹۰ دانست، آن قطعا آلتاویستا (AltaVista) است. در دسامبر ۱۹۹۵، شرکت قدرتمند تجهیزات دیجیتال (DEC) این موتور جست‌وجو را به عنوان یک پروژه جانبی برای نمایش قدرت سوپرکامپیوترهای سری Alpha خود راه‌اندازی کرد.

آلتاویستا فراتر از زمان خود بود. این موتور جست‌وجو با سرعت سرسام‌آوری میلیاردها صفحه را ایندکس می‌کرد. برای اولین بار، ویژگی‌هایی مانند جست‌وجوی چندزبانه (Multilingual) و امکان استفاده از عملگرهای منطقی (مانند AND و OR) در اختیار کاربران عادی قرار گرفت. آلتاویستا حتی در سال ۱۹۹۷ ابزار Babel Fish را معرفی کرد که اولین سیستم ترجمه ماشینی آنلاین متون در اینترنت بود.

این سایت در اوج قدرت خود روزانه بیش از ۸۰ میلیون بازدید داشت. اما سرنوشت آلتاویستا با تصمیمات اشتباه مدیریتی گره خورد. در زمانی که باید روی بهبود جست‌وجو تمرکز می‌کردند، سعی کردند به یک پورتال همه‌کاره (شبیه یاهو) تبدیل شوند و صفحه اصلی خود را پر از اخبار، ایمیل و تبلیغات آزاردهنده کردند. همین شلوغی و کندی باعث شد تا کاربران به محض ورود یک رقیب خلوت‌تر و هوشمندتر، آلتاویستا را برای همیشه ترک کنند.

ازک جیوز (Ask Jeeves): رویای جست‌وجوی محاوره‌ای

در سال ۱۹۹۶، ایده جالبی شکل گرفت: چه می‌شد اگر به جای تایپ کردن کلمات کلیدی خشک، می‌توانستیم سوالات خود را مانند یک انسان بپرسیم؟ Ask Jeeves با یک رابط کاربری که یک پیشخدمت بریتانیایی (Jeeves) را نشان می‌داد، پا به عرصه گذاشت. شما می‌توانستید بپرسید: «آب‌وهوای لندن امروز چگونه است؟» و این سیستم سعی می‌کرد با پردازش زبان طبیعی (NLP) پاسخ را پیدا کند. اگرچه فناوری آن زمان برای درک کامل زبان انسان هنوز ضعیف بود، اما Ask Jeeves پیش‌گام ایده‌ای شد که امروز در دستیارهای صوتی به بلوغ رسیده است.

تغییر پارادایم: پایان یک دوران و ظهور الگوریتم‌های هوشمند

با نزدیک شدن به اواخر دهه ۹۰، وب به قدری بزرگ شده بود که موتورهای جست‌وجوی متکی بر کلمات کلیدی (Keyword-based) و دایرکتوری‌های انسانی فلج شده بودند. اگر شما کلمه “دانشگاه” را جست‌وجو می‌کردید، موتورهای آن زمان نمی‌دانستند سایت رسمی دانشگاه هاروارد را نشان دهند یا وبلاگ یک دانش‌آموز را که کلمه “دانشگاه” را ۱۰۰ بار در آن تکرار کرده بود.

این مشکل در سال ۱۹۹۸ توسط لری پیج و سرگی برین حل شد. گوگل با اختراع الگوریتم PageRank، به جای شمردن کلمات، به «اعتبار» سایت‌ها بر اساس لینک‌های ورودی نگاه کرد. با ورود گوگل، صفحه اصلی شلوغ اینترنت با یک صفحه کاملاً سفید و یک لوگوی رنگی جایگزین شد و عصر طلایی موتورهای اولیه به پایان رسید.

هوش مصنوعی: پایان عصر جست‌وجوی کلیدواژه‌ای

تاریخ همیشه در حال تکرار است. همان‌طور که گوگل با الگوریتم‌های هوشمندتر خود به دوران موتورهای جست‌وجوی مکانیکی دهه ۹۰ پایان داد، امروز ما در آستانه یک تغییر پارادایم دیگر هستیم. با ظهور هوش مصنوعی مولد (Generative AI) و ابزارهایی مانند ChatGPT، Perplexity و موتورهای جست‌وجوی مبتنی بر هوش مصنوعی، مفهوم «جست‌وجو» به طور بنیادین در حال تغییر است. ما دیگر لیستی از لینک‌های آبی را زیر و رو نمی‌کنیم تا خودمان اطلاعات را استخراج کنیم؛ بلکه هوش مصنوعی میلیون‌ها سند را در کسری از ثانیه می‌خواند، تحلیل می‌کند و یک پاسخ مستقیم، محاوره‌ای و شخصی‌سازی‌شده به ما ارائه می‌دهد. عصر طلایی موتورهای جست‌وجوی سنتی، جای خود را به عصر «موتورهای پاسخ‌دهی» و استدلال ماشینی می‌دهد.