أنظمة البحث
أنظمة البحث هي ما يُشار إليه عادةً بمحركات البحث (مثل Google وBing وDuckDuckGo وغيرها). وهي أنظمة معقدة للغاية تتناول بعضًا من أكبر التحديات في تاريخ التكنولوجيا.
تتمثل المسؤوليات الرئيسية لأنظمة البحث في أربع مهام:
- الزحف (Crawling): عملية تجول الويب وتحليل المحتوى في جميع المواقع الإلكترونية. وهذه مهمة ضخمة نظرًا لوجود أكثر من 350 مليون نطاق متاح.
- الفهرسة (Indexing): إيجاد أماكن لتخزين جميع البيانات التي تم جمعها خلال مرحلة الزحف بحيث يمكن الوصول إليها.
- التصيير (Rendering): تنفيذ أي موارد على الصفحة مثل JavaScript التي قد تعزز الميزات وتثري المحتوى على الموقع. هذه العملية لا تحدث لجميع الصفحات التي يتم زحفها وأحيانًا تحدث قبل فهرسة المحتوى فعليًا. قد يحدث التصيير بعد الفهرسة إذا لم تكن هناك موارد متاحة لأداء المهمة في وقت الزحف.
- الترتيب (Ranking): استعلام البيانات لصياغة صفحات نتائج ذات صلة بناءً على مدخلات المستخدم. هنا يتم تطبيق معايير الترتيب المختلفة في محركات البحث لإعطاء المستخدمين أفضل إجابة لتحقيق نيتهم.
في القسم التالي، سنتعلم بشكل أكثر تحديدًا كيفية عمل Googlebot. Googlebot هو زاحف الإنترنت الخاص بجوجل، وهو جزء من نظام البحث الذي يجمع كل المعلومات اللازمة لإنشاء قاعدة البيانات الضخمة للمحتوى لتقديم نتائج البحث.