هل فكرت في معرفة رحلة البحث على “Google”؟
أكرم مدحت
إذا كنت تستخدم محرك البحث Google، فربما سبق أن خطر على بالك السؤال التالي: تُرى كيف تسير الأمور "خلف" الصفحة الرئيسية البيضاء؟ يعمل محرك بحث Google على فهرسة مليارات كثيرة من صفحات الويب، ذلك أن حجم الفهرس الذي نستخدمه يتجاوز 100 مليون غيغابايت، ولكن كيف يمكن لمحرك بحث Google التنقل عبر جميع هذه المعلومات؟
يتم على Google يوميًا إجراء مليارات عمليات البحث. يمكنك على سبيل المثال كتابة [القاهرة]. وفي لمحة بصر وخلال 0.14 ثانية في هذه الحالة ستظهر لك 144 مليون نتيجة بحث. ولكن ما الذي يحدث خلال هذا الوقت المحدود للغاية؟
تستخدم محركات البحث، مثل محرك بحث Google، برامج روبوت تُعرف باسم أدوات الزحف إلى الويب، أو العناكب، وهي برامج تزحف إلى شبكة الويب وتنتقل من رابط إلى رابط بحثًا عن صفحات الويب مع جلب ما تحمله هذه الصفحات من بيانات إلى خوادم Google.
ويمكننا اعتبار شبكة الويب بمثابة كتاب عملاق يضم بين دفتيه مليارات الصفحات، أما محرك بحث Google فيمثل أداة لفهرسة هذا الكتاب، وذلك من خلال محاولة الإفادة من المعلومات التي قد تمثل إجابة محتملة لما يبحث عنه المستخدم في شكل طلب بحث. يعد فهرس Google أحد أكبر الفهارس على الويب، وقد أنفقنا بدورنا مليون ساعة من ساعات العمل الحاسوبي في تصميم الفهرس ليصبح بوضعه الحالي.
إذا رجعنا إلى عملية البحث نفسها نجد أنه عند كتابة طلب البحث [القا…]، يبدأ النظام التنبؤي الذي يوفره محرك بحث Google عرض الخيارات التالية: القاموس، القانون، القاهرة… بحيث يتم في الحال عرض نتائج، وهذه الخدمة تعرف باسم "بحث Google الفوري"، وتعد ميزة البحث الفوري من Google أحد تحسينات عملية البحث التي يتم من خلالها عرض النتائج أثناء كتابة طلب البحث.
وتسعى جوجل إلى تجاوز قيود التكنولوجيا وهيكل العمل لمساعدة المستخدمين في الحصول على نتائج بحث أفضل وبشكل أسرع، وتم الاعتماد في تطوير هذه الميزة على فكرة تقنية مهمة تفيد بأن الكتابة تتم ببطء بينما تتم القراءة بسرعة، فالوقت المنصرم بين كل نقرتين من النقر على المفاتيح يبلغ 300 ميللي ثانية عادة، بينما يبلغ الوقت المنصرم في انصراف البصر إلى جزء آخر على الصفحة لا يتجاوز 30 ميللي ثانية (أي عُشر الأول)، وهذا يعني أنه يمكنك إلقاء نظرة سريعة على صفحة النتائج أثناء الكتابة.
وأهم ما يميز هذه الخدمة أنها تمكن من الحصول على المحتوى المناسب بسرعة أكبر من أي وقت مضى، نظرًا لأن المستخدم لن تضطر إلى إكمال كتابة عبارة البحث بالكامل، أو حتى الضغط على الزر "بحث"، وهناك ميزة أخرى توفرها هذه الخدمة وهي أن الاطلاع على النتائج أثناء الكتابة يجعلك تكوِّن عبارة بحث أفضل من خلال الحصول على استجابة فورية، وبالتالي يمكن ضبط عبارة البحث في الحال حتى تتطابق النتائج تمامًا مع ما يتم البحث عنه، وبذلك قد نتساءل عاجلاً أم آجلاً كيف كان سيبدو البحث بدون هذه الميزات؟.
والآن دعونا نستعرض ما يحدث خلال أقل من خُمس ثانية بعد كتابة [القاهرة]. يتم نقل المعلومات عبر الإنترنت داخل ما يُعرف باسم حزم البيانات. وحزم البيانات هذه عبارة عن ملف يجمع عددًا معينًا من وحدات المعلومات الرقمية أو وحدات البايت. قد تمر الطلبات المختلفة بمسارات مختلفة أثناء بحثها عن المسار الأسرع حتى تتجنب أية عراقيل على الإنترنت. ويتم نقل هذه الطلبات عبر كبلات من الألياف البصرية أو عبر اتصال آخر عالي السرعة، حتى تصل إلى مركز بيانات Google فى أنحاء العالم.
مركز البيانات هو عبارة عن منشأة تستضيف عددًا ضخمًا من أجهزة الكمبيوتر التي تخزن وتعرض أحجامًا ضخمة من البيانات. هناك نوع ما من مراكز البيانات لدى معظم الشركات المتوسطة أو الصغيرة الحجم، أما بالنسبة إلى Google، فتمثل مراكز البيانات أهمية خاصة.
وبالنسبة إلى الخوارزميات المستخدمة في Google، فهي عبارة عن المعادلة الحاسوبية التي تحكم عمليات البحث على “Google”، حيث تتناول الخوارزمية طلب البحث، ثم تطرح ما يربو على 200 سؤال، وهو ما بات معروفًا لدى جوجل باسم "الإشارات"، حتى يحدد أيًا من ملايين الصفحات المتوفرة لديه يقدم إجابات وثيقة الصلة بطلب البحث، ويتم عرض معاينة لصفحات الويب هذه حتى يتمكن المستخدم سريعًا وبمجرد تحريك مؤشر الماوس فوق الأسهم التي تظهر يسار نتيجة البحث من تحديد ما إذا كان يريد زيارة الموقع أم لا.
ويبلغ متوسط الوقت المطلوب لعملية تحميل المعاينات الفورية 0.1 من الثانية، أما متوسط المسافة التي يقطعها طلب البحث على Google فيبلغ 1500 ميل، وبذلك يتم نقل البيانات بسرعة تقترب من سرعة الضوء، أي بمعدل مئات الملايين من الأميال في الساعة.
على الرغم من أنه لا يمكن لشركة Google الإفصاح عن "سر خلطة" الخوارزميات التي تستخدمها، يمكننا أن نخبرك بأن هذه الخوارزميات تأخذ بعين الاعتبار ما إذا كان المحتوى حديثًا على موقع الويب أم قديمًا، وكذلك عدد مواقع الويب الأخرى التي تنشر روابط إلى موقع معين، ومدى موثوقية هذه الروابط.،كما تمثل الكلمات التي تحتوي عليها صفحة الويب وسرعة الموقع وهيكل موقع الويب عوامل مهمة أيضًا في تحديد ترتيب النتائج على Google.
وتجدر الإشارة إلى أن الخوارزمية ليست وصفة ثابتة، فهي دائمًا ما تخضع لتنقيحات حتى زاد عدد ما دخل عليها من تحسينات خلال العام الماضي فقط عن 500 تحسين.
oui