فهم تقرير تغطية الفهرس
نشرت: 2018-12-20إذا رأيت رسالة مثل هذه خلال الأسبوعين الماضيين ، خذ نفسًا عميقًا واستمر في القراءة! في هذه المقالة سأفصل سبب ظهور مشكلات التغطية من Google Search Console وكيفية إصلاحها.

ما هو تقرير تغطية الفهرس
مع الكشف عن Google Search Console الذي تم تجديده ، هناك عدد من الميزات المحسّنة التي يجب أن تكون على دراية بها. تتمثل إحدى هذه الميزات في تقرير تغطية الفهرس الذي يوضح عدد عناوين URL الخاصة بموقعك التي قام Google بفهرستها (أو فهرستها) وستظهر في نتائج بحث Google. تم العثور على هذا التقرير سابقًا ضمن "حالة الفهرس" في واجهة Search Console القديمة:
القديم مقابل الجديد


الآن ، يمكن العثور على تقرير تغطية الفهرس ضمن قائمة "الفهرس" ، ثم انقر فوق "التغطية". ستظهر لك عناوين URL التي بها أخطاء في الفهرسة ، أو تحذيرات (أو صالحة مع تحذيرات) ، أو صالحة ، أو مستبعدة من فهرس Google. لفهم هذا التقرير بشكل صحيح ، دعنا نستكشف ما تعنيه كل مجموعة من هذه المجموعات.
خطأ : هذه صفحات لا يتم تقديمها حاليًا للباحثين على Google ولكن تعتقد Google أيضًا أن هذا ليس نيتك.
يمكن تشغيل الأخطاء بعدة طرق مختلفة ، بما في ذلك شيء بسيط مثل ملف robots.txt الذي يحظر برامج الزحف من صفحة أرسلتها للفهرسة إلى شيء أكثر تعقيدًا مثل خطأ في الخادم (خطأ مستوى 500). الاخبار الجيدة؟ يمكن إصلاح معظم هذه الأخطاء بسهولة نسبيًا بمساعدة مشرف الموقع أو وكالة التسويق الرقمي أو فريق تطوير الويب.
الأخطاء الأكثر شيوعًا التي نلاحظها في Top Floor هي "تم حظر عنوان URL المُرسَل بواسطة ملف robots.txt" و "عنوان URL المُرسَل الذي تم تمييزه بـ" noindex ". هذه أخطاء أقل خطورة وتظهر من خلال إرسال عنوان URL للفهرسة من خلال Google Search Console بينما إما أن ملف robots.txt يمنع الزحف إلى عنوان URL هذا أو أنه يحتوي على علامة noindex. هذه إشارة متضاربة لأن موقعك يخبر محركات البحث بعدم الزحف إلى هذه الصفحة أو فهرستها ، ولكنه يطلب في نفس الوقت فهرستها. سيرى Google هذا على أنه غير مقصود ويضع علامة عليه ضمن الخطأ بدلاً من الاستبعاد (أو إلغاء الفهرسة المتعمد).
للتعرف على طرق أخرى لمواجهة الخطأ ، انظر أدناه:
- خطأ في الخادم (5xx) : تعذر على الخادم العثور على عنوان URL عند الطلب وقام بإرجاع خطأ مستوى 500.
- الحل : تحدث إلى فريق التطوير لديك لإصلاح هذا الجانب من الخادم. ليس هناك الكثير الذي يمكن لفريق آخر القيام به هنا بدون الخبرة المناسبة.
- خطأ في إعادة التوجيه : توجد مشكلة في سلسلة إعادة التوجيه المرتبطة بعنوان URL هذا. إما أن تكون هناك حلقة إعادة توجيه أو أن عنوان URL في السلسلة به خطأ مستوى 400 أو 500.
- الحل : الزحف إلى عنوان URL ، باستخدام Screaming Frog أو أداة أخرى ، وتحديد خطأ مستوى 400 أو 500 في أحد عناوين URL في سلسلة إعادة التوجيه. إذا لم تكن متأكدًا ، فتحدث إلى وكالة التسويق الرقمي الخاصة بك ويقومون بالتحقق من ذلك نيابةً عنك.
- تم حظر عنوان URL المقدم بواسطة ملف robots.txt : لقد أرسلت هذه الصفحة للفهرسة داخل Google Search Console ، ولكن يتم حاليًا حظر الصفحة بواسطة ملف robots.txt.
- الحل : تحقق جيدًا من ملف robots.txt الخاص بك على www.yoursite.com/robots.txt. تأكد من أن السطر الذي يبدأ بـ "عدم السماح" لا يشير إلى عنوان URL أو المجلد الفرعي بعنوان URL المعني. يمكن أن تساعدك وكالة التسويق الرقمي في تحديد أي مشاكل في ملف robots.txt.
- تم وضع علامة "noindex " على عنوان URL المُرسَل : لقد أرسلت هذه الصفحة للفهرسة ، لكن الصفحة بها علامة وصفية "noindex" أو رأس HTTP.
- الحل : قم بتقييم عنوان URL ، هل تريد العثور على هذه الصفحة عند البحث في Google؟ إذا قمت بذلك ، فما عليك سوى إزالة العلامة الوصفية أو رأس HTTP. إذا لم تتمكن من العثور على علامة noindex من خلال النظر إلى مصدر الصفحة (Control + U) ، فاسأل وكالة التسويق الرقمي أو فريق التطوير.
- يبدو أن عنوان URL الذي تم إرساله هو Soft 404 : لقد أرسلت هذه الصفحة للفهرسة ، لكن Google تعتقد أن هذه الصفحة عبارة عن soft 404.
- الحل: خطأ Soft 404 هو عندما يتم عرض صفحة بها محتوى خطأ 404 ، لكن رمز الحالة ليس 404 ، ولكن 200. افحص الصفحة ، هل من المفترض أن تكون صفحة خطأ بالفعل ورمز الحالة غير صحيح؟ في بعض الأحيان ، يسيء محرك بحث Google تفسير صفحة ذات محتوى منخفض باعتبارها 404 لينة. وفي كلتا الحالتين ، ضع في اعتبارك إعادة التوجيه 301 لنقل المستخدمين إلى صفحة مباشرة ذات صلة.
- لم يتم العثور على عنوان URL الذي تم إرساله (404) : لقد قدمت عنوان URL لرمز خطأ 404 للفهرسة من خلال Google Search Console.
- الحل : لا تريد صفحات خطأ في الفهرس لأنها توفر تجربة مستخدم سيئة. إذا لم يكن من المتوقع أن تعود هذه الصفحة إلى صفحة حالة 200 مباشرة في وقت ما في المستقبل ، فقم بإعادة توجيهها إلى المحتوى ذي الصلة على موقعك.
تحذير : يتم تصنيف عناوين URL المعروضة ضمن قسم التحذير أو "صالحة مع تحذيرات" من Google على أنها "صفحات ... قد تتطلب انتباهك ، وربما تمت فهرستها أو لم تتم فهرستها ، وفقًا للنتيجة المحددة" 1

فماذا يعني هذا؟ بالنسبة لي ، هذا يعني أن Google غير متأكد من كيفية التعامل مع عنوان URL ، لكنها أبقته مفهرسة على مضض. بغض النظر عن حالة كل عنوان URL ، قم بإزالة حالة عدم اليقين هذه وابحث في سبب تمييز كل عنوان URL. مما رأيته حتى الآن ، يعود الأمر إلى شخص يستخدم ملف robots.txt كأداة لإلغاء الفهرسة. هذا غير صحيح لعدة أسباب.
يتم استخدام ملف robots.txt لإعداد قواعد لمنع محركات البحث من الزحف إلى مناطق معينة من موقعك. إذا تم عرض عنوان URL للباحثين على Google وتريد إيقاف هذا ، فلا تضف بند منع إلى ملف robots.txt الخاص بك لأن هذا سيلمح إلى Google لإيقاف التحقق من هذه الصفحة باستخدام برامج الزحف أو العناكب أو أي شيء آخر الاسم الذي تريد منحه لهم. لأخذ عنوان URL بعيدًا عن Google أو أي محرك بحث ، امنحه علامة noindex إما في <head> في HTML أو من خلال رأس HTTP.
على الرغم من أن تركيز هذه المقالة ينصب على الأخطاء والتحذيرات ، دعنا نغطي القسمين "صالح" و "مستبعد" بسرعة.
صالح : بكل بساطة ، هذه قائمة بعناوين URL التي تمت فهرستها بنجاح. ضمان الجودة الوحيد الذي يجب القيام به هنا هو لخريطة موقع XML الخاصة بك وللتأكد من أنك لا تقوم بفهرسة شيء لا تريده. للقيام بذلك ، ما عليك سوى النقر فوق المربع "صالح" (قم بإزالة الالتباس من خلال تحديد مربع واحد فقط في كل مرة) ومراجعة قسم التفاصيل.
ستتم مقابلتك بنوعين رئيسيين من التفاصيل ، "تم الإرسال والفهرسة" و "مفهرسة ، لم يتم إرسالها في خريطة الموقع:"
- تم الإرسال والفهرسة: هذه قائمة بعناوين URL من موقعك والتي تؤكد Google أنها تمت فهرستها بنجاح.
- مفهرسة ولم يتم إرسالها في خريطة الموقع: هذه هي عناوين URL المفهرسة التي لا تظهر في خريطة موقع XML. اعتمادًا على موقعك ، يجب ألا يكون هناك عدد كبير منها. إذا كنت ترغب في فهرسة عنوان URL ، فيجب أن تساعد محركات البحث ونفسك وتضيفهم إلى خريطة موقع XML الخاصة بك. إذا لم تكن متأكدًا من كيفية القيام بذلك ، فيرجى التواصل مع وكالة التسويق الرقمي الخاصة بك ويمكنهم ضمان جودة خريطة موقعك بشكل مناسب.
مستبعد : هذه هي عناوين URL التي تم استبعادها عن قصد من فهرس Google. يمكن أن يحدث هذا من خلال العديد من الطرق المختلفة ، لكن Google تعتقد أن موقعك قد اتخذ خطوات لمنع البحث عن عناوين URL هذه. هذه ليست مشكلة بأي حال من الأحوال وهي جزء من موقع صحي. يجب ترك الموارد الداخلية ، مثل الصفحات المحمية بكلمة مرور أو عناوين URL للصور التي تم إنشاؤها بواسطة موقع WordPress ، خارج الفهرس لأنها تمثل تجربة صفحة مقصودة سيئة للباحثين عبر الإنترنت.
هل لديك أسئلة؟
إذا كنت قد قرأت هذه المقالة وما زلت غير متأكد من كيفية التعامل مع مشكلات التغطية الخاصة بك ، فيرجى الاتصال بنا وسيسعد فريق التسويق عبر البحث لدينا بمساعدتك في حلها.
