مدیریت سئو

بهینه سازی و رفع خطاهای گوگل وبمستر_crawl errors (بخش دوم)

گوگل وبمستر - روندسافت

2. خطاهای آدرس در گوگل وبمستر تولز (URL Errors)

خطاهای URL در گوگل وبمستر زمانی رخ می‌دهند که برخی از صفحات سایت‌تان دچار مشکل شده باشند و کل سایت را درگیر نمی‌کند. در واقع این خطا به صفحات داخلی سایت توجه داشته و عدم دسترسی ربات گوگل به آن‌ها را لیست می‌کند. در صورتی که تعداد خطاهای موجود در این بخش زیاد و مربوط به صفحات مهم سایت‌تان باشد، می‌تواند برروی سئوی شما تاثیر منفی داشته باشد.
اگر به تازگی تغییرات زیادی در سایت خود ایجاد کرده‌اید و آدرس صفحات را عوض کرده باشید، خطا در این بخش بسیار طبیعی می‌باشد. برخی از این خطاها نیز ممکن است مربوط به گذشته بوده و در حال حاضر حل شده باشند. برای عدم نمایش آن‌ها می‌توانید از گزینه Mark as fixed استفاده کنید که در ادامه روش انجام آن را آموزش خواهیم دید.
هنگامی که شما این کار را انجام می‌دهید گوگل وبمستر به صورت موقت آن‌ها را نادیده می‌گیرد اما اگر خطاها بر طرف نشده باشند، پس از مدتی مجدداً یادآوری خواهد کرد.
به طور کلی با آپدیت کردن مداوم نقشه سایت و هرس کردن آدرس‌های آن، و همچنین ریدایرکت صفحات حذف شده می‌توانید خطاهای این قسمت را کاهش دهید. اما اگر می‌خواهید دقیق خطاها را رفع نمایید، در ادامه مطلب با من همراه باشید.

چطور مثل یک وبمستر حرفه‌ای از google webmaster tools استفاده کنیم؟حتما بخوانید: چطور مثل یک وبمستر حرفه‌ای از google webmaster tools استفاده کنیم؟

2.1 خطای 404

این خطا زمانی رخ می‌دهد که سرور نمی‌تواند منبع درخواستی را پیدا کند. در خطای ۴۰۴ ارتباط با سرور به طور کامل برقرار شده، اما صفحه یا فایل درخواستی موجود نمی‌باشد؛ هنگامی که ربات‌های خزنده گوگل اقدام به خزیدن به صفحه‌ای از سایت شما می‌کند که حذف شده و یا آدرس آن تغییر کرده، به کاربر ارور ۴۰۴ می‌دهد و لینک‌های داده شده به صفحه را شکسته طلقی می‌کند.

خطاهای Crawl Errors گوگل وبمستر

در چه صورتی با خطای 404 مواجه می‌شویم؟

گاهی اوقات ممکن است خطای ۴۰۴ به صفحاتی داده شوند که هرگز وجود نداشته‌اند. این آدرس‌ها ممکن است به دنبال لینک‌های موجود در فایل‌های جاواسکریپت یا فلش یا حتی نقشه سایت و… بدست آمده باشند.

گاهی نیز این امکان وجود دارد سایت‌های دیگر عمداً یا سهواً به شما پیوند اشتباهی داده باشند برای مثال  آدرس صفحه شما www.example.com/redshoos است اما مدیر سایتی دیگر به اشتباه آن را به این صورت تایپ کرده است: www.example.com/redshoes. در این شرایط می‌بایست با مدیر سایت تماس گرفته و از او خواهش کنید تا مشکل به وجود آمده را اصلاح کند.

همچنین گاهی وجود محتوای جعلی یا ریدایریکت بیش از حد و بی‌جهت صفحات باعث می‌شود گوگل نتواند ساختار سایت شما را درک کند.

خطاهای 404 چگونه قابل رفع هستند؟

  1. اطمینان حاصل کنید که صفحه شما منتشر شده باشد و در حالت پیش نویس یا خصوصی نباشد.
  2. مطمئن شوید آدرس صفحه تغییر نکرده باشد.
  3. بررسی کنید خطای ۴۰۴ در صفحه مد نظر با آدرس با www نشان می‌دهد یا بدونwww. همچنین HTTP در مقابل HTTPS.
  4. نقشه سایت خود را مداوم به‌روز کنید و آدرس صفحاتی که پاک کرده‌اید را از روی آن حذف نمایید. بدین منظور می‌توانید راهنمای کامل ما را در خصوص خطاهای نقشه سایت در گوگل وبمستر بخوانید.
  5. اگر نمی‌خواهید صفحه مورد نظر را احیا کنید با استفاده ریدایرکت ۳۰۱ آدرس صفحه را به صفحه جدید منتقل کنید.

البته لازم به ذکر است برای جلوگیری از نمایش خطاهای ۴۰۴ قدیمی پس از مدتی خوده گوگل وبمستر آنها را حذف می‌کند اما برای عدم گزارش آن‌ می‌توانید به روش زیر عمل کنید:

1. برای مشاهده صفحاتی که دچار خطای ۴۰۴ شده‌اند در گوگل وبمستر به مسیر Crawl Errors > URL Errors بروید و وارد تب Not found شوید.

بیشر بخوانید:  رابط کاربری و تجربه کاربری (UI/UX) چیست؟

2. سپس روی آدرس صفحه مورد نظر کلیک کنید، و در پنجره باز شده بروی Linked form کلیک نمایید.

خطاهای Crawl Errors گوگل وبمستر

3. حال باید تمام لینک‌هایی که به این صفحه داده شده‌اند را از صفحات سایت خود و حتی سایت‌های دیگر حذف کنید. این کار یک مقدار دشوار است. اگر کاربر وردپرس هستید میتوانید از افزونه Broken Link Checker استفاده نمایید.

2.2 خطای Soft 404

همانطور که می‌دانید اگر کاربر آدرس صفحه‌ای را که حذف شده و یا آدرس آن تغییر کرده باشد وارد کند، سرور به او خطای 404 نشان می‌دهد. این خطا از طرف مرورگر و موتورهای جستجو کاملا قابل تشخیص است درحالی که خطای 404 soft تنها برچسبی است که موتورهای جستجو و گوگل به برخی از صفحات شما می‌دهند؛ در واقع هنگامی که صفحه‌ای وجود نداشته باشد اما سرور به اشتباه صفحه دیگری(با محتوای کم و غیر قابل استفاده) را نمایش دهد، در گوگل وبمستر خطای 404 soft رخ می‌دهد.
اهمیت این خطا نسبت به خطای 404 بسیار بیشتر است زیرا باعث می‌شود موتورهای جستجو بیشتر وقت خود را صرف ایندکس صفحات و آدرس‌های غیر موجود در سایت شما کنند. بنابراین پیشنهاد می‌کنیم همیشه آن‌ها را جدی بگیرید.

چطور با خطای soft 404 مقابله کنیم؟

برای صفحاتی که وجود ندارند:

  1. تنظیمات سایت خود را در خصوص صفحات حذف شده تغییر دهید و آن‌ها را با پیغام خطای 404(یافت نشد) یا خطای 410(صفحه پاک شده) نمایش دهید.
  2. با استفاده از ریدایرکت 301 آدرس صفحات پاک شده را به صفحه جدید یا صفحه اصلی سایت خود منتقل کنید.
  3. توجه داشته باشید در صورتی که صفحه دیگری با محتوای مشابه دارید، بهتر است صفحه قدیمی را به روی آن ریدایرکت کنید.

همچنین برای صفحاتی که قرار است نگهدارید قبل از هرچیزی مطمئن شوید محتوای مناسبی در صفحه وارد کرده‌اید. گاهی خطای 404 soft در گوگل وبمستر به علت کم بودن محتوا به‌وجود می‌آید؛ حداقل تعداد محتوای تولید شده مناسب 300 کلمه می‌باشد.

2.3 خطای Access denied

در حالت عادی خزنده‌های گوگل با دنبال کردن لینک‌ها از صفحه‌ای به صفحه دیگر سایت شما منتقل می‌شوند و محتوای آن‌ها را جمع‌آوری می‌کنند. اما در صورتی که به علت ممنوع بودن دسترسی به یک صفحه نتوانند آن را بارگذاری کنند، خطای Access denied در گوگل وبمستر نمایش داده می‌شود. این مشکل عموما به دلیل وجود صفحات لاگین به وجود می‌آید و مانع از نمایش قسمتی یا تمام محتوای صفحه می‌شود.
خطاهای Crawl Errors گوگل وبمستر

چطور خطای Access denied را رفع کنم؟

  1. فایل robots.txt را چک کنید تا مطمئن شوید که از ایندکس صفحات لاگین جلوگیری شده است. اگر قبلا آن‌ها را اضافه نکرده‌اید حتما این کار را انجام دهید.
  2. با استفاده از ابزار robots.txt tester هشدارها و خطاهای موجود در فایل robots.txt  را بررسی کنید.
  3. با کمک ابزار Fetch as Google در گوگل وبمستر چک کنید که خزنده‌های گوگل چگونه صفحه مورد نظر شما را می‌بیند.
  4. با استفاده از Screaming Frog درخواست‌های(requires) سایت خود بررسی کنید و مشکلات موجود را بر طرف نمایید.

2.4 خطای Not followed

خطای Not followed به این معنی است که گوگل نمی‌تواند برخی از URLهای شما را دنبال کند(با nofollow لینک‌ها اشتباه گرفته نشود). اغلب دلیل به وجود آمدن این خطا به دو علت می‌باشد:

  • فایل‌های جاوا اسکریپت و فلش و …

برخی از ویژگی‌ها مانند فایل‌های جاوا اسکریپت و فلش، کوکی‌ها و  session IDها و DHTML می‌توانند عملیات خزش خزنده‌های گوگل در سایت شما را سخت کنند. با کمک ابزار Fetch as Google در گوگل وبمستر یا یک مرورگر متن مانند lynx سایت خود را بررسی کنید؛ این ابزارها بسیار کارآمد هستند و کمک شایانی برای از بین بردن این خطا می‌کنند چرا که بسیاری از موتورهای جستجو سایت‌ها این‌گونه می‌ببینند.

  • ریدایرکت‌ها
  1. صفحات‌تان را با یک روش صحیح ریدایرکت کنید. اگر در این زمینه اطلاعات کافی ندارید، می‌توانید راهنمای ما در خصوص ریدایرکت را مطالعه بفرمایید.
  2. در صورت امکان لینک‌های مطلق را جایگزین لینک‌های نسبی کنید؛ به‌عنوان مثال هنگام پیوند دادن به صفحه دیگری از سایت خود به شکل www.example.com/mypage.html لینک دهید، به جای mypage.html
  3. مطئمن شوید ریدایرکت‌های خود را به صفحاتی با URLهای نامعتبر انجام نداده باشید!
  4. لینک صفحه‌هایی را که ریدایرکت کرده‌اید در نقشه سایت وارد نکنید.
بیشر بخوانید:  بهینه سازی و رفع خطاهای گوگل وبمستر (بخش اول)

2.5 خطای Faulty redirect

برخی از سایت‌ها برای کاربران کامپیوتر و موبایل از URLهای متفاوتی استفاده می‌کنند؛ برای مثال اگر آدرس وب‌سایت example.com باشد، افرادی را که با گوشی به سایت مراجعه می‌کنند به m.example.com هدایت می‌شوند. خطای Faulty redirect در گوگل وبمستر زمانی اتفاق می‌افتد که یک صفحه دسکتاپ به اشتباه برروی آدرس صفحه اصلی مختص موبایل ریدایرکت شود. این خطا موجب می‌شود کاربران نتوانند در بین صفحات سایت شما گردش داشته باشند و نهایتاً از آن خارج گردند! برای متوجه شدن موضوع به تصویر زیر نگاهی بیندازید:

خطاهای Crawl Errors گوگل وبمستر

در صورت بروز گوگل برای شما یک پیغام ارسال خواهد کرد و همچنین در گوگل وبمستر به مسیر Crawl > Crawl Errors و در تب Smartphones  به نمایش گذاشته می‎شود.

آموزش اتصال وب سایت به گوگل وبمستر تولز برای افراد مبتدیحتما بخوانید: آموزش اتصال وب سایت به گوگل وبمستر تولز برای افراد مبتدی

به منظور رفع خطای Faulty redirect قبل از هر چیزی تنظیمات مربوط به جداسازی URLهای موبایل و دسکتاپ را چک کنید و از درست بودن آن اطمینان حاصل نمایید. این کار عموماً از طریق فایل .htaccess انجام می‌پذیرد. اما پیشنهاد اصلی گوگل در این زمینه  این است که با استفاده از طراحی ریسپانسیو سایت را به یک شکل برای کاربران موبایل و دسکتاپ نمایش دهید.

2.6 خطای URLS blocked for smartphones

این خطا بدین معناست که  URL یک یا چند صفحه از سایت شما در دستگاه‌های تلفن همراه هوشمند برای ربات‌های خزنده گوگل از طریق فایل robots.txt مسدود شده است. خطای در گوگل وبمستر به مسیر Crawl> Crawl Errors و در بخش URL Errors نمایش داده می‌شوند. البته گوگل می‌گوید لزوماً این خطا تنها در موبایل اتفاق نمی‌افتد و ممکن است صفحات برروی دسکتاپ هم مسدود شوند. به هرحال اگر این خطا را در گوگل وبمستر خود دریافت می‌کنید باید نگاهی به فایل robots.txt سایت خود انداخته و بررسی کنید جلوی دسترسی ربات‌های خزنده را به صفحات مسدود شده، نگرفته باشید.

2.7 خطای Flash content

از آنجا که در نسخه‌های جدید سیستم عامل IOS و اندروید از فلش پشتیبانی نمی‌شود، الگوریتم‌های گوگل لیستی از URLهایی که مقادیر زیادی فلش می‌باشد را لیست می‌کند و در گوگل وبمستر به مسیر Crawl > Crawl Errors و در تب Smartphones به عنوان خطای flash content نمایش می‌دهد. گوگل توصیه می‌کند تجربه کاربری سایت خود را با بهره‌گیری از طراحی ریسپانسیو توسعه دهید.

همچنین دقت داشته باشید هر رویکردی که برای طراحی سایت دارید، باید اجازه دهید ربات‌های خزنده گوگل به فایل‌های جاوا اسکریپ، CSS و تصاویر دسترسی داشته باشد و آن‌ها را با robots.txt یا روش‌های دیگر مسدود نکنید. چرا که الگوریتم‌های گوگل به این فایل‌ها برای شناسایی پیکربندی طراحی سایت نیاز دارد.

2.8 خطای Article disproportionately short و خطای  Article too short

قسمت اصلی مقاله شما را که گوگل از محتوای HTML استخراج کرده است، بسیار کوتاه می‌باشد. این خطا در گوگل وبمستر اکثراً مربوط به صفحات خبرنامه یا صفحه‌هایی که حاوی محتوای چندرسانه‌ای هستند می‌باشد. برای رفع این مشکل پیشنهاد می‌کنم محتوای مرتبط به مقاله را به صفحه مربوطه اضافه کنید. همچنین می‌توانید برای آشنایی بیشتر با این موضوع مقاله‌ای تحت عنوان  یک پست وبلاگ باید چند کلمه داشته باشد را که قبل‌تر در نوین منتشر کرده بودیم، بخوانید.

2.9 خطای Article fragmented و خطای No sentences found

خطای Article fragmented در گوگل وبمستر زمانی رخ می‌دهد که محتوای شما شامل پاراگراف‌ها نباشد. هر پاراگراف موجود در متن مقاله باید حدوداً 6-7 جمله و حداکثر دارای 150 کلمه باشد؛ به این معنی که نه خیلی کوتاه و نه خیلی طولانی باشد.
در صورتی که نکات فوق را رعایت کرده‌اید و فکر می‌کنید متن محتوای‌تان مشکلی ندارد، کدهای HTML متن را نیز یکبار مورد بررسی قرار دهید و مطمئن شوید که از تگ‌های <br> و <p> به درستی استفاده کرده‌اید.

بیشر بخوانید:  دیجیتال مارکتینگ

2.10 خطای Article too long

گوگل وبمستر می‌گوید محتوای این صفحه خیلی طولانی می‌باشد! از علل رخ دادن این خطا می‌تواند مربوط به قالب سایت شما باشد که حاوی متونی افزون بر مقاله اصلی شماست؛ که بهتر است آن‌ها را حذف نمایید. و یا ممکن است نظرات کاربران نیز در کنار مقاله توسط گوگل ایندکس شده باشد؛ برای رفع این مشکل می‌توانید بخش نظرات وب‌سایت را در iframe قرار دهید یا با استفاده از تکنولوژی AJAX آن‌ها در لحظه بارگذاری کنید.

2.11 خطای Date not found

نمایش این خطا در گوگل وبمستر بدین معناست که موتور جستجو نمی‌تواند تاریخ انتشار صفحاتی که لیست شده‌اند را پیدا کند.(احتمال بروز خطای Date not found در سیستم‌های مدیریت محتوا مانند وردپرس بسیار کم می‌باشد مگر در موارد خاص). اگر از متا تگ‌ها استفاده می‌کنید باید تگ date را در بخش <head> سایت خود به کار ببرید. نحوه استفاده از این متا تگ به شکل زیر می‌باشد:

<meta name="date" content="YYYY-MM-DD">

تاریخ را طبق استاندارد W3C تاریخ و زمان را وارد نمایید؛ یعنی به‌صورت YYYY-MM-DD یا با تاریخ کامل به همراه دقیقه و ثانیه و نیز منطقه زمانی YYYY-MM-DDThh:mm:ssTZD.

2.12 خطای Data too old

این خطا بیان‌گر قدیمی بودن تاریخ انتشار مقاله می‌باشد؛ گوگل نیوز تنها مقالات خبری را که تاریخ انتشارشان حداکثر برای 2 روز گذشته باشند، جمع‌آوری می‌کند.

2.13 خطای Empty article

گوگل نتوانسته محتوایی از مقاله شما استخراج کند. ابتدا مطمئن شوید متن مقالات شما در کد منبع(source code) موجود باشد. گاهی ممکن است محتوای نوشته شما در فایل جاوا اسکریپت یا iframe جاسازی شده باشد. در گام بعدی چک کنید با ویژگی‌های “display: none” یا “visibility: hidden” در CSS متن نوشته را پنهان نکرده باشید.

2.14 خطای Extraction failed

این خطا در وبمستر بیان می‌کند گوگل قادر نیست متن، عنوان و تاریخ انتشار محتوای مقاله شما را شناسایی کند و در Google News منتشر کند. ابتدا از صحت اطلاعات وارد شده مطمئن شوید و سپس آن را در نقشه سایت news ارسال نمایید.

2.15 خطای Off-site redirect

صفحه مقاله به یک آدرس دیگر ریدایرکت می‌شود. تمام صفحات و مقالات باید در دامنه سایت وارد شده به گوگل نیوز باشد. اگر به سایت‌های دیگر ریدایرکت نکرده‌اید، مطمئن شوید سایت‌تان توسط شخص دیگری دستکاری نشده باشد؛ بدین منظور می‌توانید آموزش گوگل را در خصوص سایت‌های هک شده بخوانید.

2.16 خطای Page too large

خطای Page too large همان‌طور از نام آن پیداست بیانگر طولانی و سنگین بودن طول مقاله یا صفحه است؛ منبع(source) صفحه HTML باید حداکثر 256 کیلوبایت حجم داشته باشد.

2.17 خطای Title not allowed

عنوانی که گوگل از مقاله شما استخراج می‌کند، معتبر نیست! اغلب می‌توان با استفاده از تگ <title> و استفاده از کلمات کلیدی، همچنین بکار بردن آن در تگ‌های H این مشکل را حل کرد.


این خطا بدین معناست که گوگل نتوانسته عنوان مقاله شما را پیدا کند؛ با استفاده از متا تگ <title> در بخش head سایت، این خطا را رفع کنید!
2.18 خطای Title not found

2.19 خطای Uncompression failed

ربات خزنده اخبار گوگل (Googlebot-News) متوجه شد که صفحه خود را فشرده کرده‌اید اما قادر به استفاده از آن نیست! این خطا می‌تواند به علت خطای سرور یا برنامه نویسی باشد.

 

بازگشت به لیست

نوشته های مشابه

2 دیدگاه در “بهینه سازی و رفع خطاهای گوگل وبمستر_crawl errors (بخش دوم)

  1. ترانه گفت:

    لطفا در مورد وبمستر تولز جدید پست های بیشتری قرار بدهید باز هم سر به سایت خوبتون میزنم

  2. Mehrdad گفت:

    مفید بود ممنون

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *