icon-mess
Chat Zalo
(24/7)
zalo

Cách sửa lỗi thu thập dữ liệu Google Webmaster – Limoseo

Cách khắc phục lỗi thu thập thông tin có thể tránh được và chúng không nhất thiết gây tác động tiêu cực ngay lập tức đến hiệu suất SEO. Tuy nhiên, việc giải quyết lỗi này là cần thiết. Biết được số lượng Lỗi Thu Thập Dữ Liệu Google Webmaster là một dấu hiệu tích cực với Google, vì nó phản ánh tình trạng của trang web. Ngoài ra, nếu bot của Google gặp ít lỗi thu thập dữ liệu hơn trên trang của bạn, người dùng sẽ ít gặp lỗi trang web và máy chủ của bạn hơn. Cùng Công Ty Quảng Cáo Marketing Online Limoseo tìm hiểu nhé!

1. Hướng dẫn sửa Lỗi Thu Thập Dữ Liệu Google Webmaster

1.1. Đánh dấu tất cả các lỗi thu thập thông tin đã được sửa

Mặc dù có vẻ là một lời khuyên đơn giản, nhưng điều này thực sự giúp bạn giải quyết các lỗi thu thập thông tin theo cách có hệ thống. Khi bạn xem báo cáo lỗi thu thập thông tin lần đầu, có thể bạn sẽ thấy hàng trăm hoặc hàng nghìn lỗi. Việc đánh dấu các lỗi thu thập thông tin không liên quan là đã được sửa sẽ giúp bạn tìm hiểu và cách khắc phục lỗi thu thập dữ liệu Google Webmaster một cách hiệu quả.

Đánh dấu tất cả các lỗi thu thập thông tin đã được sửa

1.2. Kiểm tra báo cáo lỗi thu thập thông tin mỗi tuần

Chọn một ngày cố định mỗi tuần và kiểm tra báo cáo lỗi thu thập thông tin của bạn. Nếu không có lỗi xuất hiện so với tuần trước, bạn sẽ biết rằng bot của Google gần đây đã gặp lỗi. Dưới đây là một số lỗi có thể xuất hiện trong báo cáo lỗi thu thập thông tin hàng tuần:

1.2.1. Lỗi 404 khi thu thập thông tin

Đây là một trong những lỗi thu thập thông tin phổ biến nhất trên web và cũng là lỗi dễ sửa nhất. Chỉ cần nhấp vào lỗi thu thập thông tin trong báo cáo, một cửa sổ sẽ hiển thị:

Xin lưu ý rằng thông tin trong tab “Được liên kết từ” không phải lúc nào cũng được cập nhật.

1.2.2. Lỗi 404 do liên kết hỏng từ các trang web khác

Nếu URL được liên kết từ trang web khác, bạn chỉ cần thực hiện chuyển hướng 301 từ URL lỗi sang URL chính xác. Bạn có thể liên hệ với quản trị viên web để yêu cầu điều chỉnh, nhưng trong hầu hết các trường hợp, điều đó không quá quan trọng.

1.2.3. Lỗi 404 do liên kết nội bộ hoặc sơ đồ trang bị lỗi

Nếu một URL gây ra lỗi 404 cho bot Google và nó được liên kết từ một trong các trang của bạn hoặc từ sơ đồ trang web, bạn nên sửa liên kết đó hoặc sửa sơ đồ trang web. Trong trường hợp này, Cách khắc phục lỗi thu thập dữ liệu Google Webmaster là bạn có thể sử dụng chuyển hướng 301 từ URL 404 đến URL đã chỉnh sửa để khắc phục lỗi.

1.2.4. Lỗi 404 do Google thu thập dữ liệu JavaScript

Đôi khi, bạn có thể gặp phải lỗi 404 kỳ lạ trong Google Search Console, khi một số hoặc tất cả các trang của bạn đều liên kết đến nó. Khi bạn kiểm tra các liên kết trong mã nguồn, bạn sẽ nhận thấy rằng chúng là các URL tương đối được bao gồm trong các tập lệnh.

1.2.5. Lỗi 404 bí ẩn

Trong một số trường hợp, nguồn gốc của liên kết vẫn là một bí ẩn. Dữ liệu mà Google cung cấp trong báo cáo lỗi thu thập thông tin không luôn đáng tin cậy 100%. Ví dụ, thông tin trong tab “Được liên kết từ” không phải lúc nào cũng được cập nhật hoặc không liên kết với các URL bị lỗi.

Hãy nhớ luôn đánh dấu tất cả các lỗi thu thập thông tin 404 đã được xử lý là đã sửa trong báo cáo. Nếu có lỗi thu thập thông tin 404 và bạn không biết phải làm gì, bạn vẫn có thể đánh dấu chúng là đã sửa và ghi chú lại trong danh sách của bạn. Nếu chúng xuất hiện lại, bạn sẽ cần tìm hiểu sâu hơn về lỗi thực tế đó.

Bây giờ, chúng ta hãy tìm hiểu về vấn đề “Soft 404”.

1.2.6. Ý nghĩa của lỗi “Soft 404”

Lỗi “Soft 404” là khi bot của Google gặp phải một trang trống nhưng trả về mã 200.

Đơn giản là trang này được Google cho là trang 404 nhưng thực tế không phải là trang. Vào năm 2014, quản trị viên web bắt đầu nhận được lỗi “Soft 404” cho một số trang với nội dung. Điều này cho biết Google cho rằng trang của bạn có ít nội dung.

Xử lý lỗi “Soft 404” cũng tương tự như xử lý lỗi 404 thông thường:

  • Nếu URL gây ra lỗi “Soft 404” không tồn tại, bạn nên chuyển hướng 301 đến một trang hiện có. Đồng thời, đảm bảo rằng URL không tồn tại không trả về mã lỗi 404.
  • Nếu URL gây ra lỗi “Soft 404” là một trang thực sự, điều đó có nghĩa là Google xem nó là một trang có nội dung mỏng.

Sau khi sửa lỗi “Soft 404”, hãy đánh dấu chúng là đã sửa. Tiếp theo, chúng ta sẽ thảo luận về lỗi máy chủ 500.

1.2.7. Lỗi máy chủ 500 và cách khắc phục

Lỗi máy chủ 500 có thể là một loại lỗi Crawl Error thu thập thông tin đáng lo ngại. Nếu bot của Google gặp lỗi máy chủ thường xuyên trên trang web của bạn, đó là dấu hiệu mạnh rằng trang của bạn có vấn đề và có thể dẫn đến thứ hạng kém.

Loại lỗi thu thập thông tin này có thể xuất hiện vì nhiều lý do. Đôi khi, điều này có thể xảy ra khi tên miền phụ, thư mục hoặc phần mở rộng tệp gây ra máy chủ trả về mã trạng thái 500 thay vì 200. Bạn có thể khắc phục điều này bằng cách gửi danh sách URL gặp trở ngại gần đây từ Công cụ Quản trị Web của Google cho nhà phát triển web của bạn.

Có thể máy chủ đã tạm ngừng hoạt động do bảo trì hoặc quá tải. Bạn có thể kiểm tra tệp nhật ký và liên hệ với nhà phát triển web của bạn. Trong những trường hợp như vậy, hãy cố gắng đảm bảo rằng sự cố tương tự sẽ không tái diễn trong tương lai.

Hãy chú ý đến lỗi máy chủ hiển thị trong Công cụ Quản trị Web của Google và cố gắng giảm thiểu số lần xuất hiện của chúng. Bot của Google sẽ tiếp tục truy cập vào trang của bạn để loại bỏ lỗi này.

Hãy xem một số lỗi thu thập thông tin khác mà bạn có thể gặp phải trong Công cụ Quản trị Web của Google.

1.2.8. Lỗi tải: 400, 503, …

Chúng tôi đã giải quyết các lỗi thu thập thông tin quan trọng và phổ biến nhất trong bài viết này: 404, Soft 404 và 500. Tuy nhiên, đôi khi bạn có thể gặp các loại lỗi thu thập thông tin khác như 400, 503, “Truy cập bị từ chối”, “Chuyển hướng lỗi” (dành cho điện thoại di động).

Nói chung, bạn nên xử lý bất kỳ loại lỗi thu thập thông tin nào bạn tìm thấy và cố gắng ngăn chúng tái diễn trong tương lai. Mức độ lỗi thu thập thông tin ít hơn mà bot của Google gặp phải, Google sẽ tin tưởng trang web của bạn hơn. Trang web liên tục gây ra lỗi thu thập thông tin sẽ được xem là cung cấp trải nghiệm người dùng kém và sẽ xếp hạng thấp hơn.

Kiểm tra báo cáo lỗi thu thập thông tin mỗi tuần

2. Danh sách các lỗi Thu Thập Dữ Liệu Google Webmaster khác

2.1. Sự cố máy chủ 500

Trong báo cáo này, Google liệt kê các đường dẫn trả về lỗi Crawl Error 500 khi bot của Google cố gắng thu thập dữ liệu trang.

2.2. Trang không tồn tại (Mềm 404)

Đây là những đường dẫn trả về mã trạng thái 200, nhưng thực tế lại là lỗi 400, theo Google.

2.3. Truy cập bị từ chối (403)

Tại đây, Google liệt kê tất cả các đường dẫn trả về lỗi 403 khi bot của Google cố gắng thu thập dữ liệu chúng. Đảm bảo rằng bạn không liên kết đến các đường dẫn yêu cầu xác thực. Bạn có thể bỏ qua lỗi “Truy cập bị từ chối” đối với các trang mà bạn đã đưa vào tệp robots.txt. Tuy nhiên, bạn nên sử dụng liên kết nofollow khi liên kết đến các trang này để Google không thu thập thông tin chúng nhiều lần.

2.4. Không tìm thấy (404/410)

“Không tìm thấy” là lỗi 404 cơ bản.

Không tìm thấy (404_410)

2.5. Không theo dõi (301)

Lỗi “Không theo dõi” xảy ra khi một đường dẫn đã chuyển hướng đến một đường dẫn khác, nhưng chuyển hướng không thành công. Cần phải sửa những chuyển hướng này!

2.6. Lỗi 400/405/406

Chúng tôi khuyên bạn nên xử lý những lỗi này tương tự như xử lý lỗi 404 thông thường.

2.7. Nội dung Flash (Smartphone)

Báo cáo này đơn giản chỉ liệt kê các trang có nhiều nội dung flash hoạt động trên hầu hết các điện thoại thông minh. Bạn nên loại bỏ nội dung flash!

2.8. Blocked (Smartphone)

Lỗi này ám chỉ các trang có thể được truy cập bởi bot của Google, nhưng đã bị chặn đối với bot của Google trên thiết bị di động trong tệp robots.txt của bạn. Đảm bảo rằng bạn cho phép tất cả các bot của Google truy cập vào nội dung bạn muốn lập chỉ mục!

Nếu bạn có bất kỳ ý tưởng bổ sung nào về cách xử lý lỗi Thu Thập Dữ Liệu Google Webmaster, hãy cho Công Ty Quảng Cáo Marketing Online Limoseo biết bằng cách để lại bình luận dưới bài viết này nhé. Xin cảm ơn!

Limoseo - Công ty Dịch vụ SEO & Thiết kế Website
Limoseo – Công ty Dịch vụ SEO & Thiết kế Website
Đánh giá