Sitemap là một phần quan trọng để tối ưu hóa bất kỳ website nào. Sitemap không chỉ cung cấp cho các công cụ tìm kiếm sơ đồ trang web chi tiết về cách trang web của bạn được bố trí mà còn có thể bao gồm các dữ liệu có giá trị như:

  • Tần suất mỗi trang được cập nhật.
  • Khi các trang được thay đổi lần cuối.
  • Làm thế nào để báo các trang quan trọng cho các search engine.

Sitemap đặc biệt quan trọng đối với các trang web:

  • Bao gồm rất nhiều nội dung lưu trữ không được liên kết với nhau.
  • Thiếu liên kết bên ngoài.
  • Có hàng trăm hoặc thậm chí hàng ngàn trang.

Đúng như tên gọi, các tệp này cung cấp cho bot bản đồ trang web của bạn giúp chúng khám phá và lập chỉ mục các trang quan trọng nhất.

Sitemap là gì?

Sitemap là bản đồ của website giúp trình thu thập công cụ tìm kiếm hiểu và điều hướng trang web tốt hơn. Theo nghĩa kỹ thuật đó là một tệp liệt kê các trang và các tệp khác trên website của bạn và mối quan hệ giữa chúng.

 

Công cụ tìm kiếm sử dụng tệp Sitemap này để thu thập dữ liệu trang web của bạn thông minh hơn. Nó giúp họ thu thập dữ liệu và lập chỉ mục các trang web của bạn theo cách tốt hơn.

Tips: Bạn có thể xem giao thức cho Sitemap tại đây - https://www.sitemaps.org/index.html

Làm thế nào để tối ưu Sitemap tốt với SEO?

Về mặt SEO, Sitemap cung cấp một lợi thế trực tiếp vì chúng giúp các công cụ tìm kiếm thu thập dữ liệu trang web và lập chỉ mục các trang của bạn tốt hơn. Điều này cho phép họ hiểu nội dung trang web tốt hơn và xếp hạng các trang cho các truy vấn tìm kiếm phù hợp nhất.

Và các công cụ tìm kiếm hiểu rõ hơn và lập chỉ mục các trang của bạn, thứ hạng tìm kiếm của bạn cho các truy vấn tìm kiếm có liên quan sẽ càng cao.

Sitemap đặc biệt hữu ích cho các trang web lớn hoặc những trang web có nhiều trang không được liên kết. Trong những trường hợp này, Sitemap giúp hiển thị mối quan hệ giữa các trang và giúp công cụ tìm kiếm hiểu trang web của bạn tốt hơn.

Trong bài viết này, chúng tôi sẽ thảo luận về 12 mẹo quan trọng nhất bạn cần biết để tạo và tối ưu hóa Sitemap của mình cho các công cụ tìm kiếm thu thập và lập chỉ mục tốt nhất.

1. Sử dụng Công cụ & Plugin để tự động tạo Sitemap

Tạo Sitemap thật dễ dàng khi bạn có các công cụ phù hợp, chẳng hạn như phần mềm kiểm toán với trình tạo Sitemap XML tích hợp hoặc các plugin phổ biến như Google Sitemap XML.

Trên thực tế, các trang web WordPress đã sử dụng Yoast SEO có thể kích hoạt Sitemap XML trực tiếp trong plugin.

Nếu bạn không dùng Wordpress bạn có thể sử dụng Công cụ sinh sitemap tự động miễn phí XML Sitemap Generator công cụ này sẽ tạo 500 URL cho trang web của bạn.
 

Hướng dẫn tạo sitemap tự động với công cụ XML Sitemap Generator

 

Bước 1: Truy cập vào link: https://xmlsitemapgenerator.org/sitemap-generator.aspx
B
ước 2: Nhập địa chỉ site của bạn và thêm các tùy chọn như tần suất post Content sau đó click nút "Generate sitemap"
Bước 3: Updload file sitemap.xml lên Google Search Console như trình bày trong mục 2 của bài viết

Ngoài ra, bạn có thể tự tạo một Sitemap bằng cách tuân theo cấu trúc mã Sitemap XML. Về mặt kỹ thuật, Sitemap của bạn thậm chí không cần phải ở định dạng XML - một tệp văn bản với một dòng mới phân tách từng URL sẽ đủ.

Tuy nhiên, bạn sẽ cần tạo một Sitemap XML hoàn chỉnh nếu bạn muốn triển khai thuộc tính hreflang, vì vậy việc để một công cụ thực hiện công việc cho bạn sẽ dễ dàng hơn nhiều.

Truy cập trang Google và Bing chính thức để biết thêm thông tin về cách thiết lập Sitemap của bạn theo cách thủ công.

2. Gửi Sitemap của bạn tới Google

Bạn có thể gửi Sitemap của mình cho Google từ Google Search Console. Từ bảng điều khiển của bạn, nhấp Thu thập thông tin> Sitemap> Thêm Sitemap thử nghiệm.

 

Kiểm tra Sitemap của bạn và xem kết quả trước khi bạn nhấp vào Gửi Sitemap để kiểm tra các lỗi có thể ngăn các trang đích chính bị lập chỉ mục.

Lý tưởng nhất là bạn muốn số lượng trang được lập chỉ mục giống với số lượng trang được gửi.

Lưu ý rằng việc gửi Sitemap của bạn cho Google biết những trang nào bạn cho là chất lượng cao và xứng đáng được lập chỉ mục, nhưng điều đó không đảm bảo rằng chúng sẽ được lập chỉ mục.

Thay vào đó, lợi ích của việc gửi Sitemap của bạn là:

3. Ưu tiên các trang chất lượng cao trong Sitemap của bạn

Khi nói đến xếp hạng, chất lượng trang web tổng thể là một yếu tố quan trọng.

Nếu Sitemap của bạn hướng bot đến hàng ngàn trang chất lượng thấp, công cụ tìm kiếm sẽ hiểu các trang này là một dấu hiệu cho thấy trang web của bạn có thể không phải là một khách truy cập sẽ muốn truy cập - ngay cả khi các trang đó là cần thiết cho trang web của bạn, chẳng hạn như các trang đăng nhập.

Thay vào đó, hãy cố gắng hướng bot đến các trang quan trọng nhất trên trang web của bạn. Lý tưởng nhất, đây là những trang:

  • Tối ưu hóa cao.
  • Bao gồm hình ảnh và video.
  • Có nhiều nội dung độc đáo.
  • Nhắc người dùng tham gia thông qua ý kiến comment và đánh giá.

4. Khắc phục Issues của URL không được lập chỉ mục

Google Search Console có thể gây một chút khó khăn nếu nó không lập chỉ mục tất cả các trang của bạn vì nó không cho bạn biết trang nào có vấn đề.

Ví dụ: nếu bạn gửi 20.000 trang và chỉ 15.000 trang trong số đó được lập chỉ mục, bạn sẽ không được cho biết 5.000 trang có vấn đề là gì.

Điều này đặc biệt đúng với các trang web thương mại điện tử lớn có nhiều trang cho các sản phẩm rất giống nhau.

Các Chuyên gia SEO đã có một hướng dẫn hữu ích để cô lập các trang có vấn đề. Khuyên bạn nên chia các trang sản phẩm thành các sơ đồ trang XML khác nhau và thử nghiệm từng trang.

Tạo các Sitemap sẽ khẳng định các giả thuyết, chẳng hạn như các trang không có hình ảnh sản phẩm không được lập chỉ mục các trang hoặc các trang mà không có bản sao duy nhất sẽ không được lập chỉ mục.

Khi bạn đã giải quyết được các vấn đề chính, bạn có thể khắc phục sự cố hoặc đặt các trang đó thành noindex, vì vậy chúng không làm giảm chất lượng trang web chung của bạn.

Cập nhật: Google Search Console gần đây đã được cập nhật về “Chỉ mục”. Cụ thể, các trang vấn đề hiện được liệt kê và lý do tại sao Google không lập chỉ mục một số URL được cung cấp.

5. Chỉ bao gồm các phiên bản Canonical của URL trong Sitemap

Khi bạn có nhiều trang rất giống nhau, chẳng hạn như các trang sản phẩm cho các màu khác nhau của cùng một sản phẩm, bạn nên sử dụng thẻ link rel=canonical tựa để cho Google biết trang nào là trang chính của họ mà họ nên thu thập dữ liệu và lập chỉ mục.

Bots có thời gian dễ dàng hơn để khám phá các trang chính nếu bạn không bao gồm các trang có URL chính tắc chỉ vào các trang khác.

6. Sử dụng Thẻ Meta Robot hoặc Robots.txt bất cứ khi nào có thể

Khi bạn không muốn một trang được lập chỉ mục, bạn thường muốn sử dụng meta robot, noindex, theo dõi thẻ tag.

Điều này ngăn Google lập chỉ mục trang nhưng nó bảo toàn giá trị liên kết(link equity) của bạn và nó đặc biệt hữu ích cho các trang tiện ích quan trọng đối với trang web của bạn nhưng không nên hiển thị trong kết quả tìm kiếm.

Bạn muốn sử dụng robot.txt để chặn các trang là khi bị ăn hết ngân sách thu thập dữ liệu của mình.

Nếu bạn nhận thấy rằng Google đang thu thập lại và lập chỉ mục các trang tương đối không quan trọng (ví dụ: các trang sản phẩm riêng lẻ) với chi phí của các trang cốt lõi, bạn có thể muốn sử dụng robot.txt.

7. Không bao gồm URL 'noindex' trong Sitemap của bạn

Nói về ngân sách thu thập dữ liệu lãng phí, nếu robot công cụ tìm kiếm không được phép lập chỉ mục các trang nhất định, thì chúng không có doanh nghiệp trong Sitemap của bạn.

Khi bạn gửi Sitemap bao gồm các trang bị chặn và các trang noindex, bạn đồng thời nói với Google, điều thực sự quan trọng là khi nó thu thập trang này thì sẽ không được phép lập chỉ mục trang này.

Thiếu tính nhất quán là một lỗi phổ biến.

8. Tạo Sitemap XML động cho các trang web lớn

Gần như không thể theo kịp tất cả các robot meta của bạn trên các trang web lớn.

Thay vào đó, bạn nên thiết lập logic quy tắc để xác định khi nào một trang sẽ được đưa vào Sitemap XML của bạn hoặc thay đổi từ chỉ mục noindex sang index, hãy theo dõi.

Bạn có thể cân nhắc cách tạo Sitemap XML động, nhưng, một lần nữa, bước này được thực hiện dễ dàng hơn nhiều với sự trợ giúp của công cụ tạo Sitemap động cho bạn như đã giới thiệu ở mục 1.

9. Chỉ cập nhật thời gian sửa đổi khi bạn thực hiện thay đổi đáng kể

Đừng cố lừa các công cụ tìm kiếm vào các trang lập chỉ mục lại bằng cách cập nhật thời gian sửa đổi của bạn mà không tạo bất kỳ trang đáng kể nào cho trang của bạn.

Tôi đã nói rất nhiều về những nguy cơ tiềm ẩn của SEO rủi ro  đủ để nói rằng Google có thể bắt đầu xóa ngày của bạn nếu chúng được cập nhật liên tục mà không cung cấp giá trị mới.

10. Có cần cài đặt ưu tiên cho các URL?

Một số Sitemap có một cột Ưu tiên hàng đầu có thể nói với các công cụ tìm kiếm những trang nào là quan trọng nhất.

Cho dù tính năng này thực sự hoạt động, tuy nhiên, đã được tranh luận từ lâu.

Đầu năm ngoái, Gary Illyes của Google đã tweet rằng Googlebot bỏ qua các cài đặt ưu tiên trong khi thu thập thông tin.

11. Giữ kích thước tệp càng nhỏ càng tốt

Sitemap của bạn càng nhỏ, bạn càng dễ dàng cho các BOT tìm kiếm khi thu thập và đánh chỉ mục.

Google và Bing đều tăng kích thước của các tệp Sitemap được chấp nhận từ 10 MB lên 50 MB vào năm 2016, nhưng vẫn nên giữ Sitemap của bạn càng gọn càng tốt và ưu tiên các trang đích chính của bạn.

12. Tạo nhiều Sitemap nếu Trang web > 50.000 URL

Bạn bị giới hạn ở 50.000 URL trên mỗi Sitemap.

Mặc dù điều này là quá đủ cho hầu hết các trang web, một số trang web sẽ cần tạo nhiều hơn một Sitemap.

Ví dụ, các trang web thương mại điện tử lớn có thể cần tạo thêm Sitemap để xử lý các trang sản phẩm bổ sung.

Tóm kết

Sitemap rất mạnh mẽ và là một nền tảng của SEO. Bạn nên sử dụng Sitemap để cải thiện thứ hạng của trang web của mình bằng cách giúp các công cụ tìm kiếm thu thập dữ liệu trang web của bạn thông minh hơn.

Tuy nhiên, có một số thực tiễn tốt nhất về Sitemap mà bạn nên tuân theo để thực hiện đúng cách. Những thực tiễn tốt nhất này sẽ giúp bạn tạo Sitemap đúng cách và đảm bảo rằng chúng thực hiện tốt chức năng của mình.

Tận dụng các thực tiễn tốt nhất về Sitemap được liệt kê ở đây để tạo, gửi và cập nhật Sitemap của bạn đúng cách.

Nếu bạn có bất kỳ câu hỏi nào liên quan đến bài đăng này, vui lòng hỏi những người trong phần bình luận.

Dũng Hoàng, admin SeoTheTop