Thứ Năm, Tháng Mười Hai 13, 2018
Trang chủ > Tin tức SEO > Google ra thông báo về việc nghiên cứu Sitemap

Google ra thông báo về việc nghiên cứu Sitemap

Google ra thông báo về việc nghiên cứu Sitemap

Theo dòng sự kiện: Tin tức SEO, Kinh nghiệm SEO

Blog Trung tâm quản trị trang web của Google đã thông báo cho chúng tôi rằng nhân viên Google đã trình bày một nghiên cứu mới về Sơ đồ trang web tại hội nghị WWW’09 ở Madrid. Nghiên cứu này hoàn toàn thú vị và tôi khuyên bạn nên in ra 10 trang tài liệu PDF và đọc nó. Đối với những người bạn không có thời gian cho điều đó, tôi hy vọng sẽ làm nổi bật những phát hiện thú vị nhất từ ​​nghiên cứu dưới đây.

Mục đích của nghiên cứu là đo lường một vài năm sử dụng Sơ đồ trang web tại Google để xác định cách tệp Sơ đồ trang web cải thiện mức độ phù hợp và độ mới của chỉ mục web của Google. Theo bảo hiểm, tôi có nghĩa là cách Google thu thập dữ liệu web sâu hơn và tìm thấy nhiều nội dung hơn mà nó có thể không tìm thấy. Tính mới mẻ của Bt, ý tôi là cách Google thu thập nội dung mới hoặc nội dung cập nhật nhanh hơn, khi so sánh với thu thập dữ liệu thông thường.

Google ra thông báo về việc nghiên cứu Sitemap

Các sự kiện thú vị từ nghiên cứu:

~ 35 triệu sơ đồ trang web đã được xuất bản, tính đến tháng 10 năm 2008.
35 triệu Sơ đồ trang web bao gồm các URL “vài tỷ”.
Các định dạng Sơ đồ trang web phổ biến nhất bao gồm XML (77%), Không xác định (17,5%), danh sách URL (3,5%), Atom (1,6%) và RSS (0,11%).
58% URL trong Sơ đồ trang web chứa ngày sửa đổi cuối cùng.
7% URL chứa trường tần số thay đổi.
61% URL chứa trường ưu tiên.
Bài viết thảo luận về quy trình được Google sử dụng cho Sơ đồ trang web. Đây là sơ đồ lưu lượng giải thích nhanh chóng.

Quy trình thu thập dữ liệu sơ đồ trang web của Google
Mức độ phù hợp :
Tập dữ liệu được sử dụng để đo “mức độ phù hợp” của Sơ đồ trang web là khoảng 3 triệu URL, 1,7 triệu URL cụ thể từ Sơ đồ trang web và phần còn lại từ quá trình khám phá thông thường. URL trùng lặp gần một triệu trong quá trình thu thập thông tin khám phá, trái ngược với chỉ 100 URL trùng lặp trong các tệp Sơ đồ trang web. Tóm lại, nghiên cứu phát hiện rằng khám phá là 63% “hiệu quả” và Sơ đồ trang web hiệu quả đến 99% trong việc thu thập thông tin miền với chi phí nhiệm vụ một phần nhỏ nội dung.

Phần trăm các bản sao trong Sơ đồ trang web hầu như tương tự như phần trăm tổng số bản sao.
46% các tên miền có trên 50% UniqueCoverage và trên 12% có trên 90% UniqueCoverage.
Đối với hầu hết các miền, Sơ đồ trang web đạt được tỷ lệ phần trăm URL cao hơn trong chỉ mục có ít trang hơn.
Tươi mới :
Google có thể làm mới với Sơ đồ trang web như thế nào?

78% URL đã được xem bởi Sơ đồ trang web đầu tiên, so với 22% đã được nhìn thấy thông qua khám phá trước tiên.
14.2% URL được gửi qua ping
Xác suất xem URL thông qua Sơ đồ trang web trước khi nhìn thấy nó thông qua khám phá độc lập với việc Sơ đồ trang web đã được gửi bằng ping hay sử dụng robots.txt
Bài báo tiếp tục nói về việc tìm ra các cách để xác định thứ tự thu thập dữ liệu, thông qua Sơ đồ trang web hoặc Khám phá. Các khái niệm như Sơ đồ trang web và DiscoveryScore được đưa ra và phương pháp có thể.

Nghiên cứu này có vẻ giống như một bài đọc tuyệt vời cho hầu hết các SEO quan tâm đến việc hiểu cách Google Sitemaps hoạt động và cách nó có thể mang lại lợi ích cho trang web của bạn.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Chat Zalo

Chat Facebook

HOTLINE: 091.404.8256