Một trong những công việc cần làm đầu tiên trước khi bắt tay vào Seo Onpage là thực hiện việc đánh giá tình trạng website hiện tại, tạo một Seo Onpage checklist những vẫn đề cần khắc phục trong chiến lược seo onpage tổng thể 2018. Thường để có thể thực hiện việc analyze seo onpage 1 trang web ( 1 trang web trong cả website ) đối với một Seoer kinh nghiệm nếu không có các công cụ phân tích cũng mất ngót nghét 5 phút, cà website chắc ít nhất cũng phải mất cả tuần lao động cực khổ. Phần mềm “Screaming Frog SEO Spider” là một trong 2 software tối ưa hóa và tự động và là cứu cánh cho vấn đề nan giải trên.

Seo OnPage

Seo OnPage

Giới thiệu về Screaming Frog SEO Spider 

Screaming Frog SEO Spider là phần mềm auditor seo số một hiện nay theo đánh giá của mình ( ừ mình biết có 2 cái thui, Screaming Frog SEO  không mạnh nhất thì Seo Power Suite là số 1). SEO Spider mạnh mẽ, linh hoạt, nhẹ nhàng, nó có thể thu thập dữ liệu cả các trang web nhỏ và rất lớn một cách hiệu quả, cho phép bạn phân tích các kết quả đánh giá các tiêu chí SEO trong thời gian thực. Nó tập hợp các dữ liệu quan trọng tại chỗ để cho phép SEOER có thể đưa ra những quyết định khi tối ưu hóa Onpage website một số tiêu chí được SEO Spider cung cấp khi thực hiện đánh giá:

  • Tìm liên kết bị hỏng:Thu thập thông tin trang web ngay lập tức và tìm liên kết hỏng (404s) và lỗi máy chủ. Xuất danh sách hàng loạt các lỗi và URL bị gãy này.
  • Chuyển hướng kiểm tra: Tìm ra các liên kết chuyển hướng (301) giúp bạn dễ dàng quản lý cũng như tạo ra danh sách các linh 301 giúp theo dõi trong quá trình chuyển site hoặc sử dụng kỹ thuật 301 trong pbn.
  • Phân tích Tiêu đề trang và Dữ liệu Meta:Phân tích tiêu đề trang (title) và mô tả (meta description) trong quá trình thu thập thông tin và xác định những trang quá dài, ngắn, thiếu hoặc trùng lặp trên trang web của bạn.
  • Khám phá nội dung trùng lặp: Khám phá URL trùng lặp chính xác với kiểm tra thuật toán md5, các phần tử được nhân đôi một phần như tiêu đề trang, mô tả hoặc đề mục và tìm các trang nội dung thấp.
  • Trích xuất dữ liệu bằng XPath: Cung cấp tính năng cào dữ liệu bằng cú pháp XML Path Language. SEO Spider thu thập bất kỳ dữ liệu nào từ HTML của một trang web sử dụng Đường dẫn CSS, XPath hoặc regex. Điều này có thể bao gồm thẻ meta xã hội, tiêu đề bổ sung, giá cả, SKUs hoặc nhiều hơn nữa!
  • Đánh giá Robot và Chỉ thị: check tập tin robots trên từng link và tình trang index của link đó. Xem URL bị chặn bởi robots.txt, meta_robots hoặc các chỉ thị X-Robots-Tag chẳng hạn như ‘noindex’ hoặc ‘nofollow’, cũng như các nguyên tắc kinh điển và rel = “next” và rel = “prev”.
  • Tạo Sơ đồ trang web XML: tạo sơ đồ sitemap cho nội dung, hình ảnh … toàn bộ site.
  • Tích hợp với Google Analytics: Kết nối với API của Google Analytics và lấy dữ liệu người dùng, chẳng hạn như phiên hoặc tỷ lệ thoát và chuyển đổi, mục tiêu, giao dịch và doanh thu cho các trang đích chống lại việc thu thập dữ liệu.

Hiện tại bạn có thể tải phần mềm này tại trang web https://www.screamingfrog.co.uk/seo-spider/ phiên bản miễn phí cho phép bạn sử dụng toàn tính năng phân tích 500 link/1 website với 1 số tính năng hạn chế. Hoặc có thể mua giấy phép sử dụng 150usd/ năm với toàn bộ tính năng.

Điểm đặc biệt của SEO Spider

Điểm đặc biệt và đặc trưng nhất của tool seo này là nó chạy rất nhẹ không gây ảnh hưởng đến hoạt động của máy đang chạy cũng như hosting của website cần phân tích. Chỉ với 1 click chuột SEO Spider  đã có thể cung cấp các số liệu quan trong trong Seo Audi Checklist:

  1. Lỗi – Lỗi của khách hàng chẳng hạn như liên kết hỏng và lỗi máy chủ (Không có phản hồi, 4XX, 5XX).
  2. Chuyển hướng – Chuyển hướng tạm thời, tạm thời (phản hồi 3XX) & chuyển hướng JS.
  3. URL bị chặn – Xem & URL kiểm tra không được phép bởi giao thức robots.txt.
  4. Tài nguyên bị chặn – Xem và kiểm tra tài nguyên bị chặn trong chế độ hiển thị.
  5. Liên kết ngoài – Tất cả các liên kết bên ngoài và mã trạng thái của chúng.
  6. Giao thức – Cho dù URL được an toàn (HTTPS) hoặc không an toàn (HTTP).
  7. Các vấn đề về URI – Các ký tự không phải ASCII, dấu gạch dưới, chữ hoa, tham số hoặc URL dài.
  8. Trang trùng lặp – Giá trị Hash / MD5checksums kiểm tra thuật toán cho các trang trùng lặp chính xác.
  9. Tiêu đề trang – Thiếu, trùng lặp, trên 65 ký tự, cắt ngắn, chiều rộng pixel, giống như h1 hoặc nhiều.
  10. Mô tả Meta – Thiếu, nhân bản, trên 156 ký tự, ngắn, pixel cắt rộng hoặc nhiều.
  11. Từ khoá Meta – chủ yếu để tham khảo, vì chúng không được sử dụng bởi Google, Bing hoặc Yahoo.
  12. Kích thước tệp – Kích thước URL và hình ảnh.
  13. Thời gian đáp ứng.
  14. Tiêu đề được sửa đổi lần cuối.
  15. Độ sâu của trang.
  16. Số từ.
  17. H1 – Thiếu, trùng lặp, trên 70 ký tự, nhiều ký tự.
  18. H2 – Thiếu, trùng lặp, trên 70 ký tự, nhiều ký tự.
  19. Meta Robots – Index, noindex, theo dõi, nofollow, noarchive, nosnippet, noodp, noydir, v.v.
  20. Làm mới Meta – Bao gồm cả trang đích và thời gian trễ.
  21. Phần tử liên kết theo chuẩn Canon và các tiêu đề chuẩn của HTTP.
  22. X-Robots-Tag. rel = “next” và rel = “prev”.
  23. Theo dõi & Nofollow – Tại cấp độ trang và cấp liên kết (đúng / sai).
  24. Thuộc tính hreflang – Kiểm tra thiếu các liên kết xác nhận, mã ngôn ngữ không phù hợp và không chính xác, hreflang không chuẩn tắc và hơn thế nữa.
  25. Rendering – Thu thập các khuôn mẫu JavaScript như AngularJS và React, bằng cách crawl HTML rendered sau khi JavaScript đã thực thi.
  26. AJAX – Chọn để tuân theo chương trình thu thập thông tin AJAX hiện đã không được sử dụng của Google.
  27. Inlinks – Tất cả các trang liên kết đến một URI.
  28. Outlinks – Tất cả các trang mà URI liên kết đến.
  29. Văn bản Anchor – Tất cả văn bản liên kết. Văn bản thay thế từ hình ảnh có liên kết.
  30. Hình ảnh – Tất cả các URI có liên kết hình ảnh và tất cả hình ảnh từ một trang nhất định. Hình ảnh trên 100kb, thiếu văn bản alt, alt văn bản trên 100 ký tự.
  31. Trình chuyển đổi User-Agent – Thu thập thông tin như Googlebot, Bingbot, Yahoo! Slurp, các đại lý người dùng di động hoặc UA tùy chỉnh của riêng bạn.
  32. Tiêu đề HTTP tùy chỉnh – Cung cấp bất kỳ giá trị tiêu đề nào trong yêu cầu, từ Accept-Language sang cookie.
  33. Chuỗi chuyển hướng – Khám phá chuỗi và vòng lặp chuyển hướng.
  34. Tìm kiếm mã nguồn tùy chỉnh – Tìm bất cứ điều gì bạn muốn trong mã nguồn của trang web! Cho dù đó là mã Google Analytics, văn bản cụ thể, hoặc mã vv
  35. Trích xuất tùy chỉnh – Cạo bất kỳ dữ liệu nào từ HTML của một URL bằng cách sử dụng XPath, CSS Path selectors hoặc regex.
  36. Tích hợp Google Analytics – Kết nối với Google Analytics API và kéo dữ liệu người dùng và dữ liệu chuyển đổi trực tiếp trong quá trình thu thập dữ liệu.
  37. Tích hợp Bảng điều khiển tìm kiếm của Google – Kết nối với Google Analytics Tìm kiếm API và thu thập dữ liệu về số lần hiển thị, nhấp chuột và vị trí trung bình so với URL.
  38. Chỉ số Liên kết Bên ngoài – Kéo các chỉ số liên kết bên ngoài từ Majestic, Ahrefs và Moz API vào thu thập dữ liệu để thực hiện kiểm tra nội dung hoặc liên kết tiểu sử.
  39. Trình tạo Sơ đồ trang XML – Tạo một sơ đồ trang XML và một sơ đồ trang hình ảnh bằng cách sử dụng nhện SEO.
  40. Robots.txt tùy chỉnh – Tải xuống, chỉnh sửa và kiểm tra robots.txt của trang web bằng robots.txt tùy chỉnh mới.
  41. Hiển thị ảnh chụp màn hình – Tìm nạp, xem và phân tích các trang được hiển thị được thu thập dữ liệu.
  42. Lưu trữ & Xem HTML & HTML được Hiển thị – Cần thiết để phân tích DOM.

About the author

Kevin Dang

Hey there! My name is Kevin Dang, I am website, software, mobile app develop, web admin system. Expert living in Hồ Chí Minh (Việt Nam). I am very interested in digital marketing with: SEO, Facebook, Google Ads ... This blog is where I will share the experiences, techniques and knowledge I have learned.