爬取
Robots.txt 同網站地圖審查工具
貼上一個網域就可以檢查 robots.txt 並爬取連結嘅網站地圖(root/blog/blacklist/forum 各種變體)。會顯示被封鎖嘅 URL、孤立嘅網站地圖同格式錯誤嘅項目。只喺客戶端運行——可能受 CORS 限制。
審查
我哋會檢查嘅內容
- robots.txt 嘅可用性同 Disallow/Allow 規則。
- 網站地圖發現(robots.txt + 常見路徑,例如 /sitemap.xml、/blog/sitemap.xml)。
- 每個網站地圖嘅 URL 數量同格式錯誤嘅項目。
- 標記被封鎖但係又出現喺網站地圖嘅 URL。