年终爬虫项目-爬取列表
2022就要结束了!而WD的健康状态越来越差了……
因此,我决定创建年终爬虫项目,带给给大家……一点留恋?主要是我太闲了
有哪些网站需要在2022年终备份?请到奈版留言。
截至日期:2022/12/31
爬取名单:http://helloos.wikidot.com/crawler
要求:网站有system:list-all-pages页面
如果没有,把这串代码放进去:[[module Pages preview="true"]]
但是首先,你必须是该网站工作人员,否则我们无法得到爬虫授权。
请由网站站务联系我们。
网站网址 | 联系人员 | 爬取状态 | 爬取时间 | 爬取人员 | 页面数量 |
---|---|---|---|---|---|
http://lin-xingyu-s-home.wikidot.com/ | 已爬取 | 2022/12/27 | 53 | ||
http://paraarc.wikidot.com/ | 已爬取 | 2022/12/27 | 201 | ||
http://frontherooms.wikidot.com/ | 已爬取 | 2022/12/27 | 177 | ||
http://lm-wiki.wikidot.com/ | 已爬取 | 2022/12/27 | 53 | ||
http://scp-wiki-ys.wikidot.com/ | 已爬取 | 2022/12/27 | 91 | ||
http://deep-forest-club.wikidot.com/ | 已爬取 | 2022/12/28 | 74 | ||
https://ci-cn-wiki.wikidot.com/ | 【QQ】晴海harumi | 已爬取 | 2022/12/28 | 325 | |
http://go-rookie.wikidot.com/ | 已爬取 | 2022/12/28 | 58 | ||
http://minecraft-windows11.wikidot.com/ | 已爬取 | 2022/12/28 | 37 | ||
http://scp-qb.wikidot.com/ | 已爬取 | 2022/12/29 | 115 | ||
https://dackrooms-wiki-cn.wikidot.com | 已爬取 | 2022/12/29 | 53 | ||
https://yu22c.wikidot.com/ | 已爬取 | 2022/12/30 | 56 |
|| 站址 || [[*user 用户]] || 待爬取 || 2022/12/29 || [[*user 用户]] || - ||
状态列表:
- 待爬取(包含正在爬取)
- 已爬取
安全声明:
http://netboard.wikidot.com/blog:1717
edge下载在Wikidot私信的文件可能报这个错。
根据报错信息,我们建议到这里下载:http://helloosdisk.wikidot.com/file:crawler
后面私信时会改为这个链接。