我要采集语料做数据处理,但是ip被封了怎么办?
作者:代理ip
发布时间:2020-11-26 15:18:44
阅读量:1184
在进行大量的数据采集时是需要使用代理ip的,但是使用不好的时候也会被网站的反爬策略限制,那我们该怎么做呢?
1、ip是爬虫工作的必需,使用免费代理ip可以处理一定的ip限制问题,但是免费的代理ip使用会浪费大量的时间,不具有稳定性
2、反爬一般是要求在时间内ip浏览频次开展的限定,在进行爬虫低的时候进行时间段的设置,防止封号,尽可能地多切换不同的ip进行使用
3、尽管大多数网址都是有反爬虫,但是有一些网址对这方面比较忽视,我们可以使用代理ip进行ip地址的隐藏,多更换代理ip,在反爬虫发现我们是爬虫的时候就及时的切换ip,可以稳定工作,同时还可以维护我们本地的ip的安全