尝试过python+selenium+phantomjs抓取,无法绕过
python+selenium+chromedriver抓取,也无法绕过,貌似cloudflare对chromedriver做了指纹识别
真正可行的有以下方法
1.一般cloudflare出现5秒盾,都是站长设置了某个国家的ip才会限制
所以,可以用代理ip来解决,这个方法测试过是可行的
2.写脚本,直接操作真实浏览器,去访问,出现5秒盾,就等待5秒,等待跳转后,就能成功拿到数据
这个方法,也亲测过,是可行的,这个方法,相对第一种方法来说,效率更慢,但成本更低
3.市面上,有一些api,可以直接绕过,如x云api
这个方法,实现起来比较简单,也比较稳定,但是价格非常昂贵,280-1400rmb+一个月的费用
