python 爬取带验证码需要登陆后的网站

2025-03-21 08:59:28
推荐回答(3个)
回答1:

这个有点繁琐,告诉你,你也可能搞不定
首先请求网页,然后用你的未登录cookies去二次请求验证码,用byte类型保存在内存中,用pillow模块展示出来,你在手动输入,主程序这边用input阻塞,等你输入完,主程序向登录接口提交账号密码和验证码,然后后面就正常爬取,这是非selenium的模拟登录,这边纠正一点,凡是登录,不管你用什么模块,都属于模拟登录,并非selenium登录方式才叫模拟登录,

回答2:

用selenuim库咯,调用浏览器实现数据采集的

回答3:

使用cookie,自己百度