收到一个任务,要我爬一下指定关键字单位的大唐**的招标信息,每天挂着程序,如果有新的就发邮件通知。网址是大唐集团电子商务平台 (cdt-ec.com),但是要通过大唐电子商务平台 (cdt-ec.com)点击更多进去才会有信息。
- 使用前要手动替换程序中的邮箱,已删除
- py文件名就是关键字,这样可以让发送过去就是一个exe文件
看了一下,是有风控的,难点在于找到cookie中的acw_sc__v2
字段,通过网上检索可以知道,这个字段可以通过js逆向进行解决,我主要参考了Nike登录的acw_sc__v2参数逆向详细思路分析(非常简单,建议入手)含AST解混淆代码_acw sc v2-CSDN博客。遇到解析失败就重启请求cookie,然后保存下来,因为请求这个过多会封ip,其他也没有啥难的地方了。
-
python
调用js
-
爬虫
-
自动发邮件
-
定时任务