去年下半年提交了居转户申请,等待周期拉得挺长——据说最长要一年半——隔三差五登录系统查状态就成了例行公事。
一个重复劳动,写个脚本自动查更省心。用Chrome抓包分析网页表单交互,Python处理请求和验证码,跑通了就让它定时干活。

整个流程拆开来看不复杂:先GET首页拿到cookie,再GET验证码图片,然后POST用户名、密码和验证码完成登录。登录成功后还得再POST一次点掉“我接受”的确认按钮,最后GET进入“我的申报信息”页面拿状态数据。
登录加密有个坑
用户名不是直接传原文,而是调用md5.js里的函数,把字符串当作hex值再算一次md5。密码倒是明文传输,直接拼接就行。验证码识别不可能百发百中,一次失败就重试,加个retry机制,多跑两轮就能拿到正确结果。
页面解析才是最头疼的。那个table的格式实在太不规范了,目前只能用硬编码的方式去匹配定位。网站前端但凡有点调整,脚本就得跟着改。
还有一个容易被忽略的限制:系统只在8:00到22:00开放,夜间时段根本连不进去。定时任务必须卡在这个窗口内,否则跑一天都是白等。
最后把脚本挂上定时任务,每天自动跑一次,结果直接邮件推送过来。省掉了手动登录、重复输入、反复刷新的麻烦。
政策审核的节奏急不来,能少耗点精力在查询上,也算一种务实的选择。