上海交通違章查詢網(wǎng)站: http://www.shjtaq.com/Server1/dzjc_new.asp
驗證碼圖片獲取地址: http://www.shjtaq.com/Server1/validatecode.asp?m=2304.046
服務(wù)器通過頁面請求的session-id來區(qū)分之后提交的驗證碼。 第一次請求查詢頁面時,服務(wù)器將訪問session(cookie)傳到客戶端,之后的查詢和驗證碼獲取時客戶端攜帶之前的cookie傳送到服務(wù)器,服務(wù)器端保存著當(dāng)前 session-id與驗證碼 的對應(yīng)關(guān)系。
查詢返回記錄可通過 xpath或者 beautifulsoup進(jìn)行解析
程序使用python完成,也是個簡單的小爬蟲,scrapy 之類的沒必要使用了,gevent完成異步通信。
交通網(wǎng)的驗證碼生成還是比較簡單,做自動識別可找?guī)讉€簡單的圖形識別程序即可。
如若不行,則人工輸入嘍