文章詳情頁
java - QQ空間爬蟲總是被封號
瀏覽:92日期:2022-09-24 17:58:56
問題描述
抓取QQ空間說說但是 總是被封號 可以給提出一些解決方案嗎?如何既可以快速 又可以不封號!謝謝啦!
代碼在github上地址https://github.com/20100507/Q...
問題解答
回答1:反爬蟲策略:
1、識別請求頭,判斷是否是爬蟲2、記錄請求頻率、路徑和訪問ip,判斷是否是爬蟲3、請求參數(shù)中進(jìn)行加密或復(fù)雜加密,增加爬蟲開發(fā)的難度(如淘寶的ua算法)4、復(fù)雜驗證碼
應(yīng)對反爬蟲策略:
1、在爬取過程中,適當(dāng)切換代理ip2、適當(dāng)降低請求頻率3、請求頭模擬成瀏覽器的請求,也就是用戶正常訪問的請求
你的問題,主要可以通過定時切換ip,或一旦被封再切換ip,來解決,可以考慮去“站大爺”等代理ip網(wǎng)站付費獲取,或者去多用幾個電信賬號,用ASDL撥號來切換ip。
標(biāo)簽:
qq
上一條:有用ruby抓取新浪微博內(nèi)容的源代碼可共享嗎?下一條:javascript - 為什么公司很少用node做后臺,對比java,php,python傳統(tǒng)后臺, node的優(yōu)勢在哪里,適合做什么
相關(guān)文章:
1. html5 - angularjs中外部模版加載無法使用2. 在MySQL中新增字段時,報錯??3. 老哥們求助啊4. java - 安卓電視盒子取得了root權(quán)限但是不能安裝第三方應(yīng)用,請問該怎么辦?5. javascript - js 寫一個正則 提取文本中的數(shù)據(jù)6. npm鏡像站全新上線7. javascript - vue-router怎么不能實現(xiàn)跳轉(zhuǎn)呢8. css3 - 請問一下在移動端CSS布局布局中通常需要用到哪些元素,屬性?9. python - 模擬滑動驗證碼,有源碼,求解10. 我的Apache卡在這里不動了怎么辦?
排行榜

熱門標(biāo)簽