網(wǎng)頁(yè)爬蟲 - Python requests.get 爬蟲 設(shè)置代理 IP地址未改變
問(wèn)題描述
工作需要爬取亞馬遜上面的信息,但是亞馬遜反爬蟲太厲害,同一個(gè)IP地址會(huì)被封。Python版本:3.6, IDE:Pycharm 2017.1在網(wǎng)上查了很多資料,requests庫(kù)的手冊(cè)也讀過(guò),但是都是同一個(gè)方法,代碼如下:
import requests’’’代理IP地址(高匿)’’’proxy = {’HTTPS’: ’117.85.105.170:808’}’’’head 信息’’’head = {’User-Agent’: ’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36’, ’Connection’: ’keep-alive’}’’’http://icanhazip.com會(huì)返回當(dāng)前的IP地址’’’p = requests.get(’http://icanhazip.com’, headers=head, proxies=proxy)print(p.text)
根據(jù)我看過(guò)的許多教程的理論,如果代理設(shè)置成功,最后顯示的IP應(yīng)該是代理的IP地址,但是最終還是我真實(shí)的IP地址,這樣一來(lái)不就等于沒(méi)有設(shè)置代理么?
問(wèn)題解答
回答1:proxies在你訪問(wèn)http時(shí)用http的設(shè)置,訪問(wèn)https時(shí)用https的設(shè)置所以你的proxy需要同時(shí)包含http及https的配置,這樣才能生效
proxy = { ’http’: ’http://117.85.105.170:808’, ’https’: ’https://117.85.105.170:808’}
相關(guān)文章:
1. html5 - angularjs中外部模版加載無(wú)法使用2. 在MySQL中新增字段時(shí),報(bào)錯(cuò)??3. 老哥們求助啊4. java - 安卓電視盒子取得了root權(quán)限但是不能安裝第三方應(yīng)用,請(qǐng)問(wèn)該怎么辦?5. javascript - js 寫一個(gè)正則 提取文本中的數(shù)據(jù)6. npm鏡像站全新上線7. javascript - vue-router怎么不能實(shí)現(xiàn)跳轉(zhuǎn)呢8. css3 - 請(qǐng)問(wèn)一下在移動(dòng)端CSS布局布局中通常需要用到哪些元素,屬性?9. python - 模擬滑動(dòng)驗(yàn)證碼,有源碼,求解10. 我的Apache卡在這里不動(dòng)了怎么辦?
