文章詳情頁

Python爬蟲requests庫多種用法實例

瀏覽：19日期：2022-07-24 10:21:09

requests安裝和使用

下載安裝：pip install requests

#requests模塊import requests#發送請求 content:以二進制的形式獲取網頁的內容response=requests.get('http://www.baidu.com').content.decode()#response=requests.request('get','http://www.baidu.com').content.decode()print(response)

添加請求頭和參數

import requestsurl='http://www.baidu.com/s?'headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}wd={'wd':'中國'}response=requests.get(url,params=wd,headers=headers)# 返回一個字符串形式的數據data=response.text# 返回一個二進制形式的數據data2=response.contentprint(data2.decode())

處理Post請求

處理get請求：get()方法

處理post請求：post()方法

import requestsimport re#構造請求頭信息header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}#谷歌瀏覽器#http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule 網頁上的urlurl='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'key='靚仔'#發送到web服務器的表單數據formdata={'i':key,'from':'AUTO','to':'AUTO','smartresult':'dict','client':'fanyideskweb','salt':'15880563488791','sign':'cc2c40d740538fc5edc0380891faef27','ts':'1588053583943','bv':'f9c86b1fdf2f53c1fefaef343285247b','doctype':'json','version':'2.1','keyfrom':'fanyi.web','action':'FY_BY_REALTlME'}response=requests.post(url,headers=header,data=formdata)# 獲取到的是json數據# 對應的是字典# print(response.json())pat=r’'tgt':'(.*?)'}]]’ #字符串中有'',再用’’括起來表示字符串# 獲取到的是字符串result=re.findall(pat,response.text)print(result[0])

代理IP

import requests#設置ip地址#proxy={'http':'http://代理ip地址:端口號'}#可以設置多個proxy={'http':'http://222.82.130.23:8060','http':'http://101.248.64.68:80',}response=requests.get('http://www.baidu.com',proxies=proxy)print(response.content.decode())

獲取響應的cookie

cookie：用戶信息

import requestsresponse=requests.get('http://www.baidu.com')#1.獲取返回的cooketjar對象cookiejar=response.cookies#2.將cookiejar轉換成字典cookiedict=requests.utils.dict_from_cookiejar(cookiejar)print(cookiedict)

session實現登陸

相比直接使用cookie，創建session可以得到新的cookie信息，不會出現cookie失效的情況

#使用session實現登陸import requests#構造請求頭信息header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}#谷歌瀏覽器#創建session對象ses=requests.session()#構造登陸需要的參數data={'email':'325*****@qq.com','password':'123321a'}#通過傳遞用戶名密碼得到cookie信息ses.post('http://www.renren.com/PLogin.do',data=data,headers=header)#請求需要的頁面,每次請求會帶入cookie信息response=ses.get('http://www.renren.com/880151247/profile')print(response.text)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：Python selenium 加載并保存QQ群成員,去除其群主、管理員信息的示例代碼下一條：python中有函數重載嗎

相關文章：

1. 基于javascript處理二進制圖片流過程詳解2. 解決android studio引用遠程倉庫下載慢(JCenter下載慢)3. Gitlab CI-CD自動化部署SpringBoot項目的方法步驟4. ajax請求添加自定義header參數代碼5. ASP基礎知識VBScript基本元素講解6. 使用Python和百度語音識別生成視頻字幕的實現7. Kotlin + Flow 實現Android 應用初始化任務啟動庫8. idea刪除項目的操作方法9. 教你如何寫出可維護的JS代碼10. 使用python 計算百分位數實現數據分箱代碼

排行榜

					
					基于javascript處理二進制圖片流過程詳解
ASP基礎知識VBScript基本元素講解
ajax請求添加自定義header參數代碼
解決android studio引用遠程倉庫下載慢(JCenter下載慢)
Gitlab CI-CD自動化部署SpringBoot項目的方法步驟
教你如何寫出可維護的JS代碼
使用Python和百度語音識別生成視頻字幕的實現
使用python 計算百分位數實現數據分箱代碼
Kotlin + Flow 實現Android 應用初始化任務啟動庫
idea刪除項目的操作方法
SpringBoot參數校驗與國際化使用教程