python selenium 獲取接口數據的實現
python selenium 獲取接口數據。
selenium沒有直接提供查詢的函數,但是可以通過webdriver提供的API查詢,使用的函數是Network.getResponseBody
webdriver提供的API文檔:https://chromedevtools.github.io/devtools-protocol/tot/Network/
Network.getResponseBody文檔說明:
Network.getResponseBody的參數是requestid,requestid是webdriver每個請求自動生成的惟一ID,拿到requestid就能拿到請求返回的內容。
如何獲取requestid?創(chuàng)建webdriver對象時配置信息設置獲取performance,即可獲取每個請求的日志信息,然后通過對日志信息的檢索找到對應的requestid。
獲取日志信息的webdriver創(chuàng)建代碼(注意,必須傳入配置信息才能獲取日志信息):
from selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport time caps = { ’browserName’: ’chrome’, ’loggingPrefs’: { ’browser’: ’ALL’, ’driver’: ’ALL’, ’performance’: ’ALL’, }, ’goog:chromeOptions’: { ’perfLoggingPrefs’: { ’enableNetwork’: True, }, ’w3c’: False, },}driver = webdriver.Chrome(desired_capabilities=caps) driver.get(’https://partner.oceanengine.com/union/media/login/’)# 必須等待一定的時間,不然會報錯提示獲取不到日志信息,因為絮叨等所有請求結束才能獲取日志信息time.sleep(3) request_log = driver.get_log(’performance’)
打印request_log是一個數組,然后遍歷request_log檢索需要獲取的url對應的requestid,比如需要獲取https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json對應的requestid,并且獲取接口內容:
for i in range(len(request_log)): message = json.loads(request_log[i][’message’]) message = message[’message’][’params’] # .get() 方式獲取是了避免字段不存在時報錯 request = message.get(’request’) if(request is None): continue url = request.get(’url’) if(url == 'https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json'): # 得到requestId print(message[’requestId’]) # 通過requestId獲取接口內容 content = driver.execute_cdp_cmd(’Network.getResponseBody’, {’requestId’: message[’requestId’]}) print(content) break
完整代碼:
import jsonfrom selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport time caps = { ’browserName’: ’chrome’, ’loggingPrefs’: { ’browser’: ’ALL’, ’driver’: ’ALL’, ’performance’: ’ALL’, }, ’goog:chromeOptions’: { ’perfLoggingPrefs’: { ’enableNetwork’: True, }, ’w3c’: False, },}driver = webdriver.Chrome(desired_capabilities=caps) driver.get(’https://partner.oceanengine.com/union/media/login/’)# 必須等待一定的時間,不然會報錯提示獲取不到日志信息,因為絮叨等所有請求結束才能獲取日志信息time.sleep(3) request_log = driver.get_log(’performance’)print(request_log) for i in range(len(request_log)): message = json.loads(request_log[i][’message’]) message = message[’message’][’params’] # .get() 方式獲取是了避免字段不存在時報錯 request = message.get(’request’) if(request is None): continue url = request.get(’url’) if(url == 'https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json'): # 得到requestId print(message[’requestId’]) # 通過requestId獲取接口內容 content = driver.execute_cdp_cmd(’Network.getResponseBody’, {’requestId’: message[’requestId’]}) print(content) break
到此這篇關于python selenium 獲取接口數據的實現的文章就介紹到這了,更多相關python selenium 獲取接口數據內容請搜索好吧啦網以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網!
相關文章:
1. css代碼優(yōu)化的12個技巧2. .NET SkiaSharp 生成二維碼驗證碼及指定區(qū)域截取方法實現3. django創(chuàng)建css文件夾的具體方法4. ASP中if語句、select 、while循環(huán)的使用方法5. ASP中實現字符部位類似.NET里String對象的PadLeft和PadRight函數6. jsp網頁實現貪吃蛇小游戲7. ASP 信息提示函數并作返回或者轉向8. 存儲于xml中需要的HTML轉義代碼9. MyBatis JdbcType 與Oracle、MySql數據類型對應關系說明10. CentOS郵件服務器搭建系列—— POP / IMAP 服務器的構建( Dovecot )
