文章詳情頁

python - 如何爬取跳轉網站的數據

瀏覽：88日期：2022-06-30 14:37:44

問題描述

目前在學習一些爬蟲的知識，對于一些復雜的網站使用selenium進行爬取。碰到一個問題，我需要爬取的工單網站（不知道密碼）需要先通過登錄一個鑒權系統，然后鑒權系統頁面點擊其中的工單系統連接，就會自動免登錄跳轉到工單系統網站，這種系統的數據我該如何使用爬蟲進行抓取？以下是鑒權系統selenium拿到關于工單系統的html

問題解答

回答1：

用firefox的擴展selenium ide錄制一遍操作。然后導出為python文件。改改運行就可以了。

建議你去讀讀蟲師寫的書。

回答2：

例如使用requests庫作為爬蟲的話，先創建session()，A登錄，B是跳轉的頁面即可。

T=requests.session()A=T.post(url=url,data=data)B=T.get(url=url)

創建的T就代表存儲的cookie，會一直保留

Python 編程

上一條：python如何獲得一個url地址對應的跳轉后的最終網址下一條：python - Django如何在View中發送異步HTTP請求？

相關文章：

1. docker容器呢SSH為什么連不通呢？2. docker api 開發的端口怎么獲取？3. docker網絡端口映射，沒有方便點的操作方法么？4. 關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””5. python - from ..xxxx import xxxx到底是什么意思呢?6. nignx - docker內nginx 80端口被占用7. debian - docker依賴的aufs-tools源碼哪里可以找到啊？8. ddos - apache日志很多其它網址，什么情況？9. 請教各位大佬，瀏覽器點提交實例為什么沒有反應10. angular.js - ng-grid 和tabset一起用時，grid width默認特別小

排行榜

					
					nignx - docker內nginx 80端口被占用
docker容器呢SSH為什么連不通呢？
關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
docker網絡端口映射，沒有方便點的操作方法么？
docker api 開發的端口怎么獲取？
python - from ..xxxx import xxxx到底是什么意思呢?
dockerfile - 為什么docker容器啟動不了？
angular.js - angularjs的自定義過濾器如何給文字加顏色？
dockerfile - 我用docker build的時候出現下邊問題  麻煩幫我看一下
macos - mac下docker如何設置代理
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - 如何爬取跳轉網站的數據