文章詳情頁

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。

瀏覽：58日期：2022-08-04 16:42:25

問題描述

因為在爬取的網站需要賬號登陸，不方便公開。因此我只能這樣大致性的咨詢，實在抱歉。

我需要爬一個目標網站的數據，發現在點擊下一頁時候，網址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺，捕獲到點擊下一頁時候，向指定地址發送了一條帶多個參數的get指令。

原先采用selenium+phantomjs的方式暴力無腦方式爬取，一個頁面大概5S左右就能獲取，實際用瀏覽器打開也是這個速度。為了爬取大量的數據，準備改用多線程+直接requests.get目標地址的方式來采集，但是發現采集速度非常的慢，從5S降到的20s左右。

請教下，出現這樣現象的原因可能是什么？我該如何解決？請指教

問題解答

回答1：

抱歉浪費了各位的時間- -是我開始測試的時候，周圍有人再下迅雷，網絡炸了。抱歉抱歉

Python 編程

上一條：python - 使用pandas的resample報錯下一條：python - 相當于分組數據的合并，兩個列表生成dataframe，但長度不同

相關文章：

1. javascript - 微信網頁開發從菜單進入頁面后，按返回鍵沒有關閉瀏覽器而是刷新當前頁面，求解決？2. python - TypeError: tryMsgcode() takes exactly 2 arguments (0 given)3. 求救一下，用新版的phpstudy，數據庫過段時間會消失是什么情況？4. mysql - C#連接數據庫時一直這一句出問題int i = cmd.ExecuteNonQuery();5. mysql - ubuntu開啟3306端口失敗,有什么辦法可以解決？6. android - 安卓做前端，PHP做后臺服務器有什么需要注意的？7. mysql replace 死鎖8. 環境搭建 - anaconda 創建python2.7環境中打開編譯器確是3.6版本9. extra沒有加載出來10. python - 數據與循環次數對應不上

排行榜

					
					html5 - H5頁面喚起APP導航
html5 - 表單無法屏蔽自動填充 autocomplete=off
java - 讀寫鎖中 寫鎖的降級問題
extra沒有加載出來
求救一下，用新版的phpstudy，數據庫過段時間會消失是什么情況？
css - ionic中的柵格布局如何讓文字內容多少不同的每一列中的內容都能垂直居中？
node.js - mongo TTL 數據過期不刪除
android-studio - 一直無法下載android studio的 安卓模擬器求助
javascript - 微信網頁開發從菜單進入頁面后，按返回鍵沒有關閉瀏覽器而是刷新當前頁面，求解決？
apache - 80端口被system占用，怎么辦？
mysql replace 死鎖
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。