Python selenium頁面加載慢超時的解決方案
開發(fā)環(huán)境:
win10-64 python2.7.16 chrome77
from selenium import webdriverdriver = webdriver.Chrome(executable_path=’chromedriver.exe’)driver.get(’http://全部加載完成超級慢的網(wǎng)站’)user = ’abc’pwd = ’123driver.find_element_by_id(’email’).send_keys(user)driver.find_element_by_id(’pass’).send_keys(pwd)
先看這樣一段代碼
當(dāng)執(zhí)行了get以后,除非網(wǎng)站全部加載完成,否則你只能乖乖等,什么都不能干,這是整個程序是阻塞的,get不完就別想進行下面操作
這個等待可能是5分鐘或者更久
其實5秒鐘的時候界面就已經(jīng)打開了,然后他還在加載些什么js,img,等待速度超慢的,但是網(wǎng)頁人工是可以操作
那么有沒有什么辦法呢,網(wǎng)上找了一通,給出了很多解決方案
首先是這貨(下面是我復(fù)制的):
from selenium import webdriverdriver=webdriver.Chrome()driver.set_page_load_timeout(5)driver.set_script_timeout(5)#這兩種設(shè)置都進行才有效
try: d.get(s)except: d.execute_script(’window.stop()’)#這句話好像沒什么軟用
可以在頁面停止加載后繼續(xù)操作了
driver.set_page_load_timeout(5)這玩意一設(shè)置,沒問題,5秒后網(wǎng)頁確實停止了,但是driver也死了,不管運行什么都是timeout,還說try一下,driver是死透了,只能重新來不知道是selenium更新了還是他自己沒測試還是chrome更新了,現(xiàn)在這么設(shè)置就是找死的
注意:使用set_page_load_timeout時候,當(dāng)頁面未加載出任何東西的時候(往往是html源碼未加載),因為超時而停止,會導(dǎo)致driver失效,后面的driver都不能操作,所以超時設(shè)置應(yīng)該至少保證頁面內(nèi)容加載出來一部分,設(shè)置超時不宜過短,如下圖在頁面此種狀態(tài)下停止加載后driver失效。
不錯,是有人也說了,不能設(shè)置太短,會失效,但是我可以說,你設(shè)置5分鐘照樣失效,只要超時一次,driver就完蛋,直接翻車
接下來是另一個方法
# coding = utf-8from selenium import webdriverfrom selenium.webdriver.support.wait import WebDriverWaitimport timedriver = webdriver.Chrome()class button(): def __call__(self, driver): if driver.find_element_by_id(’js_love_url’): return True else: return False driver.implicitly_wait(60)time_start = time.time()driver.get(’https://www.163.com/’)# driver.find_element_by_id(’js_love_url’).click()WebDriverWait(driver,2,0.5).until(button()) time_end = time.time()print(’access time is : ’, time_end - time_start)time.sleep(2)driver.quit()
用WebDriverWait進行操作,不過我測試下來,driver.get()不執(zhí)行完,下面的代碼根本就不會執(zhí)行,所以還是不行
找了各種方法,各種操作,都失敗了,總算今天找到了正確的方法
原理非常簡單:driver.get()這個操作,改成不阻塞的就行了,這樣打開網(wǎng)頁就操作完成了,不需要等他加載
下面我可以直接等待需要的元素出現(xiàn)即可進行操作
配置也是很簡單
from selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilities#get直接返回,不再等待界面加載完成desired_capabilities = DesiredCapabilities.CHROMEdesired_capabilities['pageLoadStrategy'] = 'none'driver = webdriver.Chrome(executable_path=’chromedriver.exe’)
配置一個參數(shù),就是頁面加載策略,系統(tǒng)默認是等待,就是等他加載完,直接設(shè)置成none,就是不等待,這樣就是get操作完后直接就是結(jié)束了
到此這篇關(guān)于Python selenium頁面加載慢超時的解決方案的文章就介紹到這了,更多相關(guān)Python selenium加載慢內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. webpack高級配置與優(yōu)化詳解2. ASP動態(tài)網(wǎng)頁制作技術(shù)經(jīng)驗分享3. PHP設(shè)計模式(七)組合模式Composite實例詳解【結(jié)構(gòu)型】4. 詳解JSP 內(nèi)置對象request常見用法5. H5頁面使用audio標簽播放音頻6. HTML <!DOCTYPE> 標簽7. Docker與iptables及實現(xiàn)bridge方式網(wǎng)絡(luò)隔離與通信操作8. python中scrapy處理項目數(shù)據(jù)的實例分析9. Spring MVC+ajax進行信息驗證的方法10. 將properties文件的配置設(shè)置為整個Web應(yīng)用的全局變量實現(xiàn)方法
