使用Python爬取彈出窗口信息的實(shí)例
此文僅當(dāng)學(xué)習(xí)筆記用.
這個(gè)實(shí)例是在Python環(huán)境下如何爬取彈出窗口的內(nèi)容,有些時(shí)候我們要在頁面中通過點(diǎn)擊,然后在彈出窗口中才有我們要的信息,所以平常用的方法也許不行.
這里我用到的是Selenium這個(gè)工具, 不知道的朋友可以去搜索一下. 但是安裝也是很費(fèi)事的. 而且我用的瀏覽器是firefox,不用IE是因?yàn)楹孟裥掳娴腎E在Selenium下有問題,我也是百思不得其解, 網(wǎng)上也暫時(shí)沒找到好的辦法.
from selenium import webdriverfrom selenium.webdriver.common.keys import Keysimport os,time
browser=webdriver.Firefox(executable_path=’d:Anacondapkgsspyder-3.2.8-py36_0geckodriver.exe’) #括號(hào)中的也是非典型的安裝firefox驅(qū)動(dòng)的方法,常規(guī)的方法我一直試的不行,但這種方法包管行.browser.get(’http://XXX.XXX.com/fenxi/yazhi-734155’) #輸入你的目標(biāo)網(wǎng)址time.sleep(3) #打開網(wǎng)址后休息3秒鐘,可用可不用browser.find_element_by_xpath(’//*[@id='6']/td[4]’).click() #找到想要點(diǎn)擊的元素,然后進(jìn)行點(diǎn)擊動(dòng)作,讓窗口彈出來handle=browser.current_window_handle #獲得當(dāng)前窗口,也就是彈出的窗口句柄,什么是句柄我也解釋不清楚,反正它代表當(dāng)前窗口browser.switch_to_window(handle) #轉(zhuǎn)到當(dāng)前彈出窗口s=browser.find_element_by_xpath(’//*[@id='tipdiv']/div[2]/table/tbody’) #找到裝有你要信息的元素print(s.text) #打印文本內(nèi)容time.sleep(2) #休息2秒,讓瀏覽器喘口氣browser.find_element_by_xpath(’//*[@id='link106']’).click() #最后關(guān)掉彈出窗口. 這又是一個(gè)非典型方法,我是直接找到小窗口的叉叉來點(diǎn)擊關(guān)掉了,實(shí)際上Selinium有關(guān)閉當(dāng)前窗口的方法,也就是close()或者quit(),但問題是搞來搞去不行啊?我的理解是目前的窗口依然是那個(gè)彈出的窗口,但handle.close等其它方法都不行. 所以我干脆用這樣的方法,找到叉叉的元素,然后點(diǎn)擊.
最后找元素我還是喜歡用xpath,有個(gè)小竅門,那就是在瀏覽器的開發(fā)者工具那里面,找到需要元素的元代碼,然后右鍵選擇Copy Xpath就有了,相當(dāng)方便.
補(bǔ)充知識(shí):python自動(dòng)化測(cè)試中,點(diǎn)擊【查看】按鈕,彈窗出不來怎么辦?
一、在用python寫UI自動(dòng)化測(cè)試的時(shí)候,可能會(huì)遇到明明用.click()點(diǎn)擊了【查看】按鈕,但是彈窗彈不出來;
遇到這個(gè)問題的時(shí)候,不妨可以試試模擬鍵盤的操作,利用.send_keys(Keys.ENTER)便可以解決這個(gè)問題;
代碼:
driver.find_element_by_xpath(“//*[@id=’main’]/div/div[3]/div/div/div[2]/div/div[2]/div[2]/div/div[2]/table/tbody/tr/td[9]/div/button/span”).click()
修改為:
driver.find_element_by_xpath(“//*[@id=’main’]/div/div[3]/div/div/div[2]/div/div[2]/div[2]/div/div[2]/table/tbody/tr/td[9]/div/button/span”).send_keys(Keys.ENTER)
以上這篇使用Python爬取彈出窗口信息的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. JSP的Cookie在登錄中的使用2. asp(vbscript)中自定義函數(shù)的默認(rèn)參數(shù)實(shí)現(xiàn)代碼3. HTML5 Canvas繪制圖形從入門到精通4. 使用Spry輕松將XML數(shù)據(jù)顯示到HTML頁的方法5. 利用CSS3新特性創(chuàng)建透明邊框三角6. ASP基礎(chǔ)知識(shí)VBScript基本元素講解7. 詳解CSS偽元素的妙用單標(biāo)簽之美8. XHTML 1.0:標(biāo)記新的開端9. php網(wǎng)絡(luò)安全中命令執(zhí)行漏洞的產(chǎn)生及本質(zhì)探究10. XML入門的常見問題(四)
