教你如何使用Python selenium
Selenium是一個用于測試網(wǎng)站的自動化測試工具,支持各種瀏覽器包括Chrome、Firefox、Safar等瀏覽器(需要下載驅(qū)動),之前是用來做測試網(wǎng)站的,后來發(fā)現(xiàn)也可以用來爬取數(shù)據(jù)(估計開發(fā)者都沒想到他開發(fā)的selenium被別人廣泛適用于爬蟲領(lǐng)域——笑)。
二、selenium的下載1.我這里是使用的Chrom瀏覽器 !注意不要忽視這個地方
2.python中selenium庫的下載(pycharm系列)
由于我用的pycharm的虛擬環(huán)境,所以我只需要在pycharm的終端下載第三方庫就行了,簡單,方便,pycharm真是個好用的東西——O(∩_∩)O~
打開pycharm 打開pycharm的終端 輸入pip install selenium -i https://pypi.doubanio.com/simple (這是使用國內(nèi)鏡像網(wǎng)站下載selenium,下載速度較快) 等待片刻,結(jié)束 pip list ——查看自己下載的第三方庫,檢查是否成功3.python中selenium庫的下載(cmd系列)
win+R輸入cmd 打開cmd 輸入pip install selenium -i https://pypi.doubanio.com/simple (這是使用國內(nèi)鏡像網(wǎng)站下載selenium,下載速度較快) 等待片刻,結(jié)束 pip list ——查看自己下載的第三方庫,檢查是否成功4.selenium驅(qū)動的下載(官網(wǎng)都是英文,看不懂)
打開你的Chrom瀏覽器查看你是什么版本的(幫助->about chrom),查看版本號 點(diǎn)擊右邊這個藍(lán)色的小可愛,沒錯我是小可愛 ,找到與你的chrom瀏覽器版本相匹配的(沒有匹配的,相近的也可以,win都是32位的),下載 沒了,沒錯,你沒看錯,真的沒了5.selenium的環(huán)境配置,沒錯又是這個煩人的環(huán)境配置 真想給他一腳
想必,這個時候已經(jīng)下載好了吧 下載好以后,很簡單,解壓,然后——看3 最好(但是不是必要)創(chuàng)建一個文件夾放你解壓出來的geckodriver,然后復(fù)制你這個文件當(dāng)前的路徑(ctrl + c) 打開環(huán)境變量(此電腦->右鍵->屬性->高級系統(tǒng)配置->環(huán)境變量),在系統(tǒng)變量找到path,新建,ctrl + v 完事6.打開你的pycharm,新建一個py文件去寫出以下代碼
from selenium import webdriverimport time# 導(dǎo)入時間包和selenium包huohu = webdriver.Chrome()# 創(chuàng)建一個chome的selenium對象huohu.get('http://www.elong.com/')# 打開網(wǎng)站huohu.quit()# 退出
寫好后,運(yùn)行好,報錯了,對,報錯了,可能你們不會報錯,反正我報錯了
報錯信息是:selenium.common.exceptions.WebDriverException: Message: ‘chromedriver’ executable needs to be in PATH.
意思是,你需要吧chromdriver放到路徑,我照著做了,可是呢,還是這個報錯!
這是什么情況??明明我是按照教程來的啊
著急的我去群里請求大佬,大佬們直接無視我——::>_<::
然后又去找它——>好吧啦網(wǎng),左翻翻,右找找,終于找到了解決方案:
將chromdriver放在python解釋器的位置,我照著做了之后,就成功了。。。
好家伙,上面教程不是說隨便放的嗎?…
哎,人與人之間最基本的信任都沒有了
三、selenium的基本使用from selenium import webdriver# 導(dǎo)包driver = webdriver.Chrome()# 創(chuàng)建一個瀏覽器對象driver.get('https://m.elong.com/')# 訪問藝龍網(wǎng)driver.quit()# 關(guān)閉瀏覽器,也可以不關(guān)閉,但是最好關(guān)閉,養(yǎng)成一個打開后不忘記關(guān)閉的好習(xí)慣
然后我們就會發(fā)現(xiàn),瀏覽器界面一閃而過(為什么?因為頁面渲染完成后,就直接退出了),那么如何才能讓我們能夠觀察到呢?有請我們的time模塊,讓它睡會兒,就能觀察到了這樣改
from selenium import webdriverimport time# 導(dǎo)包driver = webdriver.Chrome()driver.get('https://m.elong.com/')time.sleep(5)# 頁面渲染完成后讓它睡5s,這樣就能觀察到了driver.quit()
OK,看到,代碼替我們打開了這個網(wǎng)址,并且展示了5s后關(guān)閉了
四、結(jié)語好了,相信大家已經(jīng)學(xué)會如何使用筷子了,那么讓我們?nèi)佑梦覀兊目曜尤グ堰@個網(wǎng)站抓下來吧——笑,玩?zhèn)€老梗今天的筆記就到這里了(主要是不想寫了,一天當(dāng)然不可能只學(xué)會點(diǎn)這玩意),拜拜
到此這篇關(guān)于教你如何使用Python selenium的文章就介紹到這了,更多相關(guān)Python selenium內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. PHP防XSS 防SQL注入的代碼2. idea設(shè)置自動導(dǎo)入依賴的方法步驟3. 淺談SpringMVC jsp前臺獲取參數(shù)的方式 EL表達(dá)式4. python pymysql鏈接數(shù)據(jù)庫查詢結(jié)果轉(zhuǎn)為Dataframe實(shí)例5. ASP刪除img標(biāo)簽的style屬性只保留src的正則函數(shù)6. IDEA版最新MyBatis程序配置教程詳解7. 使用Python和百度語音識別生成視頻字幕的實(shí)現(xiàn)8. 教你如何寫出可維護(hù)的JS代碼9. idea不能自動補(bǔ)全yml配置文件的原因分析10. xml中的空格之完全解說
