亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python + selenium + chromedriver 如何實現無界面爬取

瀏覽:102日期:2022-07-14 16:59:35

問題描述

在使用selenium爬取12306的過程中,發現使用phantomjs無法爬取,使用chromedriver就可以,應該是phantomjs被網站檢測出來后封禁了,使用chromedriver又會顯示界面,爬取效率低。現在有兩點疑問,google了好久都沒找到有效的解決方法1.如何偽裝phantomjs,盡最大可能的偽裝2.如何設置chromedriver,使其不顯示界面,或者還有什么其他方法提高爬取效率

感謝!!!

問題解答

回答1:

通過PyVirtualDisplay可以實現你的需求,大概代碼就是這樣:

#!/usr/bin/env pythonfrom pyvirtualdisplay import Displayfrom selenium import webdriverdisplay = Display(visible=0, size=(800, 600))display.start()# now Firefox will run in a virtual display. # you will not see the browser.browser = webdriver.Chrome()browser.get(’http://www.baidu.com’)print browser.titlebrowser.quit()display.stop()

不知道你修改過phantomjs的頭信息沒有,可以通過

from selenium import webdriveroptions = webdriver.ChromeOptions()options.add_argument(’lang=zh_CN.UTF-8’)options.add_argument(’user-agent='Mozilla/5.0 (iPod; U; CPU iPhone OS 2_1 like Mac OS X; ja-jp) AppleWebKit/525.18.1 (KHTML, like Gecko) Version/3.1.1 Mobile/5F137 Safari/525.20'’)browser = webdriver.Chrome(chrome_options=options)url = 'https://baidu.com'browser.get(url)browser.quit()

這種方式修改phantomjs的頭部信息,這個也可以試試

回答2:

可以參考鄙人的文章在headless模式下運行selenium

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 成年男女的免费视频网站 | 国产一区二区久久 | 夜色亚洲 | 成人国产综合 | 国产精品视频观看 | 国产日韩一区 | 伊人影院视频 | 亚洲成人免费网站 | 99久久精品男女性高爱 | 国产草草视频 | 久久中文字幕亚洲 | 亚洲第一视频在线播放 | 亚洲第一综合色 | 久久香蕉国产线看观看乱码 | 国产高清a毛片在线看 | 含羞草1000成人免费视频 | 日韩高清在线不卡 | 久草一区 | 欧美线在线精品观看视频 | 国产成人精品免费视频大全五级 | 手机看片在线精品观看 | a一级特黄日本大片 s色 | 在线观看免费视频片 | 国产一区二区三区欧美 | 久久久高清国产999尤物 | 亚洲国产成人久久笫一页 | 欧美成a人片在线观看久 | 无毒不卡在线播放 | 国产成人综合一区精品 | 久久久久久久久久免免费精品 | 多人性活动 | 99久久免费看精品国产一区 | 综合第一页 | 国产精品久久久久久免费播放 | 日韩在线国产精品 | 三级毛片免费 | 看全大色黄大色黄大片一级爽 | 国产精品九九 | 久久久青青 | 黑人欧美一级毛片 | 日本久久草|