亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

selenium - 請(qǐng)教一下 Python 爬蟲工具

瀏覽:125日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數(shù)據(jù)

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執(zhí)行成功, click 的元素對(duì)不對(duì), driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調(diào)了 js里的 click() 方法,并沒有觸發(fā) target 怎么辦3)我不知道是先渲染page_source, 還是 應(yīng)該先 click, 假設(shè)執(zhí)行成功了 click, 是不是也不會(huì)再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動(dòng)化,click能模仿用戶點(diǎn)擊,就跟你自己在頁(yè)面上點(diǎn)擊一樣,一切都在虛擬瀏覽器驅(qū)動(dòng)中進(jìn)行。

看你的業(yè)務(wù)邏輯啊。。。比如有些數(shù)據(jù)要點(diǎn)擊后才有,那就先click再獲取源代碼。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 大学生久久香蕉国产线观看 | 国产一及片| 久久综合中文字幕一区二区 | 亚洲麻豆精品果冻传媒 | 极品国产一区二区三区 | 欧美视频免费一区二区三区 | 国产色影院 | 美女隐私视频黄www免费 | 一级毛片日韩a欧美视频 | 久久精品94精品久久精品动漫 | 欧美国产日本 | 青青青国产在线手机免费观看 | 精品亚洲永久免费精品 | 成人免播放器午夜视频 | 国产激爽大片高清在线观看 | 俄罗斯14一18处交 | 国产亚洲欧美另类第一页 | 久久久久国产精品免费免费 | 国产精品二区三区免费播放心 | 国产成人微拍精品 | 免费a资源 | 亚洲国产成人久久综合一区 | 免费的一级毛片 | 亚洲精品视频在线免费 | 97射射| 免费大学生国产在线观看p 免费大黄网站在线观看 | 国产麻豆精品免费密入口 | 亚洲欧美日韩精品永久在线 | 欧美大jj| 国产福利微拍精品一区二区 | 国产乱码精品一区二区三上 | 精品日韩在线 | 亚洲欧美中文日韩在线v日本 | 91频视| 男人狂躁女人下面视频免费看 | 一级毛片免费在线播放 | 日本特黄特色大片免费视频观看 | 草草线在成人免费视频 | 亚洲美女色在线欧洲美女 | 在线播放一区二区三区 | 曰本人一级毛片免费完整视频 |