文章詳情頁

python - scrapy 再次請求的問題

瀏覽：116日期：2022-08-17 18:54:48

問題描述

如：item[’url’]=response.xpath(’a/@href’)分析出一個鏈接，然后想從這個鏈接里的網(wǎng)頁再獲取一些元素，放入item[’other’]。應(yīng)該怎么寫，謝謝。

問題解答

回答1：

def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True，callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item

最后附上官方文檔https://doc.scrapy.org/en/lat...中文翻譯版http://scrapy-chs.readthedocs...

Python 編程

上一條：python - django模板 include模板的數(shù)據(jù)問題下一條：Pycharm中文輸出亂碼怎么辦？win10，Pycharm3.2,Python3.5

相關(guān)文章：

1. git - 使用淘寶npm安裝hexo出現(xiàn)問題？2. html5和Flash對抗是什么情況？3. 小程序怎么加外鏈，語句怎么寫！求救新手，開文檔沒發(fā)現(xiàn)4. javascript - vue-resource中如何設(shè)置全局的timeout？5. javascript - 在 vue里面用import引入js文件，結(jié)果為undefined6. PC 手機兼容的編輯器7. php如何獲取訪問者路由器的mac地址8. 多選框?qū)戇M數(shù)據(jù)庫怎么寫9. 求教一個mysql建表分組索引問題10. thinkPHP5中獲取數(shù)據(jù)庫數(shù)據(jù)后默認選中下拉框的值，傳遞到后臺消失不見。有圖有代碼，希望有人幫忙

排行榜

					
					javascript - vue-resource中如何設(shè)置全局的timeout？
html5和Flash對抗是什么情況？
php如何獲取訪問者路由器的mac地址
小程序怎么加外鏈，語句怎么寫！求救新手，開文檔沒發(fā)現(xiàn)
git - 使用淘寶npm安裝hexo出現(xiàn)問題？
javascript -  在 vue里面用import引入js文件，結(jié)果為undefined
PC 手機兼容的 編輯器
html5 - input type=’file’ 上傳獲取的fileList對象怎么存儲于瀏覽器？
javascript - 如何獲取未來元素的父元素在頁面中所有相同元素中是第幾個?
javascript - 后端傳過來的數(shù)據(jù)格式是這樣，如何使用？
多選框?qū)戇M數(shù)據(jù)庫怎么寫
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - scrapy 再次請求的問題