文章詳情頁

python - scrapy 如何組合2個不同頁面的數(shù)據(jù),一并存儲

瀏覽：112日期：2022-06-29 10:02:12

問題描述

1 比如有博客列表頁 a ,獲取文章列表2 博客內(nèi)容詳情頁 b , 獲取文章正文3 如何依次獲取到文章 + 內(nèi)容到數(shù)據(jù)庫 ?4 當(dāng)前問題主要是不知道如何組合2個不同頁面的數(shù)據(jù)

問題解答

回答1：

可以用request.meta來存儲額外的信息, 比如

def parse_x1(self, response): extra = {} ... req = scrapy.Request(url2) req.callback = self.parse_x2 ... req.meta[’extra’] = extra yield req def parse_x2(self, response): item = {} extra = response.meta[’extra’] item.update(extra) ...yield item

Python 編程

上一條：python - 多態(tài)調(diào)用方法時卻顯示bound method...下一條：python - 關(guān)于Flask中全局變量問題

排行榜

					
					javascript - 后端傳過來的數(shù)據(jù)格式是這樣，如何使用？
javascript - js機(jī)制問題，是否都是等主線程執(zhí)行完畢再執(zhí)行異步，如果主線程有好幾萬行，或者上下文相關(guān)呢
html5 - h5寫的app用的webview，用手機(jī)瀏覽器打開不顯示？
node.js - win 下 npm install 遇到了如下錯誤 會導(dǎo)致 無法  run dev么？
求救一下，用新版的phpstudy，數(shù)據(jù)庫過段時間會消失是什么情況？
javascript - 新建js文件時如何自動地加上"use strict"？
django - nginx無法使用80端口（它會自動跳轉(zhuǎn)到nginx的歡迎界面），其他端口可以使用
javascript - 我的站點貌似被別人克隆了， google 搜索特定文章，除了域名不一樣，其他的都一樣，如何解決？
angular.js - angularjs如何動態(tài)改變ng-model值，在controller中獲取input中輸入的值并組合post發(fā)送到后臺
javascript - vscode alt+shift+f 格式化js代碼，通不過eslint的代碼風(fēng)格檢查怎么辦。。。
angular.js - 百度支持_escaped_fragment_嗎？
				

熱門標(biāo)簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - scrapy 如何組合2個不同頁面的數(shù)據(jù),一并存儲