文章詳情頁
python - pyspider 定時爬取問題
瀏覽:100日期:2022-07-14 10:37:31
問題描述
在寫爬蟲的時候,發現 在代碼中設置了 every 之后,21號爬取了一次之后,今天看 result 沒有更新,那個 lastcrawltime 依舊是 21號的。請問是不是我的參數設置的不正確?
問題解答
回答1:你貼的這個 task 的圖,是什么任務的?
貼的是 detail_page 的任務的
題主給 index_page 設置了小于 cronjob 間隔的時間。然而沒有給 detail_page 設置。這樣 detail_page 是不會被重新調度的
project 隊列狀態,最近活動任務是怎樣的?
回答2:有可能是 every 和 age 不匹配。如果 age 沒問題的話,說實話這屬于疑難雜癥了,我也經常遇到,我都是去 taskdb 把相應的表清空,然后重啟 pyspider 重新運行項目
相關文章:
1. angular.js - 如何通俗易懂的解釋“依賴注入”?2. 我在centos容器里安裝docker,也就是在容器里安裝容器,報錯了?3. 老哥們求助啊4. 我的html頁面一提交,網頁便顯示出了我的php代碼,求問是什么原因?5. django - 后臺返回的json數據經過Base64加密,獲取時用python如何解密~!6. html5 - angularjs中外部模版加載無法使用7. css3 - 請問一下在移動端CSS布局布局中通常需要用到哪些元素,屬性?8. tp6表單令牌9. node.js - node 客戶端socket一直報錯Error: read ECONNRESET,用php的socket沒問題哈。。10. ubuntu PPA 更新老是不成功該怎么辦
排行榜
