文章詳情頁

使用python scrapy框架,循環爬取URL, 每次運行一段時間后直接卡死,沒有任何報錯

瀏覽：65日期：2022-06-28 18:15:35

問題描述

每次運行半小時左右, 直接卡死, log里沒有任何報錯, 卡死的時候CPU占用率非常高

我在setting.py里設置了download timeout,不是超時的原因

ctrl-c無法正常退出, ctrl-z退出以后, 繼續執行還是同樣的問題, 半小時后再次卡死

使用python scrapy框架,循環爬取URL, 每次運行一段時間后直接卡死,沒有任何報錯

問題解答

回答1：

先TOP看看是內否過高，還是CPU過高，再找到是被哪些進程占用了如果都是你的爬蟲進程，那就得排查代碼，看看是不是哪里一直未被釋放

總之從各方面去排查吧

回答2：

strace

Python 編程

上一條：python2 qt5 關于如何判斷字符串為空下一條：python - dateutil.parser 處理不完整時間字符串

排行榜

					
					MySQL數據庫中文亂碼的原因
關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””
docker不顯示端口映射呢？
docker - 各位電腦上有多少個容器??？容器一多，自己都搞混了，咋辦呢？
macos - mac下docker如何設置代理
angular.js - 關于$apply()
docker gitlab 如何git clone？
angular.js - angularjs的自定義過濾器如何給文字加顏色？
docker-compose 為何找不到配置文件？
css - C#與java開發Windows程序哪個好？
mysql - 新浪微博中的關注功能是如何設計表結構的？
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

使用python scrapy框架,循環爬取URL, 每次運行一段時間后直接卡死,沒有任何報錯