文章詳情頁

網頁爬蟲 - python的多進程怎么配合requests

瀏覽：114日期：2022-06-27 18:08:43

問題描述

這是單進程順序執行的代碼：

import requests,time,os,randomdef img_down(url): with open('{}'.format(str(random.random())+os.path.basename(url)),'wb') as fob:fob.write(requests.get(url).content)urllist=[]with open('urllist.txt','r+') as u: for a in u.readlines():urllist.append(a.strip())s=time.clock()for i in range(len(urllist)): img_down(urllist[i])e=time.clock()print ('time: %d' % (e-s))

這是多進程的代碼：

from multiprocessing import Poolimport requests,os,time,randomdef img_down(url): with open('{}'.format(str(random.random())+os.path.basename(url)),'wb') as fob:fob.write(requests.get(url).content)if __name__=='__main__': urllist=[] with open('urllist.txt','r+') as urlfob:for s in urlfob.readlines(): urllist.append(s.strip()) s=time.clock() p=Pool() for i in range(len(urllist)):p.apply_async(img_down,args=(urllist[i],)) p.close() p.join() e=time.clock()print ('time: {}'.format(e-s))

但是單進程和多進程花費的時間幾乎沒區別，問題大概是requests阻塞IO，請問理解的對不對，代碼該怎么修改達到多進程的目的？謝謝！

問題解答

回答1：

寫文件的瓶頸在磁盤IO，并不在CPU，你并行并沒有多大作用，你可以試試不要寫入文件再對比時間

回答2：

Pool 不帶參數的話是采用 os.cpu_count() or 1如果是單核CPU，或者采集不到數量就只有1個進程而已。

應該是這個原因。

Python 編程

上一條：Python這句話什么意思，語法有點怪？下一條：python3.x - Python中出現AttributeError: object has no attribute

相關文章：

1. list - python 求助2. linux - Ubuntu下編譯Vim8（+python）無數次編譯失敗3. python - TypeError: tryMsgcode() takes exactly 2 arguments (0 given)4. javascript - react，獲取radio的值出錯5. css - 移動端 line-height安卓錯位,蘋果機正常用,縮放解決了,可是又出來了占位的問題6. extra沒有加載出來7. javascript - 彈出一個子窗口，操作之后關閉，主窗口會得到相應的響應，例如網站的某些登錄界面，django后臺的管理等，這是怎么實現的呢？8. 環境搭建 - anaconda 創建python2.7環境中打開編譯器確是3.6版本9. mysql replace 死鎖10. 求救一下，用新版的phpstudy，數據庫過段時間會消失是什么情況？

排行榜

					
					java - 讀寫鎖中 寫鎖的降級問題
extra沒有加載出來
求救一下，用新版的phpstudy，數據庫過段時間會消失是什么情況？
apache - 80端口被system占用，怎么辦？
mysql replace 死鎖
java - 靜態屬性中的賦值和靜態代碼塊中的賦值有什么區別？
css3 實現一個線性漸變出現的問題？
javascript - 關于js，alert()阻塞的問題
list - python 求助
linux - Ubuntu下編譯Vim8（+python）無數次編譯失敗
javascript - 函數設置參數默認值的問題
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

網頁爬蟲 - python的多進程怎么配合requests