python 多進(jìn)程使用
問題描述
假設(shè):有個數(shù)據(jù)操作,處理100萬條數(shù)據(jù),每個數(shù)據(jù)的value+1。如簡單代碼假設(shè)
for x in range(1,100): x++
從數(shù)據(jù)庫獲取100條了,然后想多進(jìn)程去執(zhí)行x++?還是說多進(jìn)程去數(shù)據(jù)庫獲取數(shù)據(jù)?謝謝了
問題解答
回答1:有一個問題: 如果是數(shù)據(jù)庫里面的數(shù)據(jù), 為什么不執(zhí)行sql,這比什么多進(jìn)程要高效的多吧?如果非要你給出的二選一, 那么考慮一下:
1). 如果你要用多進(jìn)程去數(shù)據(jù)庫獲取數(shù)據(jù)(就算你用了mysql連接池,可以不怎么考慮數(shù)據(jù)庫連接的io消耗),你每取一次數(shù)據(jù),總要有一次查詢吧, 完了以后,你還要把更新后的數(shù)據(jù)寫入到數(shù)據(jù)庫了, 又是一次數(shù)據(jù)庫操作,想想這個消耗有多大?2). 數(shù)據(jù)庫獲取100萬數(shù)據(jù),然后想多進(jìn)程去執(zhí)行x++; 這種情況啊,只要計算機內(nèi)存夠(只有100萬數(shù)據(jù),基本是沒問題的), 用python的進(jìn)程池map一下,確實也是沒什么問題回答2:
先將原始數(shù)據(jù)存入隊列(queue)中,作為生產(chǎn)者后從隊列中取數(shù)據(jù),執(zhí)行操作,作為消費者這時,可以在消費者開多線程(當(dāng)然你鎖處理得好的話,生產(chǎn)者也可以做多線程)
while tmp_queue.empty() is not True: x = tmp_queue.get() x += 1
在隊列中,如果一直存在元素線程會持續(xù)進(jìn)行操作。
回答3:其實Python中實現(xiàn)多進(jìn)程的最佳方式是使用multiprocessing中的map
例子(Python 3):
# f.py# 要對某個列表中每個元素都執(zhí)行一次的functiondef f(x): return x + 1
# main.pyfrom multiprocessing import poolfrom f import f# 創(chuàng)建進(jìn)程池p = pool.Pool(4)lst = range(100)# 使用多進(jìn)程對整個列表進(jìn)行計算print(p.map(f, lst))回答4:
你可以直接把數(shù)據(jù)讀取和數(shù)據(jù)+1兩個函數(shù)再寫到一個操作中啊,然后用多進(jìn)程去操作,就上樓上說的一樣用進(jìn)程池進(jìn)行操作。根據(jù)你的cpu核數(shù),設(shè)置進(jìn)程池的大小。由于多進(jìn)程間不進(jìn)行內(nèi)存共享、也不能直接通信,你先用多進(jìn)程從數(shù)據(jù)庫中把所有數(shù)據(jù)讀出來,然后再用多進(jìn)程進(jìn)行val+1也行的
相關(guān)文章:
1. javascript - 在 vue里面用import引入js文件,結(jié)果為undefined2. php - 微信開發(fā)驗證服務(wù)器有效性3. javascript - 我的站點貌似被別人克隆了, google 搜索特定文章,除了域名不一樣,其他的都一樣,如何解決?4. javascript - js setTimeout在雙重for循環(huán)中如何使用?5. 求救一下,用新版的phpstudy,數(shù)據(jù)庫過段時間會消失是什么情況?6. 小程序怎么加外鏈,語句怎么寫!求救新手,開文檔沒發(fā)現(xiàn)7. python沒入門,請教一個問題8. html - 爬蟲時出現(xiàn)“DNS lookup failed”,打開網(wǎng)頁卻沒問題,這是什么情況?9. java - idea創(chuàng)建多modules項目后,tomcat啟動失敗10. php - mysql 模糊搜索問題
