python - celery工作流的問題
問題描述
celery中,我做這樣的處理:一個(gè)url經(jīng)過a, b, c三個(gè)的函數(shù),分別獲得返回值,其中任意函數(shù)結(jié)果均與任意其他函數(shù)結(jié)果不相關(guān),然后匯總起來,交給之后的流程.這樣,我自然想到并行運(yùn)行三個(gè)函數(shù)來加快處理速度.然而由于一開始的設(shè)計(jì)問題, a函數(shù)式被設(shè)計(jì)成了一次可以處理多個(gè)url的形式,而一個(gè)一個(gè)的處理會(huì)非常慢.
@celery.taskdef a(url_list): ’...do something...’ for url in url_list:b.delay(url)
我嘗試這樣控制,然而任務(wù)似乎并不能嵌套.那么,如何設(shè)計(jì)可以比較好的滿足我這種比較奇怪的流程和要求呢?
問題解答
回答1:應(yīng)該把a(bǔ);b;c拆開,寫成3個(gè)task, 同時(shí)數(shù)據(jù)庫里要保存一個(gè)狀態(tài)值,用來表示3個(gè)任務(wù)的執(zhí)行狀態(tài),一個(gè)任務(wù)執(zhí)行完成后,就修改狀態(tài)值,并檢查其他2個(gè)任務(wù)是否完成,如果都完成了,就匯總?cè)蝿?wù)結(jié)果,再處理。
回答2:@xiaoboost 手工維護(hù)狀態(tài)可行,但有點(diǎn)費(fèi)事。
Celery 是可以設(shè)計(jì)執(zhí)行流程的,參考文檔:Designing Work-flows題主的需求可以用 chords 搞定,在 celery task 里返回值就行。
BTW: 注意一下 Celery 配置中與返回值相關(guān)的幾個(gè)選項(xiàng),比如這個(gè) task_ignore_result
相關(guān)文章:
1. java - 請(qǐng)問在main方法中寫成對(duì)象名.屬性()并賦值,與直接參參數(shù)賦值輸錯(cuò)誤是什么原因?2. MySQL數(shù)據(jù)庫中文亂碼的原因3. docker不顯示端口映射呢?4. android studio總是在processes running好久5. macos - mac下docker如何設(shè)置代理6. 關(guān)docker hub上有些鏡像的tag被標(biāo)記““This image has vulnerabilities””7. docker - 各位電腦上有多少個(gè)容器啊?容器一多,自己都搞混了,咋辦呢?8. mysql - 新浪微博中的關(guān)注功能是如何設(shè)計(jì)表結(jié)構(gòu)的?9. docker-compose 為何找不到配置文件?10. docker gitlab 如何git clone?
