文章詳情頁
python - 如何解決queue中同一個參數(shù)被多個線程同時調(diào)用?
瀏覽:110日期:2022-08-18 15:18:47
問題描述
本人想實現(xiàn)一個基礎(chǔ)的多線程爬蟲,初步想法是篩選目錄中多個電影標題是否有關(guān)鍵字,沒有的話就進入到詳情頁中查找電影類別中是否有關(guān)鍵字。下面是一部分代碼:
executor = ThreadPoolExecutor(max_workers=5) #Future模塊的多線程executor.map(get_page,whole) #get_page()為篩選標題的函數(shù)time.sleep(5)while not que.empty(): que_data = que.get() filter(que_data) #filter()為篩選分類關(guān)鍵字的函數(shù),但每次五個線程同時訪問同一個url
但現(xiàn)在每次多個線程同時調(diào)用queue中的同一個url,請問有什么解決辦法嗎
問題解答
回答1:專門用一個線程讀取queue中的url,然后分配給某個線程
對該queue的訪問加鎖
相關(guān)文章:
1. php - 微信開發(fā)驗證服務(wù)器有效性2. 求救一下,用新版的phpstudy,數(shù)據(jù)庫過段時間會消失是什么情況?3. javascript - 我的站點貌似被別人克隆了, google 搜索特定文章,除了域名不一樣,其他的都一樣,如何解決?4. mysql - 請問數(shù)據(jù)庫字段為年月日,傳進的參數(shù)為月,怎么查詢那個月所對應(yīng)的數(shù)據(jù)5. Python2中code.co_kwonlyargcount的等效寫法6. python - 如何判斷字符串為企業(yè)注冊名稱7. html - 移動端radio無法選中8. javascript - vue+iview upload傳參失敗 跨域問題后臺已經(jīng)解決 仍然報403,這是怎么回事啊?9. [python2]local variable referenced before assignment問題10. python中怎么對列表以區(qū)間進行統(tǒng)計?
排行榜

熱門標簽