文章詳情頁
python - 2億++的網(wǎng)址,怎樣快速確認(rèn)網(wǎng)頁狀態(tài)碼?
瀏覽:97日期:2022-07-10 11:36:21
問題描述
用requests寫了個(gè)多線程,感覺有點(diǎn)慢,還有其他方法么?
問題解答
回答1:使用 Tornado 的 curl 客戶端支持,讀到請求頭就關(guān)閉連接。(我還沒試過。如果它提供的 HTTP 客戶端不支持中途關(guān)閉連接的話,可以像我這樣使用 TCP 然后用 http-parser 來解析。)
好吧,其實(shí)你可以直接給 fetchtitle 加個(gè)取狀態(tài)碼的擴(kuò)展就可以了……(記得裝 pycurl 哦)
回答2:python本來就慢,想速度快就直接寫tcp請求然后讀回復(fù),讀到狀態(tài)后就關(guān)掉socket。
回答3:使用grequests,對requests進(jìn)行了并發(fā)封裝
https://github.com/kennethrei...
回答4:這種情況可以考慮使用gevent,tornado,scrapy-redis,asyncio!
回答5:用Head請求能快一點(diǎn)吧?
排行榜

熱門標(biāo)簽