文章詳情頁
如何提高python查詢速度?
瀏覽:147日期:2022-06-29 18:39:57
問題描述
最近在爬股票的相關(guān)新聞,一開始設(shè)想的是,當(dāng)有新的新聞動態(tài)發(fā)布,程序通過郵件發(fā)送最新內(nèi)容到郵箱。
所以我想把新聞標(biāo)題,內(nèi)容存到數(shù)據(jù)庫里,當(dāng)內(nèi)容更新時,把新的內(nèi)容和數(shù)據(jù)庫的標(biāo)題列表對比,看是不是已存在的,如果已存在,那就不發(fā)送,如果沒有,那發(fā)送到郵箱。
但數(shù)量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?
問題解答
回答1:爬蟲任務(wù)去重
抓過的鏈接存到一個set中,檢查新鏈接是否在集合中即可。
回答2:去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內(nèi)存,提升效率
上一條:python - 如何使用requests模塊在一個post中提交含有多個相同名稱的數(shù)據(jù)?下一條:python - scrapy獲取網(wǎng)頁指定內(nèi)容,后翻到下一頁繼續(xù),固定循環(huán)次數(shù)。。問題
相關(guān)文章:
1. css3的背景圖片屬性有沒有把圖中這塊藍框區(qū)域(275*230)完整放在60*50區(qū)域?怎么寫呢2. javascript - jQuery each 方法第三個參數(shù)args 如何解釋?3. javascript - js中遞歸與for循環(huán)同時發(fā)生的時候,代碼的執(zhí)行順序是怎樣的?4. 如何分別在Windows下用Winform項模板+C#,在MacOSX下用Cocos Application項目模板+Objective-C實現(xiàn)一個制作游戲的空的黑窗口?5. android - 優(yōu)酷的安卓及蘋果app還在使用flash技術(shù)嗎?6. javascript - 前端開發(fā) 本地靜態(tài)文件頻繁修改,預(yù)覽時的緩存怎么解決?7. 新手 - Python 爬蟲 問題 求助8. java - new + 類名,一定需要申明一個對象嗎?9. mysql數(shù)據(jù)庫每次查詢是一條線程嗎?10. python - linux怎么在每天的凌晨2點執(zhí)行一次這個log.py文件
排行榜

熱門標(biāo)簽