java - 判斷數(shù)據(jù)在數(shù)據(jù)庫中是否已存在.
問題描述
今天下午和同事發(fā)生因為判斷數(shù)據(jù)是否在數(shù)據(jù)庫中已存在產(chǎn)生分歧.簡易代碼如下:
//觀點一,先取出數(shù)據(jù)庫中已存在ID存入內(nèi)存,再進行判斷 //數(shù)據(jù)太多情況,內(nèi)存爆炸 DateTable dt = ExcuteSQL(’SELECT ID FROM TABLE’);//List為數(shù)據(jù)集,已經(jīng)去重 foreach(var item in List){//觀點二,在for循環(huán)中根據(jù)ID查詢是否已存在//for循環(huán)執(zhí)行數(shù)據(jù)庫?沒這么干過DateTable dt = ExcuteSQL(string.format(’SELECT ID FROM TABLE WHERE ID = {0}’,item.ID));//判斷是否在dt中存在...bool ISContain...//不存在 if(!ISContain){ //加入事物SQL列表 SQLList.Add(’INSERT INTO ........’); } }//執(zhí)行事物 ....
問題解答
回答1:其實第一個你要拿實際數(shù)據(jù)量來估算,如果ID是Long類型,數(shù)據(jù)量100W,也才只有 8byte * 100W = 7.629 megabytes。
第二個肯定要不得,在循環(huán)中對每個ID去查詢。
回答2:推薦方法二,但這樣做查詢會比較快:
SELECT id FROM table WHERE id IN (?, ?, ?, ...)
注意,不同的數(shù)據(jù)庫對參數(shù)是有限制的,?最好不要超過1千個。如果你需要判斷1萬個id,就用10次這樣的查詢。
回答3:利用 @auntyellow 同學所說的方法應該比較好,批量查詢。當ID比較多時,考慮是否可以按其它的批量方式去查?比如一次拿一段時間的所有id,把方法一稍加改進來實現(xiàn)。感覺不管是方法一還是方法二都走了極端,所以好的解決方法應該是中合兩者的結(jié)果。
回答4:https://www.zhihu.com/questio...
回答5:建議是使用先把id從數(shù)據(jù)庫中取出來,然后在內(nèi)存中比較的方法,這樣可以減少數(shù)據(jù)庫的訪問。
回答6:可不可以分段 取到內(nèi)存里 這樣能減輕內(nèi)存占用
相關文章:
1. mysql - 新浪微博中的關注功能是如何設計表結(jié)構(gòu)的?3. angular.js使用$resource服務把數(shù)據(jù)存入mongodb的問題。4. 如何解決Centos下Docker服務啟動無響應,且輸入docker命令無響應?5. angular.js - 關于$apply()6. dockerfile - [docker build image失敗- npm install]7. MySQL數(shù)據(jù)庫中文亂碼的原因8. 表單提交驗證,沒反應,求老師指點9. nignx - docker內(nèi)nginx 80端口被占用10. angular.js - Ionic 集成crosswalk后生成的apk在android4.4.2上安裝失敗???
