亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術(shù)文章
文章詳情頁

mysql - 如何在數(shù)據(jù)庫里優(yōu)化 漢明距離 查詢?

瀏覽:111日期:2022-06-21 10:52:44

問題描述

項目里需要一個搜索相似圖片的功能,百度了一些dhash的算法,生成了16個長度的hash值,在mysql里這樣查詢:

SELECT pk, hash, BIT_COUNT( CONV(hash, 16, 10) ^ CONV(’4c8e3366c275650f’, 16, 10) ) as hamming_distance FROM image_hashes HAVING hamming_distance < 4 ORDER BY hamming_distance ASC;

經(jīng)測試,15W條數(shù)據(jù),搜索需要很長時間。第二次速度會快些,有啥辦法可以優(yōu)化?

問題解答

回答1:

謝邀。

抱歉地說,這個我也沒有做過,只是之前聽說過漢明距離。15w數(shù)據(jù),不是很多,但是用了mysql的函數(shù),沒辦法創(chuàng)建索引。。。

大概搜了一下,有相同的問題。

可以參考mysql 圖片漢明距離計算, 近40w的異或計算, 如何破

Hamming distance on binary strings in SQL

你可以試試mysql的內(nèi)存表 MySQL內(nèi)存表的特性與使用介紹

回答2:

不好意思,沒有“漢明距離”的相關(guān)經(jīng)驗。

如果只是15W數(shù)據(jù)的話,可以把數(shù)據(jù)加載到內(nèi)存里緩存起來,然后在程序里運算,畢竟SQL并不擅長做這種事情。

僅從你的SQL來說,的確沒有太大的優(yōu)化空間,能想到的就只有以下幾點:

hash列用char代替varchar

舍棄ORDER BY hamming_distance ASC,改為由程序排序

建議把DDL語句和EXPLAIN結(jié)果也發(fā)上來一并分析,不過最大的性能卡口應該是BIT_COUNT(CONV(hash, 16, 10) ^ CONV(’4c8e3366c275650f’, 16, 10)) as hamming_distance,其實相當于全表掃描了。

相關(guān)文章:
主站蜘蛛池模板: 日本大片在线观看 | 国内自拍视频在线看免费观看 | 精品亚洲午夜久久久久 | 亚洲精品国产第一区二区小说 | 色综合亚洲天天综合网站 | 日韩一区三区 | 国产高清看片日韩欧美久久 | 久久不色 | 日本无翼乌邪恶大全彩h污污 | 国产黄色二级片 | 色优久久| 手机看片自拍自拍自拍 | 四虎现在的网址入口2022 | 国产在线五月综合婷婷 | 亚洲乱码视频 | 五月伊人网 | 色吊丝永久性观看网站大全 | 尤物视频在线网站 | 大片一级 | 欧美特黄aaaaaaaa大片 | 欧美成人精品一区二三区在线观看 | 国产一区二区欧美丝袜 | 无遮挡啪啪成人免费网站 | 久草首页在线 | 奇米网狠狠网 | 久久综合成人网 | 天天操夜夜逼 | 中国一级特黄高清免费的大片 | 国产美女做爰免费视 | 亚洲精品综合一区在线 | 久久久在线视频精品免费观看 | 欧洲男女下面进出的视频 | 国产日韩视频在线观看 | 香蕉视频毛片 | 1024免费永久福利视频 | 成人国产精品视频频 | 国产亚洲亚洲精品777 | 国产欧美一区二区三区视频 | 国产亚洲欧美日韩在线一区 | www.麻豆视频 | 久久久久久综合对白国产 |