淺析MySQL并行復(fù)制
01 并行復(fù)制的概念
在MySQL的主從復(fù)制架構(gòu)中,主庫(kù)上經(jīng)常會(huì)并發(fā)的執(zhí)行很多SQL,只要這些SQL沒(méi)有產(chǎn)生鎖等待,那么同一時(shí)間并發(fā)好幾個(gè)SQL線程是沒(méi)有問(wèn)題的。
我們知道,MySQL的從庫(kù)是要通過(guò)IO_thread去拉取主庫(kù)上的binlog的,然后存入本地,落盤(pán)成relay-log,通過(guò)sql_thread來(lái)應(yīng)用這些relay-log。
在MySQL5.6之前的版本中,當(dāng)主庫(kù)上有多個(gè)線程并發(fā)執(zhí)行SQL時(shí),sql_thread只有一個(gè),在某些TPS比較高的場(chǎng)景下,會(huì)出現(xiàn)主庫(kù)嚴(yán)重延遲的問(wèn)題。MySQL為了解決這個(gè)問(wèn)題,將sql_thread演化了多個(gè)worker的形式,在slave端并行應(yīng)用relay log中的事務(wù),從而提高relay log的應(yīng)用速度,減少?gòu)?fù)制延遲。這就是并行復(fù)制的由來(lái)。
在MySQL中,復(fù)制線程是由參數(shù)slave_parallel_workers來(lái)控制的,通常情況下,在8G內(nèi)存、8核CPU的機(jī)器上,將該值設(shè)置為8比較合適,如果你的CPU核數(shù)比較高,那么可以適當(dāng)調(diào)整為8~16之間的數(shù)字。
mysql> show variables like ’slave_parallel_workers’;+------------------------+-------+| Variable_name | Value |+------------------------+-------+| slave_parallel_workers | 8 |+------------------------+-------+1 row in set, 1 warning (0.00 sec)
02 并行復(fù)制的演進(jìn)
并行復(fù)制的本質(zhì)是同時(shí)執(zhí)行的SQL不存在鎖爭(zhēng)用。
在MySQL5.6版本,MySQL支持的粒度是按照數(shù)據(jù)庫(kù)進(jìn)行并行執(zhí)行relay log,這種方式能夠解決一部分問(wèn)題,因?yàn)椴煌瑪?shù)據(jù)庫(kù)上的SQL,肯定不會(huì)修改表中的同一行內(nèi)容。這樣也就不會(huì)產(chǎn)生鎖爭(zhēng)用。在一些數(shù)據(jù)庫(kù)均勻分布,每個(gè)數(shù)據(jù)庫(kù)使用頻率都差不多的場(chǎng)景下,這種并行復(fù)制的方法比較好。如果你的業(yè)務(wù)的數(shù)據(jù)都集中在一個(gè)熱點(diǎn)表,這種情況下,并行復(fù)制會(huì)退化為單線程復(fù)制。
隨后,在MariaDB中對(duì)并行復(fù)制做了一定的改進(jìn),它的做法是:
1、主庫(kù)上能夠并行提交的事務(wù),也就是已經(jīng)進(jìn)入到了redo log commit階段的事務(wù),在從庫(kù)上也一定能夠并行提交,所以在主庫(kù)上并行提交的事務(wù),它用一個(gè)commit_id對(duì)這組事務(wù)來(lái)進(jìn)行標(biāo)識(shí),下一組并行事務(wù)的commit_id為本組的commit_id+1
2、將所有的事務(wù)的commit_id寫(xiě)入binlog中
3、在從庫(kù)上應(yīng)用binlog的時(shí)候,將所有的binlog按照commit_id進(jìn)行劃分到不同的worker上
4、本組commit_id的事務(wù)全部在從庫(kù)上提交完成之后,再去拿下一批事務(wù)。
這種方法大大增加了從庫(kù)應(yīng)用relay log的速度,但是問(wèn)題是從庫(kù)在應(yīng)用前一組事務(wù)的時(shí)候,后一組事務(wù)是處于等待中的,即使前一組的worker有些已經(jīng)空閑。而在主庫(kù)上,可能無(wú)時(shí)無(wú)刻不在寫(xiě)入,這樣,系統(tǒng)的吞吐量上主從節(jié)點(diǎn)就不匹配,主庫(kù)的吞吐量嚴(yán)重高于從庫(kù)。
MySQL5.7的并行復(fù)制在MariaDB的基礎(chǔ)上做了改進(jìn),我們知道,事務(wù)進(jìn)入到redo log prepare階段的時(shí)候,由于WAL技術(shù),說(shuō)明此時(shí)事務(wù)已經(jīng)經(jīng)過(guò)了所沖突檢測(cè)階段了。MySQL5.7的并行復(fù)制時(shí)將所有在主庫(kù)上處于redo log prepare階段的事務(wù),和該階段之后的事務(wù),也就是處于redo log commit階段的事務(wù),在從庫(kù)并行執(zhí)行,從而減少worker線程不必要的等待。
這里,有必要再說(shuō)兩個(gè)參數(shù),
binnlog_group_commit_sync_delay參數(shù),表示redo log prepare階段完成之后,延遲多少微秒后才調(diào)用fsync; binlog_group_commit_sync_no_delay_count參數(shù),表示累積多少次redo log prepare:write的操作以后才調(diào)用fsync這兩個(gè)參數(shù)是用于故意拉長(zhǎng)binlog從write到fsync的時(shí)間,以此減少binlog的寫(xiě)盤(pán)次數(shù)。在MySQL 5.7的并行復(fù)制策略里,它們可以用來(lái)制造更多的“同時(shí)處于prepare階段的事務(wù)”。這樣就增加了備庫(kù)復(fù)制的并行度。
它們既可以“故意”讓主庫(kù)提交得慢些,又可以讓備庫(kù)執(zhí)行得快些。在MySQL 5.7處理備庫(kù)延遲的時(shí)候,可以考慮調(diào)整這兩個(gè)參數(shù)值,來(lái)達(dá)到提升備庫(kù)復(fù)制并發(fā)度的目的。
以上就是淺析MySQL并行復(fù)制的詳細(xì)內(nèi)容,更多關(guān)于MySQL并行復(fù)制的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. MySQL Delete 刪數(shù)據(jù)后磁盤(pán)空間未釋放的原因2. MySql如何使用not in實(shí)現(xiàn)優(yōu)化3. MySQL中文亂碼問(wèn)題解決方案4. 淺談數(shù)據(jù)庫(kù)日期類(lèi)型字段設(shè)計(jì)應(yīng)該如何選擇5. MySQL性能優(yōu)化之一條SQL在MySQL中執(zhí)行的過(guò)程詳解6. Microsoft Office Access隱藏和顯示字段的方法7. MySQL Innodb 存儲(chǔ)結(jié)構(gòu) 和 存儲(chǔ)Null值 用法詳解8. mysql存儲(chǔ)過(guò)程游標(biāo)之loop循環(huán)解讀9. MySQL忘記root密碼以及遠(yuǎn)程無(wú)法連接的解決方法10. MySQL索引知識(shí)的一些小妙招總結(jié)
