文章詳情頁

Python re.sub 反向引用的實現

瀏覽：33日期：2022-06-15 11:35:48

目錄match 分組re.sub 匹配和替換反向引用參考

re 模塊是 Python 標準庫中提供的用于處理正則表達式的模塊，利用 re 模塊可以方便的利用正則表達式實現字符串中的匹配、替換等操作

match 分組

Python re 模塊中提供了 match 函數，用來匹配字符串中指定的正則表達式規則。例如，如果想匹配到 'Isaac Newton, physicist' 中的 Isaac Newton，則可以使用正則表達式 w+ w+ ，運行結果如下：

>>> m = re.match('w+ w+', 'Isaac Newton, physicist')>>> m<re.Match object; span=(0, 12), match=’Isaac Newton’>

re.match 的第一個參數是指定的正則表達式規則，第二個參數是待匹配的字符串。正則表達式規則 w+ 表示匹配一段連續的字符，要求匹配到的字符數量大于 1。 w+ w+ 就表示匹配兩段連續的字符，且兩段字符中間用空格隔開

使用 match 執行匹配時會對匹配到的結果進行分組，可以通過 match 返回結果的 group() 接口查看分組結果

>>> m.group(0)’Isaac Newton’

默認情況下， match 只會產生一個分組，就是第 0 個分組，表示整個匹配到的內容。對于上面的例子，第 0 個分組就是 w+ w+ 匹配到的完整的內容，也就是 Issac Newton 。使用正則表達式中的括號 () 可以手動指定匹配的分組。例如如果想把 Issac 和 Newton 做為兩個分組，那么可以將正則表達式改為 (w+) (w+) ：

>>> m = re.match('(w+) (w+)', 'Isaac Newton, physicist')

在 (w+) (w+) 這個正則表達式中，指定了兩個分組，這兩個分組匹配的內容都是 w+ ，并且兩個分組之間用空格隔開。使用 groups() 可以查看匹配結果中的所有分組：

>>> m.groups()(’Isaac’, ’Newton’)

也可以使用 group() 接口分別查看每一個分組，其中 group(0) 仍然表示完整的匹配結果， group(1) 表示匹配結果中的第 1 個分組， group(2) 表示第 2 個分組，以此類推：

>>> m.group(0)’Isaac Newton’>>> m.group(1)’Isaac’>>> m.group(2)’Newton’re.sub 匹配和替換

re.match() 函數提供了正則表達式的匹配接口， re.sub() 不光能匹配正則表達式，還能替換字符串中的結果，生成一個新的字符串。例如把字符串中 (w+) (w+) 匹配到的結果替換成 Albert Einstein ，可以這樣寫：

>>> re.sub('(w+) (w+)', 'Albert Einstein', 'Isaac Newton, physicist')’Albert Einstein, physicist’

re.sub 中第 1 個參數表示匹配的正則表達式，第 2 個參數表示替換表達式，第 3 個參數表示原始字符串

這里的替換表達式是手動指定的新字符串 Albert Einstein ，他和原始字符串中的內容毫不相關。如果希望復用原始字符串中的內容，那么就需要用到 re.sub 的反向引用功能了。

反向引用

反向引用指的是在指定替換結果的過程中，可以引用原始字符串中的匹配到內容。例如 (w+) (w+) 在原始字符串中匹配到了 Isaac Newton ，利用匹配到的結果，將結果改寫為 FirstName: Isaac, LastName: Newton 。既然需要引用，那么就得有一個表達式能夠表示匹配的內容。恰好 re.sub 的匹配結果也有和 re.match 一樣的分組，因此只需要在替換表達式中引用分組的結果即可。引用方式有以下幾種：

number ：例如 1 ，表示匹配結果中第 1 個分組，也就是例子中的 Isaac 部分。 g<number> ：例如 g<1> ，和 number 表示法一樣，也代表了匹配結果中的第 1 個分組。與 number 表示法相比， g<number> 避免了歧義。試想，如果想用 number 把第 1 個分組匹配到的 Isaac 替換為 Isaac0 ，那么需要用 10 ，這里本意表示在第 1 個分組后加上 0 ，但程序會識別成第 10 個分組。而使用 g<number> 只需要寫成 g<1>0 即可。

回到開始的例子中，將匹配結果 Isaac Newton改寫為 FirstName: Isaac, LastName: Newton ，可以用以下表達式實現：

>>> re.sub('(w+) (w+)', 'FirstName: g<1>, LastName: g<2>', 'Isaac Newton, physicist')’FirstName: Isaac, LastName: Newton, physicist’參考

re — Regular expression operations Python re(gex)? -- Groupings and backreferences

到此這篇關于Python re.sub 反向引用的實現的文章就介紹到這了,更多相關Python re.sub 反向引用內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網！

Python 編程

上一條：python實現簡單聊天功能下一條：Python制作一個隨機抽獎小工具的實現

相關文章：

1. 使用Python和百度語音識別生成視頻字幕的實現2. css代碼優化的12個技巧3. CSS可以做的幾個令你嘆為觀止的實例分享4. msxml3.dll 錯誤 800c0019 系統錯誤:-2146697191解決方法5. 利用ajax+php實現商品價格計算6. xml中的空格之完全解說7. Vue的Options用法說明8. axios和ajax的區別點總結9. 怎樣才能用js生成xmldom對象，并且在firefox中也實現xml數據島？10. ASP刪除img標簽的style屬性只保留src的正則函數

排行榜

					
					教你如何寫出可維護的JS代碼
Django 解決由save方法引發的錯誤
axios和ajax的區別點總結
ASP刪除img標簽的style屬性只保留src的正則函數
css代碼優化的12個技巧
怎樣才能用js生成xmldom對象，并且在firefox中也實現xml數據島？
利用ajax+php實現商品價格計算
xml中的空格之完全解說
msxml3.dll 錯誤 800c0019 系統錯誤:-2146697191解決方法
使用Python和百度語音識別生成視頻字幕的實現
IDEA版最新MyBatis程序配置教程詳解