文章詳情頁

正則表達式 - 請問用 Python 如何匹配漢語拼音？

瀏覽：135日期：2022-06-30 09:24:43

問題描述

比如用正則表達式匹配出 shá 這個拼音。 ps:之前說的可能不明確，我用了 “ 比如 ” 兩字哈，就是待處理文本里有拼音，但是不知道具體拼音是什么，需要找出這些拼音，待處理文本會有中文、拼音、符號（，。：之類的），所以請不要回答諸如re.search(u’shá’,text) 要正則哈，不是簡單固定的字符串。。。

問題解答

回答1：

import reregex = re.compile(r’b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńň?ɑɡ]+[a-z]*b’)text = 'Thǐs ís à pìnyin abóut shá'm = regex.findall(text)print(m)

匹配結果：[’ís’, ’à’, ’pìnyin’, ’abóut’, ’shá’]沒有匹配第一個Thǐs，因為默認拼音都是小寫，排除了大寫。

回答2：

你是要匹配所有合法的拼音嗎？

如果是，你去找個字典的拼音索引，把里邊的所有拼音全部 | 到一起就可以了。也只能這樣，因為拼音不是根據正則，或者其它某種機械的規則定義出來的。你想不漏又不多就只能這樣了，反正也沒多少個。

回答3：

>>> import re>>> d=’shá’>>> data=’This is a pinyin about shá’>>> re.search(d,data)<_sre.SRE_Match at 0x404e308>

Python 編程

上一條：python - 我該怎么寫正則?下一條：python - pyqt 調用tablewidget窗口時無法顯示窗口內容

相關文章：

1. mysql - 請問數據庫字段為年月日，傳進的參數為月，怎么查詢那個月所對應的數據2. node.js - win 下 npm install 遇到了如下錯誤會導致無法 run dev么？3. javascript - 我的站點貌似被別人克隆了， google 搜索特定文章，除了域名不一樣，其他的都一樣，如何解決？4. 求救一下，用新版的phpstudy，數據庫過段時間會消失是什么情況？5. [python2]local variable referenced before assignment問題6. Python2中code.co_kwonlyargcount的等效寫法7. html - 移動端radio無法選中8. php - 微信開發驗證服務器有效性9. javascript - vue+iview upload傳參失敗跨域問題后臺已經解決仍然報403，這是怎么回事??？10. mysql - 如何在有自增id的情況下，讓其他某些字段能不重復插入