java - 如何分割形如(operator arg1 arg2 ... argn)的字符串?
問(wèn)題描述
一個(gè)函數(shù)形如(operator arg1 arg2 ... argn)即操作符號(hào),參數(shù)1參數(shù)2一直到參數(shù)n。其中參數(shù)本身也可以是一個(gè)這樣格式的函數(shù)。比如這樣一串字符串String='(add (add 1 2) (mul 2 1) 2 )'要把它的操作數(shù)和參數(shù)分割出來(lái),即分割成
['add','(add 1 2)','(mul 2 1)','2']
這樣的字符數(shù)組,應(yīng)該如何分割?
目前我的做法是每次先把最外邊的括號(hào)去掉,然后想用空格分割字符串,可是這樣中間的空格也會(huì)成為要分割的地方。如果用正則表達(dá)式,因?yàn)槊恳粋€(gè)參數(shù)內(nèi)部還是可能嵌套括號(hào),這種情況應(yīng)該如何匹配呢?
問(wèn)題解答
回答1:前綴表示法, S-表達(dá)式,Lisp表達(dá)式
lisp的S-表達(dá)式是多層嵌套的樹(shù)形結(jié)構(gòu),比較接近抽象語(yǔ)法樹(shù)(AST)。
正則如果沒(méi)有遞歸語(yǔ)法的話,很難解析S-表達(dá)式。
下面是個(gè)python的簡(jiǎn)單例子,我做了注釋?zhuān)瑧?yīng)該很容易理解。
def parse_sexp(string): sexp = [[]] word = ’’ in_str = False #是否在讀取字符串 for char in string: # 遍歷每個(gè)字符if char == ’(’ and not in_str: # 左括號(hào) sexp.append([])elif char == ’)’ and not in_str: # 右括號(hào) if word:sexp[-1].append(word)word = ’’ temp = sexp.pop() sexp[-1].append(tuple(temp)) # 形成嵌套elif char in ’ nt’ and not in_str: # 空白符 if word:sexp[-1].append(word)word = ’’elif char == ’'’: # 雙引號(hào),字符串起止的標(biāo)記 in_str = not in_strelse: word += char # 不是以上的分隔符,就是個(gè)合法的標(biāo)記 return sexp[0]
>>> parse_sexp('(+ 5 (+ 3 5))')[(’+’, ’5’, (’+’, ’3’, ’5’))]>>> parse_sexp('(add (add 1 2) (mul 2 1) 2 )')[(’add’, (’add’, ’1’, ’2’), (’mul’, ’2’, ’1’), ’2’)]
S-expression
回答2:正則:
(s*w+(s+d+)+s*)|w+|d+
注意,此正則帶有Global參數(shù)
如果arg1, arg2, arg3, ... argn中嵌套(op arg ...)只有一層的話,可以用這個(gè)方法
相關(guān)文章:
1. javascript - npm下載的模塊不完整是什么問(wèn)題?2. java - Spring事務(wù)回滾問(wèn)題3. 正兒八經(jīng)地請(qǐng)教天蓬老師4. mysql優(yōu)化 - 關(guān)于mysql分區(qū)5. 求解改變某值6. MySQL數(shù)據(jù)庫(kù)服務(wù)器循環(huán)插入執(zhí)行速度慢7. node.js - 我想讓最后進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù),在前臺(tái)最先展示,如何做到?8. python 操作mysql如何經(jīng)量防止自己的程序在之后被惡意注入(說(shuō)白了就是問(wèn)一下python防注入的一些要點(diǎn))9. django進(jìn)行數(shù)據(jù)庫(kù)的查詢(xún)10. 剛放到服務(wù)器的項(xiàng)目出現(xiàn)這中錯(cuò)誤,有高手指點(diǎn)嗎
