如何用python寫(xiě)個(gè)模板引擎
本文講解如何使用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的模板引擎, 支持傳入變量, 使用if判斷和for循環(huán)語(yǔ)句, 最終能達(dá)到下面這樣的效果:
渲染前的文本:<h1>{{title}}</h1><p>十以內(nèi)的奇數(shù):</p><ul>{% for i in range(10) %} {% if i%2==1 %} <li>{{i}}</li> {% end %}{% end %}</ul>渲染后的文本,假設(shè)title='高等數(shù)學(xué)':<h1>高等數(shù)學(xué)</h1><p>十以內(nèi)的奇數(shù):</p><ul><li>1</li><li>3</li><li>5</li><li>7</li><li>9</li></ul>
要實(shí)現(xiàn)這樣的效果, 第一步就應(yīng)該將文本中的html代碼和類(lèi)似{% xxx %}這樣的渲染語(yǔ)句分別提取出來(lái), 使用下面的正則表達(dá)式可以做到:
re.split(r’(?s)({{.*?}}|{%.*?%}|{#.*?#})’, html)
用這個(gè)正則表達(dá)式處理剛才的文本, 結(jié)果如下:
在提取文本之后, 就需要執(zhí)行內(nèi)部的邏輯了. python自帶的exec函數(shù)可以執(zhí)行字符串格式的代碼:
exec(’print('hello world')’) # 這條語(yǔ)句會(huì)輸出hello world
因此, 提取到html的渲染語(yǔ)句之后, 可以把它改成python代碼的格式, 然后使用exec函數(shù)去運(yùn)行. 但是, exec函數(shù)不能返回代碼的執(zhí)行結(jié)果, 它只會(huì)返回None. 雖然如此, 我們可以使用下面的方式獲取字符串代碼中的變量:
global_namespace = {}code = '''a = 1def func(): pass'''exec(code, global_namespace)print(global_namespace) # {’a’: 1, ’func’: <function func at 0x00007fc61e3462a0>, ’__builtins__’: <module ’builtins’ (built-in)>}
因此, 我們只要在code這個(gè)字符串中定義一個(gè)函數(shù), 讓它能夠返回渲染后的模板, 然后使用剛才的方式把這個(gè)函數(shù)從字符串中提取出來(lái)并執(zhí)行, 就能得到結(jié)果了.
基于上面的思路, 我們最終應(yīng)該把html文本轉(zhuǎn)化為下面這樣的字符串:
# 這個(gè)函數(shù)不是我們寫(xiě)的, 是待渲染的html字符串轉(zhuǎn)化過(guò)來(lái)的def render(context: dict) -> str: result = [] # 這一部分負(fù)責(zé)提取所有動(dòng)態(tài)變量的值 title = context[’title’] # 對(duì)于所有的html代碼或者是變量, 直接放入result列表中 result.extend([’<h1>’, str(title), ’</h1>n<p>十以內(nèi)的奇數(shù):</p>n<ul>n’]) # 對(duì)于模板中的for和if循環(huán)語(yǔ)句,則是轉(zhuǎn)化為原生的python語(yǔ)句 for i in range(10): if i % 2 == 1: result.extend([’n <li>’, str(i), ’</li>n ’]) result.append(’n</ul>’) # 最后,讓函數(shù)將result列表聯(lián)結(jié)為字符串返回就行, 這樣就得到了渲染好的html文本 return ’’.join(result)
如何將html文本轉(zhuǎn)化為上面這樣的代碼, 是這篇文章的關(guān)鍵. 上面的代碼是由最開(kāi)始那個(gè)html demo轉(zhuǎn)化來(lái)的, 每一塊我都做了注釋. 如果沒(méi)看明白的話, 就多看幾遍, 不然肯定是看不懂下文的.
總的來(lái)說(shuō), 要渲染一個(gè)模板, 思路如下:
為了能夠方便地生成python代碼, 我們首先定義一個(gè)CodeBuilder類(lèi):
class CodeBuilder: INDENT_STEP = 4 def __init__(self, indent_level: int = 0) -> None: self.indent_level = indent_level self.code = [] self.global_namespace = None def start_func(self) -> None: self.add_line(’def render(context: dict) -> str:’) self.indent() self.add_line(’result = []’) self.add_line(’append_result = result.append’) self.add_line(’extend_result = result.extend’) self.add_line(’to_str = str’) def end_func(self) -> None: self.add_line('return ’’.join(result)') self.dedent() def add_section(self) -> ’CodeBuilder’: section = CodeBuilder(self.indent_level) self.code.append(section) return section def __str__(self) -> str: return ’’.join(str(line) for line in self.code) def add_line(self, line: str) -> None: self.code.extend([’ ’ * self.indent_level + line + ’n’]) def indent(self) -> None: self.indent_level += self.INDENT_STEP def dedent(self) -> None: self.indent_level -= self.INDENT_STEP def get_globals(self) -> dict: if self.global_namespace is None: self.global_namespace = {} python_source = str(self) exec(python_source, self.global_namespace) return self.global_namespace
這個(gè)類(lèi)作為字符串代碼的容器使用, 它的本質(zhì)是對(duì)字符串代碼的封裝, 在字符串的基礎(chǔ)上增加了以下的功能:
代碼縮進(jìn)CodeBuilder維護(hù)了一個(gè)indent_level變量, 當(dāng)調(diào)用它的add_line方法寫(xiě)入新代碼的時(shí)候, 它會(huì)自動(dòng)在代碼開(kāi)頭加上縮進(jìn). 另外, 調(diào)用indent和dedent方法就能方便地增加和減少縮進(jìn).
生成函數(shù)由于定義這個(gè)類(lèi)的目的就是在字符串里面寫(xiě)一個(gè)函數(shù), 而這個(gè)函數(shù)的開(kāi)頭和結(jié)尾都是固定的, 所以把它直接寫(xiě)到對(duì)象的方法里面. 值得一提的是, 在start_func這個(gè)方法中, 我們寫(xiě)了這樣三行代碼:
append_result = result.appendextend_result = result.extendto_str = str
這樣做是為了提高渲染模板的性能, 調(diào)用我們自己定義的函數(shù), 需要的時(shí)間比調(diào)用result.append或者str等函數(shù)的時(shí)間少. 首先對(duì)于列表的append和extend兩個(gè)方法來(lái)說(shuō), 每調(diào)用一次, python都需要在列表中的所有方法中找一次, 而直接把它綁定到我們自己定義的變量上, 就能避免python重復(fù)地去列表的方法中來(lái)找. 然后是str函數(shù), 理論上, python查找局部變量的速度比查找內(nèi)置變量的快, 因此我們使用一個(gè)局部變量to_str, python找到它的速度就比找str要快.
上面這段話都是我從網(wǎng)上看到的, 實(shí)際測(cè)試了一下, 在python3.7上, 運(yùn)行append_result需要的時(shí)間比直接調(diào)用result.append少了大約25%, to_str則沒(méi)有明顯的優(yōu)化效果.
代碼嵌套有的時(shí)候我們需要在一塊代碼中嵌套另外一塊代碼, 這時(shí)候可以調(diào)用add_section方法, 這個(gè)方法會(huì)創(chuàng)建一個(gè)新的CodeBuilder對(duì)象作為內(nèi)容插入到原CodeBuilder對(duì)象里面, 這個(gè)和前端的div套div差不多.
這個(gè)方法的好處是, 你可以在一個(gè)CodeBuilder對(duì)象中預(yù)先插入一個(gè)CodeBuilder對(duì)象而不用寫(xiě)入內(nèi)容, 相當(dāng)于先占著位置. 等條件成熟之后, 再回過(guò)頭來(lái)寫(xiě)入內(nèi)容. 這樣就增加了字符串代碼的可編輯性.
獲取變量調(diào)用get_globals方法獲取當(dāng)前字符串代碼內(nèi)的所有全局變量.
三.Template模板在字符串代碼的容器做好之后, 我們只需要解析html文本, 然后把它轉(zhuǎn)化為python代碼放到這個(gè)容器里面就行了. 因此, 我們定義如下的Template類(lèi):
class Template: html_regex = re.compile(r’(?s)({{.*?}}|{%.*?%}|{#.*?#})’) valid_name_regex = re.compile(r’[_a-zA-Z][_a-zA-Z0-9]*$’) def __init__(self, html: str, context: dict = None) -> None: self.context = context or {} self.code = CodeBuilder() self.all_vars = set() self.loop_vars = set() self.code.start_func() vars_code = self.code.add_section() buffered = [] def flush_output() -> None: if len(buffered) == 1:self.code.add_line(f’append_result({buffered[0]})’) elif len(buffered) > 1:self.code.add_line(f’extend_result([{', '.join(buffered)}])’) del buffered[:] strings = re.split(self.html_regex, html) for string in strings: if string.startswith(’{%’):flush_output()words = string[2:-2].strip().split()ops = words[0]if ops == ’if’: if len(words) != 2: self._syntax_error('Don’t understand if', string) self.code.add_line(f’if {words[1]}:’) self.code.indent()elif ops == ’for’: if len(words) != 4 or words[2] != ’in’: self._syntax_error('Don’t understand for', string) i = words[1] iter_obj = words[3] # 這里被迭代的對(duì)象可以是一個(gè)變量,也可以是列表,元組或者range之類(lèi)的東西,因此使用_variable來(lái)檢驗(yàn) try: self._variable(iter_obj, self.all_vars) except TemplateSyntaxError: pass self._variable(i, self.loop_vars) self.code.add_line(f’for {i} in {iter_obj}:’) self.code.indent()elif ops == ’end’: if len(words) != 1: self._syntax_error('Don’t understand end', string) self.code.dedent()else: self._syntax_error('Don’t understand tag', ops) elif string.startswith(’{{’):expr = string[2:-2].strip()self._variable(expr, self.all_vars)buffered.append(f’to_str({expr})’) else:if string.strip(): # 這里使用repr把換行符什么的改成/n的形式,不然插到code字符串中會(huì)打亂排版 buffered.append(repr(string)) flush_output() for var_name in self.all_vars - self.loop_vars: vars_code.add_line(f’{var_name} = context['{var_name}']’) self.code.end_func() def _variable(self, name: str, vars_set: set) -> None: # 當(dāng)解析html過(guò)程中出現(xiàn)變量,就調(diào)用這個(gè)函數(shù) # 一方面檢驗(yàn)變量名是否合法,一方面記下變量名 if not re.match(self.valid_name_regex, name): self._syntax_error(’Not a valid name’, name) vars_set.add(name) def _syntax_error(self, message: str, thing: str) -> None: raise TemplateSyntaxError(f’{message}: {thing}’) # 這個(gè)Error類(lèi)直接繼承Exception就行 def render(self, context=None) -> str: render_context = dict(self.context) if context: render_context.update(context) return self.code.get_globals()[’render’](render_context)
首先, 我們實(shí)例化了一個(gè)CodeBuilder對(duì)象作為容器使用. 在這之后, 我們定義了all_vars和loop_vars兩個(gè)集合, 并在CodeBuilder生成的函數(shù)開(kāi)頭插了一個(gè)子容器. 這樣做的目的是, 最終生成的函數(shù)應(yīng)該在開(kāi)頭添加類(lèi)似 var_name = context[’var_name’]之類(lèi)的語(yǔ)句, 來(lái)提取傳入的上下文變量的值. 但是, html中有哪些需要渲染的變量, 這是在渲染之后才知道的, 所以先在開(kāi)頭插入一個(gè)子容器, 并創(chuàng)建all_vars這個(gè)集合, 以便在渲染html之后把這些變量的賦值語(yǔ)句插進(jìn)去. loop_vars則負(fù)責(zé)存放那些由于for循環(huán)產(chǎn)生的變量, 它們不需要從上下文中提取.
然后, 我們創(chuàng)建一個(gè)bufferd列表. 由于在渲染html的過(guò)程中, 變量和html語(yǔ)句是不需要直接轉(zhuǎn)為python語(yǔ)句的, 而是應(yīng)該使用類(lèi)似 append_result(xxx)這樣的形式添加到代碼中去, 所以這里使用一個(gè)bufferd列表儲(chǔ)存變量和html語(yǔ)句, 等渲染到for循環(huán)等特殊語(yǔ)句時(shí), 再調(diào)用flush_output一次性把這些東西全寫(xiě)入CodeBuilder中. 這樣做的好處是, 最后生成的字符串代碼可能會(huì)少幾行.
萬(wàn)事具備之后, 使用正則表達(dá)式分割html文本, 然后迭代分割結(jié)果并處理就行了. 對(duì)于不同類(lèi)型的字符串, 使用下面的方式來(lái)處理:
html代碼塊只要有空格和換行符之外的內(nèi)容, 就放入緩沖區(qū), 等待統(tǒng)一寫(xiě)入代碼
帶的{{}}的變量只要變量合法, 就記錄下變量名, 然后和html代碼塊同樣方式處理
if條件判斷 & for循環(huán)這兩個(gè)處理方法差不多, 首先檢查語(yǔ)法有無(wú)錯(cuò)誤, 然后提取參數(shù)將其轉(zhuǎn)化為python語(yǔ)句插入, 最后再增加縮進(jìn)就行了. 其中for語(yǔ)句還需要記錄使用的變量
end語(yǔ)句這條語(yǔ)句意味著for循環(huán)或者if判斷結(jié)束, 因此減少CodeBuilder的縮進(jìn)就行
在解析完html文本之后, 清空bufferd的數(shù)據(jù), 為字符串代碼添加變量提取和函數(shù)返回值, 這樣代碼也就完成了.
四.結(jié)束最后, 實(shí)例化Template對(duì)象, 調(diào)用其render方法傳入上下文, 就能得到渲染的模板了:
t = Template(html)result = t.render({’title’: ’高等數(shù)學(xué)’})
以上就是如何用python寫(xiě)個(gè)模板引擎的詳細(xì)內(nèi)容,更多關(guān)于python寫(xiě)個(gè)模板引擎的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Android如何優(yōu)雅的處理重復(fù)點(diǎn)擊2. SpringBoot后端接口的實(shí)現(xiàn)(看這一篇就夠了)3. springboot全局字符編碼設(shè)置解決亂碼問(wèn)題4. ASP.NET MVC使用Session會(huì)話保持表單狀態(tài)5. 如何恢復(fù)docker容器數(shù)據(jù)6. CSS3實(shí)現(xiàn)動(dòng)態(tài)翻牌效果 仿百度貼吧3D翻牌一次動(dòng)畫(huà)特效7. opencv-python的RGB與BGR互轉(zhuǎn)方式8. 區(qū)分python中的進(jìn)程與線程9. python使用ProjectQ生成量子算法指令集10. 小區(qū)后臺(tái)管理系統(tǒng)項(xiàng)目前端html頁(yè)面模板實(shí)現(xiàn)示例
