PHP網(wǎng)頁(yè)UTF8編碼開(kāi)發(fā)中空白的問(wèn)題
開(kāi)發(fā)中一直沒(méi)辦法解決的一個(gè)問(wèn)題頁(yè)面采用UTF8編碼,頭部和尾部用了模板包含文件的方法,結(jié)果頭部和尾部無(wú)端端各多出一個(gè)約10px的空行,什么也沒(méi)有。原因是全部采用utf8編碼,包含文件的時(shí)候,最后的二進(jìn)制流中包含了多次UTF8 BOM標(biāo)記,IE不能正常解析包含多個(gè)UTF8 BOM 標(biāo)記的頁(yè)面,直接替換成實(shí)際顯示的回車,這樣導(dǎo)致一個(gè)空行,而firefox卻沒(méi)有這個(gè)問(wèn)題。故如果模板采用包含的方法包含多個(gè)utf8文件需要用ultraedit保存時(shí)另存為功能 選擇utf8 無(wú)bom格式保存即可。另外,如果中文頁(yè)面在html head標(biāo)記中將title標(biāo)記放在<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />前面會(huì)導(dǎo)致頁(yè)面空白。所以u(píng)tf8頁(yè)面應(yīng)該使用標(biāo)準(zhǔn)順序
<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ /><meta http-equiv=”content-language” content=”zh-CN” /><meta name=”robots” content=”index,follow” /><meta name=”keywords” content=”' /><meta name=”description” content=”' /><meta name=”rating” content=”general” /><meta name=”author” content=”' /><meta name=”copyright” content=”' /><meta name=”generator” content=”' /><title></title>
BOM頭:xEFxBBxBF,PHP4、5尚對(duì)BOM無(wú)視,所以在解析前直接輸出。對(duì)此 w3.org 標(biāo)準(zhǔn) FAQ 中對(duì)此問(wèn)題有一個(gè)專門的描述:
http://www.w3.org/International/questions/qa-utf8-bom
具體如下:
在UCS 編碼中有一個(gè)叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸字符”ZERO WIDTH NO-BREAK SPACE”。這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被稱作BOM。
UTF-8不需要BOM來(lái)表明字節(jié)順序,但可以用BOM來(lái)表明編碼方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開(kāi)頭的字節(jié)流,就知道這是UTF-8編碼了。
Windows就是使用BOM來(lái)標(biāo)記文本文件的編碼方式的操作系統(tǒng): WindowsXP Professional , 缺省字符集:中文
1) notepad : 可以自動(dòng)識(shí)別出沒(méi)有帶 bom 的 utf-8 編碼格式文件,但不可以控制保存文件時(shí)是否添加 bom , 如果保存文件,那么會(huì)統(tǒng)一添加 bom 。
2)editplus : 不能自動(dòng)識(shí)別出沒(méi)有 bom 的 utf-8 編碼格式文件,文件保存時(shí),選擇UTF-8 格式,不會(huì)在文件頭寫上 BOM header.
3) UltraEdit : 對(duì)于字符編碼的功能最為強(qiáng)大, 可以自動(dòng)識(shí)別帶 bom 和不帶 bom 的 utf-8 文件 (可以配置) ; 保存的時(shí)候可以通過(guò)配置選擇是否添加 bom.
(特別需要注意的是,保存一個(gè)新建立的文件時(shí),需要選擇另存為 utf-8 no bom 格式)
后來(lái)發(fā)現(xiàn) Notepad ++ 也對(duì)于 utf-8 bom 支持比較好,推薦大家使用。
