亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

php使用自帶dom擴(kuò)展進(jìn)行元素匹配的原理解析

瀏覽:91日期:2022-09-10 09:48:15

DOMDocument

php提供了非常好用的解析html和xml文檔的擴(kuò)展庫(kù)DOM,使用這個(gè)庫(kù)可以非常高效的進(jìn)行html和xml文檔的解析,它的原理就是通過(guò)尋找首尾匹配對(duì)來(lái)進(jìn)行文檔的解析。

從上面的分析可以看出,如果首位不匹配,可能就會(huì)導(dǎo)致一些錯(cuò)誤的出現(xiàn),因此,這個(gè)時(shí)候我們需要設(shè)置

libxml_use_internal_errors(true);

來(lái)進(jìn)行錯(cuò)誤的屏蔽,讓它可以解析整個(gè)文檔。

解析html基本用法

$dom = new DOMDocument;$content = htmlspecialchars_decode($content);libxml_use_internal_errors(true);$content = mb_convert_encoding($content, ’HTML-ENTITIES’, ’UTF-8’);$dom->loadHTML($content);

$content是要解析的html字符串,其中我們對(duì)它進(jìn)行了轉(zhuǎn)義,因?yàn)榭赡芎袑?shí)體集,然后我們有進(jìn)行了編碼的轉(zhuǎn)換,因?yàn)榭赡芪臋n不是utf-8格式的,會(huì)導(dǎo)致日文,法文等文字亂碼。

獲取元素

$a = $dom->getElementsByTagName(’a’);$p = $dom->getElementsByTagName(’p’);

遍歷元素

$elements = $dom->getElementsByTagName(’a’);foreach ($elements as $element) { $element->textContent = ’替換成其它的文字’;}

通過(guò)上面的循環(huán),可以將全部a標(biāo)簽的文字替換掉。

元素嵌套

有些時(shí)候,html會(huì)嵌套很多層,比如

<div><p><a href='http://www.aoyou183.cn/bcjs/xxx' rel='external nofollow' >我是文字</a></p><p>內(nèi)容替換</p></div>

如果我們想要對(duì)p標(biāo)簽文字進(jìn)行替換的化,并且不想要替換含有子元素的內(nèi)容,就是這里的a標(biāo)簽不想替換,下面的語(yǔ)句不能夠解決我們的問(wèn)題:

$elements = $dom->getElementsByTagName(’p’);foreach ($elements as $element) { if($element->hasChildNodes()){ $element->textContent = ’p標(biāo)簽內(nèi)容替換’; }}

上面的代會(huì)將a標(biāo)簽的內(nèi)容也替換掉,這不是我們想要的結(jié)果,因?yàn)閔asChildNodes()這個(gè)函數(shù)表示的含有內(nèi)容,無(wú)論它是標(biāo)簽還是文字,它都是返回true的,除非它是空標(biāo)簽,例如

它才會(huì)返回false.

所以我們需要自己封裝一個(gè)函數(shù)進(jìn)行檢查是否含有嵌套標(biāo)簽。

function hasChild($element, $tags){ foreach($tags as $v){ $elements = $element->getElementsByTagName($v); if($elements->length){ return true; } } return false;}$tags = array(’title’,’h1’,’h2’,’h3’,’h4’,’h5’,’a’,’p’,’dd’,’img’); $elements = $dom->getElementsByTagName(’p’);foreach ($elements as $element) { if(hasChild($element, $tags)){ $element->textContent = ’p標(biāo)簽內(nèi)容替換’; }}

通過(guò)我們自己封裝的函數(shù),就可以判斷出$dom的node節(jié)點(diǎn)是否含有子標(biāo)簽。

總結(jié)

到此這篇關(guān)于php使用自帶dom擴(kuò)展進(jìn)行元素匹配的文章就介紹到這了,更多相關(guān)php元素匹配內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: PHP
相關(guān)文章:
主站蜘蛛池模板: 国产成人一区 | 国产 日韩 在线 亚洲 字幕 中文 | 国产在线精品二区韩国演艺界 | 美女国产一区 | 激情视频亚洲 | 成人午夜影院在线观看 | 91最新免费地址入口 | 午夜成年女人毛片免费观看 | 国产一区二区三区不卡免费观看 | 色综合色综合色综合网址 | 日本一级大黄毛片免费基地 | 免费在线观看黄色的网站 | 黑人性视频做爰全过程视频 | 成人毛片免费 | 国产黄色的视频 | 成人黄 在线播放 | 色在线免费视频 | 日本精品视频在线观看 | 狠狠色噜噜狠狠狠狠狠色综合久久 | 美国一级毛片片aaa 美国一级毛片片aa久久综合 | 国产日韩线路一线路二 | 久久中文字幕网 | 国产精品三级一区二区 | 婷婷播放器 | 国产麻豆影院 | 久久黄色影片 | 我想看黄色一级片 | 777久久成人影院 | 丁香天堂网 | 182tv精品视频在线播放 | 亚洲国产成人精品小蝌蚪 | 美国黄色网 | 中文字幕在线播 | 久草视频在线看 | 国产一区二区三区四区五区tv | 国产成人成人一区二区 | 国产成人久久精品区一区二区 | 伊人色综合久久天天伊 | 欧美国产日韩精品 | 一级爱做片免费观看久久 | 香蕉视频免费在线看 |