文章詳情頁
python - 把<dl></dl>標簽包含進去如何拿到我想要的內容
瀏覽:79日期:2022-07-21 08:07:19
問題描述
1.我把<dl>標簽加進去拿到的是空內容,我該怎么寫匹配規則,不加<dl>標簽倒是可以拿到想要的內容2.問題代碼
pattern = re.compile(r’<dl>.*?<dd><a href='http://www.aoyou183.cn/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)
3.不把<dl>標簽加進去可以拿到想要的內容
4.附上網頁源代碼
<dl><dt>《明末工程師》正文</dt><dd><a href='http://www.aoyou183.cn/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>
問題解答
回答1:# 你可能需要加個模式# re.S 使 . 匹配包括換行在內的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='http://www.aoyou183.cn/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:
// /需要轉義下<dl>.*?<dd><a href='http://www.aoyou183.cn/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>
相關文章:
1. 我的html頁面一提交,網頁便顯示出了我的php代碼,求問是什么原因?2. 我在centos容器里安裝docker,也就是在容器里安裝容器,報錯了?3. node.js - node 客戶端socket一直報錯Error: read ECONNRESET,用php的socket沒問題哈。。4. django - 后臺返回的json數據經過Base64加密,獲取時用python如何解密~!5. 老哥們求助啊6. docker 17.03 怎么配置 registry mirror ?7. tp6表單令牌8. node.js - gulp文件監聽的問題9. 如何解決docker宿主機無法訪問容器中的服務?10. javascript - canvas 可以實現 PS 魔法橡皮擦的功能嗎?
排行榜
