亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python - 網頁title中包含換行,如何用正則表達式提取出來?

瀏覽:104日期:2022-06-28 10:07:00

問題描述

在用python做CSDN的網頁爬蟲,在爬取網頁title時,我一直用的正則表達式(?<=<title>).+?(?=<)在CSDN中用不了了,去CSDN源碼一看,title換行顯示了python - 網頁title中包含換行,如何用正則表達式提取出來?

所以導致原來的正則表達式無法使用,那么,問題來了,像這樣網頁title中包含換行,如何用正則表達式提取出來呢?

PS:

不想用xpath或beautifulsoup的方法,只需要正則哦

CSDN本身有反爬蟲機制,我并不是因為這個反爬蟲而爬不到title的哦

謝謝大家

參照@caimaoy 的方法,我將正則表達式改為 (?<=<title>)(?:.|n)+?(?=<)后,title完美提取。再次感謝大家。

問題解答

回答1:

re.M 多行模式

自己寫多行匹配 http://python3-cookbook.readt...

回答2:

表達式那邊加個flag吧

tite = ’......’print(re.findall(’(?<=<title>).+?(?=<)’, title, re.S))

標簽: Python 編程
主站蜘蛛池模板: 国产日韩欧美在线播放 | 国产在线拍小情侣国产拍拍偷 | 黄色网址免费看 | 国产第一页在线播放 | 色片免费在线观看 | 久久久国产亚洲精品 | 国产二区视频在线观看 | 亚洲精品国产免费 | 一级免费黄色大片 | 亚洲经典激情春色另类 | 亚洲一级免费毛片 | 中文字幕一区二区三区不卡 | 亚洲欧美日韩一级特黄在线 | 国产一区二区三区免费播放 | 午夜一区二区在线观看 | 日韩中文字幕电影 | 一级片在线免费播放 | 国内精品视频在线播放 | 99re热视频这里只有精品5 | 99re最新| 2021国产精品一区二区在线 | www.91在线播放 | 一级毛片在线播放 | 精品一区视频 | 好吊色综合网天天高清 | 一区二区三区不卡免费视频97 | 国产人成午夜免费噼啪视频 | 亚洲精品影院一区二区 | 好大水好多好爽好硬好深视频 | 伊人久久精品亚洲精品一区 | 手机看片日韩 | 国产98色在线 | 一级女人18毛片免费 | 欧美成人亚洲欧美成人 | 乱淫的女高中h | 成人精品第一区二区三区 | 黄色片国产 | 国产精品福利无圣光一区二区 | 日韩一区二区视频在线观看 | 日批网站在线观看 | 老子影院午夜伦不卡亚洲 |