亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術(shù)文章
文章詳情頁

python爬蟲beautifulsoup解析html方法

瀏覽:20日期:2022-07-03 08:08:36

用BeautifulSoup 解析html和xml字符串

python爬蟲beautifulsoup解析html方法

實例:

#!/usr/bin/python# -*- coding: UTF-8 -*-from bs4 import BeautifulSoupimport re#待分析字符串html_doc = '''<html><head> <title>The Dormouse’s story</title></head><body><p class='title aq'> <b> The Dormouse’s story </b></p><p class='story'>Once upon a time there were three little sisters; and their names were <a rel='external nofollow' id='link1'>Elsie</a>, <a rel='external nofollow' id='link2'>Lacie</a> and <a rel='external nofollow' id='link3'>Tillie</a>; and they lived at the bottom of a well.</p><p class='story'>...</p>'''# html字符串創(chuàng)建BeautifulSoup對象soup = BeautifulSoup(html_doc, ’html.parser’, from_encoding=’utf-8’)#輸出第一個 title 標(biāo)簽print soup.title#輸出第一個 title 標(biāo)簽的標(biāo)簽名稱print soup.title.name#輸出第一個 title 標(biāo)簽的包含內(nèi)容print soup.title.string#輸出第一個 title 標(biāo)簽的父標(biāo)簽的標(biāo)簽名稱print soup.title.parent.name#輸出第一個 p 標(biāo)簽print soup.p#輸出第一個 p 標(biāo)簽的 class 屬性內(nèi)容print soup.p[’class’]#輸出第一個 a 標(biāo)簽的 href 屬性內(nèi)容print soup.a[’href’]’’’soup的屬性可以被添加,刪除或修改. 再說一次, soup的屬性操作方法與字典一樣’’’#修改第一個 a 標(biāo)簽的href屬性為 http://www.baidu.com/soup.a[’href’] = ’http://www.baidu.com/’#給第一個 a 標(biāo)簽添加 name 屬性soup.a[’name’] = u’百度’#刪除第一個 a 標(biāo)簽的 class 屬性為del soup.a[’class’]##輸出第一個 p 標(biāo)簽的所有子節(jié)點print soup.p.contents#輸出第一個 a 標(biāo)簽print soup.a#輸出所有的 a 標(biāo)簽,以列表形式顯示print soup.find_all(’a’)#輸出第一個 id 屬性等于 link3 的 a 標(biāo)簽print soup.find(id='link3')#獲取所有文字內(nèi)容print(soup.get_text())#輸出第一個 a 標(biāo)簽的所有屬性信息print soup.a.attrsfor link in soup.find_all(’a’): #獲取 link 的 href 屬性內(nèi)容 print(link.get(’href’))#對soup.p的子節(jié)點進行循環(huán)輸出 for child in soup.p.children: print(child)#正則匹配,名字中帶有b的標(biāo)簽for tag in soup.find_all(re.compile('b')): print(tag.name)

爬蟲設(shè)計思路:

python爬蟲beautifulsoup解析html方法

詳細手冊:

https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/

到此這篇關(guān)于python爬蟲beautifulsoup解析html方法 的文章就介紹到這了,更多相關(guān)beautifulsoup解析html內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 日韩三级小视频 | 久久精品国产免费观看99 | 东京不太热在线新视频 | 永久免费毛片在线播放 | 黄色免费看网站 | 日韩国产欧美在线观看一区二区 | 亚洲国产图片 | 国产精品高清视亚洲一区二区 | 国产亚洲一区二区在线观看 | 国产 日韩 在线 亚洲 字幕 中文 | 欧美黑人换爱交换乱理伦片 | pans写真福利视频在线 | 亚洲精品入口一区二区乱成人 | 在线视频自拍 | 香蕉在线观看视频 | 亚洲午夜日韩高清一区 | 亚洲精品久久婷婷爱久久婷婷 | 欧美日本一道免费一区三区 | 国产成人午夜性视频影院 | 欧美日韩国产综合视频一区二区三区 | 一区二区不卡在线观看 | 国产麻豆媒一区一区二区三区 | 日韩中文字幕在线 | 国产日本韩国 | www.香蕉视频.com | 精品国产精品国产 | 中国黄色毛片视频 | 成人做爰视频在线观看视频 | 一级人做人a爰免费视频 | 毛片在线网 | 一级毛片真人免费观看 | 俄罗斯aa毛片极品 | 亚洲免费专区 | 亚洲黄色在线播放 | 一级黄色片免费的 | 亚洲欧洲日产国码二区在线 | 亚洲一区欧美日韩 | 韩国免费高清一级 | 美日韩在线 | 欧美精品hdxxxxx | 国产日韩欧美视频在线观看 |