亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:94日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 免费又黄又粗又爽大片 | 久久精品免费一区二区三区 | 国产精品爱久久久 | 国产图片一区 | 亚洲欧洲第一页 | 美国黄色一级毛片 | 黑人爆操 | 国产h视频| 国产自产v一区二区三区c | 国产成人精品福利色多多 | 日韩a级毛片 | 日韩精品一区二区三区中文字幕 | 国产精品尤物在线 | 国产成人精品综合在线 | 欧美曰韩一区二区三区 | 99久久国语露脸精品对白 | 一级待一黄aaa大片在线还看 | 亚洲最大激情中文字幕 | 久久日韩精品中文字幕网 | 一道本色 | 麻豆精品国产自产在线 | 国产精品日韩欧美久久综合 | 精品一区二区影院在线 | 国产精品合集一区二区 | 草草影视在线观看 | 一本一本久久a久久精品综合麻豆 | 欧美成人a级在线视频 | 中文字幕在线日韩 | 麻豆自拍| 午夜亚洲国产成人不卡在线 | 欧美日韩在线播放一区二区三区 | 人与鲁牲交持级毛片 | 毛片1 | 日日摸夜夜摸人人嗷嗷叫 | 久久久久久国产精品三级 | 日韩精品首页 | 欧美一级毛片日本 | 国产女人精品性视频 | 免费一看一级毛片人 | 免费岛国片 | 国产高清一级毛片在线人 |