亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:100日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 在线观看黄网址 | 国产足控福利视频入口 | 免费区一级欧美毛片 | 国产日本亚洲 | 国产线路一| 成人欧美1314www色视频 | 小色片| 最新亚洲一区二区三区四区 | 免费国产成人午夜在线观看 | 韩国特黄毛片一级毛片免费 | 中文字幕无线码欧美成人 | 久草手机在线观看视频 | 中文字幕无线码欧美成人 | 国产1024一区二区你懂的 | 午夜视频网址 | 国产草草视频 | 欧美日韩永久久一区二区三区 | 国产精品分类视频分类一区 | 久久一本日韩精品中文字幕屁孩 | 青青伊人91久久福利精品 | 九九九在线视频 | 国产一区二区三区波多野吉衣 | 美乳在线播放 | 久久综合国产 | 日本黄网站 | 一区二区三区毛片免费 | 成a人片在线观看 | 中日韩国语视频在线观看 | 国产成人精品s8p视频 | 日韩毛片网| 成人国内精品久久久久影院 | 色琪琪原网站亚洲香蕉 | 精品日韩欧美国产一区二区 | 亚洲精品a | 开心午夜婷婷色婷在线 | 日韩中文字幕a | 亚洲网站黄色 | 国产好大好爽久久久久久久 | 日韩欧美在线观看视频 | 国产精品不卡高清在线观看 | 亚洲黄色在线 |