文章詳情頁

使用python爬取taptap網站游戲截圖的步驟

瀏覽：46日期：2022-06-20 15:19:26

今天使用python寫了一個簡單的爬蟲，用來下載taptap網站的游戲截圖。下面說下具體的實現(xiàn)方法。

在搜索框中搜索“原神”

打開瀏覽器的開發(fā)者選項，從詳情按鈕里面跳轉到游戲的頁面，點擊詳情之后，跳轉頁面

使用python爬取taptap網站游戲截圖的步驟

這時候看到，瀏覽器地址：https://www.taptap.com/app/168332，tap官網的域名加上app/和圖一的游戲id，可以使用re模塊正則表達式模塊從接口中獲取到這個id

x_ua = ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’def search(game_name): '''根據游戲名搜索提取出游戲id''' url = ’https://www.taptap.com/webapiv2/mix-search/v1/by-keyword’ data = {’kw’: f’{game_name}’,’X-UA’ : x_ua# ’X-UA’: ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’ } r = requests.get(url=url, params=data) pattern = re.compile(’'type':'app','identification':'app:(.+?)'’, re.S) r1 = pattern.findall(r.text) #從response中提取游戲id return r1[0]

然后打開開發(fā)者選項觀察接口，可以從這個接口中獲取到游戲截圖的鏈接，

使用python爬取taptap網站游戲截圖的步驟

把數據json格式化一下，可以發(fā)現(xiàn)在data下，'screenshots'下的“orignal_url”就是截圖的鏈接。使用json.load轉換成字典，就可以比較方便的取出內容了。

使用python爬取taptap網站游戲截圖的步驟

url = f’https://www.taptap.com/webapiv2/app/v2/detail-by-id/{search(game_name)}’ r = requests.get(url=url, params={’X-UA’: x_ua}) data = json.loads(r.text) #轉換為字典格式 original_url = data.get(’data’).get(’screenshots’) #提取出截圖url

之后使用一個循環(huán)將圖片保存到本地

for i in original_url: time.sleep(0.5) game_original_url = i.get(’original_url’) print(game_original_url, type(game_original_url)) respones = requests.get(game_original_url) img = respones.content file_name = game_original_url[-36: -4] screenshots = os.path.join(os.path.dirname(__file__), f’screenshots/{game_name}’) if not os.path.exists(screenshots):os.makedirs(screenshots) file_path = os.path.join(screenshots, file_name) with open(file_path + ’.png’, ’wb’) as f:f.write(img)

完整代碼：

import osimport requestsimport jsonimport reimport timex_ua = ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’def search(game_name): '''根據游戲名搜索提取出游戲id''' url = ’https://www.taptap.com/webapiv2/mix-search/v1/by-keyword’ data = {’kw’: f’{game_name}’,’X-UA’ : x_ua# ’X-UA’: ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’ } r = requests.get(url=url, params=data) pattern = re.compile(’'type':'app','identification':'app:(.+?)'’, re.S) r1 = pattern.findall(r.text) #從response中提取游戲id return r1[0]def download_screenshots(game_name): url = f’https://www.taptap.com/webapiv2/app/v2/detail-by-id/{search(game_name)}’ r = requests.get(url=url, params={’X-UA’: x_ua}) data = json.loads(r.text) #轉換為字典格式 original_url = data.get(’data’).get(’screenshots’) #提取出截圖url try:for i in original_url: time.sleep(0.5) game_original_url = i.get(’original_url’) print(game_original_url, type(game_original_url)) respones = requests.get(game_original_url) img = respones.content file_name = game_original_url[-36: -4] screenshots = os.path.join(os.path.dirname(__file__), f’screenshots/{game_name}’) if not os.path.exists(screenshots):os.makedirs(screenshots) file_path = os.path.join(screenshots, file_name) with open(file_path + ’.png’, ’wb’) as f:f.write(img) except:print(’下載失敗’)if __name__ == ’__main__’: download_screenshots(’lol’)

以上就是使用python爬取taptap游戲截圖的步驟的詳細內容，更多關于使用python爬取taptap游戲截圖的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：python3 lambda表達式詳解下一條：用Python給圖像算法做個簡單應用界面

相關文章：

1. idea設置自動導入依賴的方法步驟2. ASP刪除img標簽的style屬性只保留src的正則函數3. css代碼優(yōu)化的12個技巧4. 利用ajax+php實現(xiàn)商品價格計算5. 教你如何寫出可維護的JS代碼6. IDEA版最新MyBatis程序配置教程詳解7. 使用Python和百度語音識別生成視頻字幕的實現(xiàn)8. idea不能自動補全yml配置文件的原因分析9. phpstudy apache開啟ssi使用詳解10. .NET SkiaSharp 生成二維碼驗證碼及指定區(qū)域截取方法實現(xiàn)

排行榜

					
					教你如何寫出可維護的JS代碼
ASP刪除img標簽的style屬性只保留src的正則函數
css代碼優(yōu)化的12個技巧
利用ajax+php實現(xiàn)商品價格計算
使用Python和百度語音識別生成視頻字幕的實現(xiàn)
IDEA版最新MyBatis程序配置教程詳解
idea設置自動導入依賴的方法步驟
idea不能自動補全yml配置文件的原因分析
CSS可以做的幾個令你嘆為觀止的實例分享
python pyppeteer 破解京東滑塊功能的代碼
IDEA JeeSite框架httpSession.invalidate()無效問題解決方案