文章詳情頁

python爬取”頂點小說網“《純陽劍尊》的示例代碼

瀏覽：24日期：2022-07-08 09:42:02

爬取”頂點小說網“《純陽劍尊》

代碼

import requestsfrom bs4 import BeautifulSoup# 反爬headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36’}# 獲得請求def open_url(url): response = requests.get(url, headers=headers) response.encoding = response.apparent_encoding html = response.text return html# 提取標題def get_title(url): soup = BeautifulSoup(url, ’lxml’) title_tag = soup.find(’dd’) title = ’n’ + title_tag.h1.get_text() + ’n’ return title# 提取文本def get_texts(url): soup2 = BeautifulSoup(url, ’lxml’) text_tags = soup2.find_all(’dd’, id='contents') return text_tags# 保存標題def save_title(filename, title): with open(filename, ’a+’, encoding=’utf-8’) as file: file.write(title)# 保存文本def save_text(filename, text): with open(filename, ’a+’, encoding=’utf-8’) as file: file.write(text)# 主程序函數def main(): num = input(’《純陽劍尊》你想要下載第幾章？（1-802）’) num = int(num) number = 8184027 + num url = ’https://www.23us.so/files/article/html/15/15905/’ + str(number) + ’.html’ filename = ’純陽劍尊.txt’ r = open_url(url) title = get_title(r) tags = get_texts(r) save_title(filename, title) for text_tag in tags: text = text_tag.get_text() + ’n’ save_text(filename, text) print(’第{}章已經下載完成！’.format(num))if __name__ == ’__main__’: main()

爬取結果：

python爬取”頂點小說網“《純陽劍尊》的示例代碼

以上就是python爬取”頂點小說網“《純陽劍尊》的示例代碼的詳細內容，更多關于python 爬取頂點小說網的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：Python通過getattr函數獲取對象的屬性值下一條：Python使用內置函數setattr設置對象的屬性值

相關文章：

1. 每日六道java新手入門面試題,通往自由的道路第二天2. 讓chatgpt將html中的圖片轉為base64方法示例3. python b站視頻下載的五種版本4. 測試模式 - XSL教程 - 55. python迭代器自定義類的具體方法6. 手把手教你用python發送短消息(基于阿里云平臺)7. 教你JS更簡單的獲取表單中數據(formdata)8. python如何寫個俄羅斯方塊9. Python結合百度語音識別實現實時翻譯軟件的實現10. 《CSS3實戰》筆記--漸變設計（一)

排行榜

					
					讓chatgpt將html中的圖片轉為base64方法示例
《CSS3實戰》筆記--漸變設計（一)
教你JS更簡單的獲取表單中數據(formdata)
python如何寫個俄羅斯方塊
JavaScript設計模式之策略模式實現原理詳解
測試模式 - XSL教程 - 5
如何通過vscode運行調試javascript代碼
使用SpringBoot自定義starter詳解
python b站視頻下載的五種版本
PHP設計模式（四）原型模式Prototype實例詳解【創建型】
手把手教你用python發送短消息(基于阿里云平臺)