Python爬蟲實現(xiàn)百度翻譯功能過程詳解
首先,需要簡單的了解一下爬蟲,盡可能簡單快速的上手,其次,需要了解的是百度的API的接口,搞定這個之后,最后,按照官方給出的demo,然后寫自己的一個小程序
打開瀏覽器 F12 打開百度翻譯網頁源代碼:
我們可以輕松的找到百度翻譯的請求接口為:http://fanyi.baidu.com/sug
然后我們可以從方法為POST的請求中找到參數(shù)為:kw:job(job是輸入翻譯的內容)
下面是代碼部分:
from urllib import request,parseimport jsondef translate(content): url = 'http://fanyi.baidu.com/sug' data = parse.urlencode({'kw':content}) # 將參數(shù)進行轉碼 headers = { ’User-Agent’: ’Opera/9.80 (Android 2.3.4; Linux; Opera Mobi/build-1107180945; U; en-GB) Presto/2.8.149 Version/11.10’ } req = request.Request(url,data=bytes(data,encoding='utf-8'),headers=headers) r = request.urlopen(req) # print(r.code) 查看返回的狀態(tài)碼 html = r.read().decode(’utf-8’) # json格式化 html = json.loads(html) # print(html) for k in html['data']: print(k['k'],k['v'])if __name__ == ’__main__’: content = input('請輸入您要翻譯的內容:') translate(content)
結果如下
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。
相關文章:
