文章詳情頁

Python 制作自動(dòng)化翻譯工具

瀏覽：68日期：2022-06-21 10:51:26

媽媽再也不用擔(dān)心我的英語了。

一個(gè)可能你似曾相識(shí)的場景

閱讀內(nèi)容包含大量英文的 PPT、Word、Excel 或者記事本時(shí)，由于英語不熟悉，為了流利地閱讀，需要打開瀏覽器進(jìn)入谷歌翻譯的主界面，然后把英文復(fù)制到谷歌翻譯的輸入框中，最后又把翻譯結(jié)果復(fù)制回 PPT、Word 和 Excel。

要是一個(gè)兩個(gè)單詞還好，要是發(fā)現(xiàn)有 100 個(gè)單詞不認(rèn)識(shí)，就必須復(fù)制粘貼 200 次，如此機(jī)械性重復(fù)性的工作，應(yīng)該交給程序來做，這就是我設(shè)計(jì)下面這個(gè)自動(dòng)化翻譯工具的初衷。

提升辦公效率的法寶

Python 制作自動(dòng)化翻譯工具

如上圖，運(yùn)行程序并保持后臺(tái)運(yùn)行，在電腦上的任何一個(gè)軟件中選擇一段文本，并 Ctrl + C 復(fù)制到系統(tǒng)剪貼板中，程序就會(huì)自動(dòng)幫助我們完成翻譯，并將翻譯結(jié)果自動(dòng)復(fù)制到系統(tǒng)剪貼版中，只需 Ctrl + V，就完成了翻譯結(jié)果對(duì)原文的替換。

編碼實(shí)現(xiàn)

程序主要分為兩部分，第一部分為谷歌翻譯爬蟲，第二部分就是實(shí)現(xiàn)這個(gè)將翻譯結(jié)果自動(dòng)替換的業(yè)務(wù)邏輯。

谷歌翻譯爬蟲

通過瀏覽器 F12 開發(fā)者工具，很容易定位到翻譯請(qǐng)求的 URL: http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss &dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2

這個(gè)請(qǐng)求接受兩個(gè)參數(shù)，一個(gè)就是我們要翻譯的字符串 q，另一個(gè)是用于用戶認(rèn)證的 tk(token),其中 q 很容易構(gòu)造，tk 的構(gòu)造就需要花費(fèi)一番心力了，需要我們調(diào)試 js 代碼，這里參考 Github 上大神的輪子： https://github.com/cocoa520/Google_TK

谷歌翻譯爬蟲的主要代碼如下:

def translate(tk, content): if len(content) > 4891:print('翻譯的長度超過限制！！！')return param = {’tk’: tk, ’q’: content} result = requests.get('''http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2''', params=param) data = result.json() print(data[0][0][0])

返回結(jié)果是 json 形式的，翻譯結(jié)果保存在結(jié)果的第一個(gè)元組中。

Python 操作系統(tǒng)剪貼板

將讀取剪貼板的內(nèi)容的代碼封裝成函數(shù)如下：

def getText():#讀取剪切板 # 打開剪貼板 w.OpenClipboard() # 讀取剪貼板的內(nèi)容 d = w.GetClipboardData(win32con.CF_TEXT) # 關(guān)閉剪貼板 w.CloseClipboard() try:return d.decode(’utf-8’) except:return d.decode(’gbk’)

返回值 d 是字節(jié)類型的，需要解碼，中文按 gbk 格式解碼，英文按 utf-8 解碼。

類似地，寫入剪貼板的代碼如下：

def setText(aString):#寫入剪切板 # 打開剪貼板 w.OpenClipboard() # 清空剪貼板 w.EmptyClipboard() # 寫入剪貼板 w.SetClipboardText(aString) # 關(guān)閉剪貼板 w.CloseClipboard()

實(shí)現(xiàn)將翻譯結(jié)果自動(dòng)替換原文的邏輯的代碼如下：

while(True):# 如果剪貼板正在被占用try: cs = getText()except: time.sleep(1) cs = getText()print(’cs’,cs)if cs and cs != ls: print(’準(zhǔn)備翻譯’) content = getText() tk = js.getTk(content) res = translate(tk, content) setText(res) time.sleep(1) ls = res

值得注意的是，系統(tǒng)剪貼板對(duì)象是單例模式的，在操作系統(tǒng)范圍內(nèi)只有一個(gè)，而且讀寫剪貼板都是互斥的，在讀（寫）剪貼板的同時(shí)不允許任何對(duì)剪貼板的寫（讀）操作。試想這樣一種情景，我們?cè)谄渌浖?Ctrl + C 寫入剪貼板，而此時(shí)我們的程序代碼正好執(zhí)行到讀剪貼板那一行，毫無疑問會(huì)報(bào)錯(cuò)，我的解決辦法是使用 try…except 語句延時(shí) 1 s再讀取，這樣可以大大降低讀寫碰撞的概率，但無疑消耗了程序性能。最好的辦法是判斷剪貼板對(duì)象句柄是否被占用，其實(shí)我一直在尋找是否存在判斷剪貼板對(duì)象句柄是否被占用的 API,但是一直沒有找到

項(xiàng)目地址

https://github.com/Python3Spiders/GoogleAutoTranslationTool

以上就是Python 實(shí)現(xiàn)自動(dòng)化翻譯和替換的腳本的詳細(xì)內(nèi)容，更多關(guān)于python 自動(dòng)化翻譯的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：python Task在協(xié)程調(diào)用實(shí)例講解下一條：python爬取新聞門戶網(wǎng)站的示例

相關(guān)文章：

1. 利用ajax+php實(shí)現(xiàn)商品價(jià)格計(jì)算2. 詳解idea中web.xml默認(rèn)版本問題解決3. JSP頁面實(shí)現(xiàn)驗(yàn)證碼校驗(yàn)功能4. jsp實(shí)現(xiàn)textarea中的文字保存換行空格存到數(shù)據(jù)庫的方法5. jsp EL表達(dá)式詳解6. asp知識(shí)整理筆記4（問答模式）7. ASP實(shí)現(xiàn)加法驗(yàn)證碼8. python selenium 獲取接口數(shù)據(jù)的實(shí)現(xiàn)9. java 優(yōu)雅關(guān)閉線程池的方案10. Python matplotlib 繪制雙Y軸曲線圖的示例代碼

排行榜

					
					IntelliJ IDEA配置Tomcat服務(wù)器的方法
IntelliJ IDEA設(shè)置自動(dòng)提示功能快捷鍵的方法
idea修改背景顏色樣式的方法
IntelliJ IDEA 統(tǒng)一設(shè)置編碼為utf-8編碼的實(shí)現(xiàn)
Python matplotlib 繪制雙Y軸曲線圖的示例代碼
python selenium 獲取接口數(shù)據(jù)的實(shí)現(xiàn)
ASP實(shí)現(xiàn)加法驗(yàn)證碼
asp知識(shí)整理筆記4（問答模式）
java 優(yōu)雅關(guān)閉線程池的方案
idea打開多個(gè)窗口的操作方法
利用ajax+php實(shí)現(xiàn)商品價(jià)格計(jì)算