網(wǎng)站制作NEWS
手把手教你用 Python 腳本調(diào)用 DeepL API Pro 進(jìn)電子書的行進(jìn)行中英文自動(dòng)翻譯
關(guān)于電子書中英文自動(dòng)翻譯的,確實(shí)是個(gè)有趣且實(shí)用的項(xiàng)目。本篇文章將分享一個(gè)使用Python腳本結(jié)合DeepL API Pro進(jìn)行電子書自動(dòng)翻譯的方法,旨在提供一種高效解決方案。
項(xiàng)目源自一位名為“xiaolai”的開發(fā)者,項(xiàng)目發(fā)布至今僅14天。通過此方法,處理一本約39萬字的中文譯本電子書,大約只需1.5小時(shí),包括格式編輯。這無疑展現(xiàn)了該工具的高效性。
首先,需要將電子書從Kindle設(shè)備導(dǎo)出,并利用ePubor進(jìn)行去DRM處理,隨后轉(zhuǎn)換為epub格式。從Amazon上購買電子書后,通過安裝老版本的Kindle App,使用鼠標(biāo)右鍵下載電子書,避免打開。接著,使用收費(fèi)軟件ePubor Ultimate移除DRM,將awz文件轉(zhuǎn)換為epub文件。之后,使用免費(fèi)軟件Calibre將epub文件轉(zhuǎn)換為htmlz壓縮包,便于后續(xù)處理。
選擇html格式作為翻譯對(duì)象,是因?yàn)樗茌^好保留書籍中的腳注、尾注及其鏈接,DeepL API支持xml標(biāo)簽處理,便于原格式保持。此外,html格式支持通過css自定義樣式,靈活性高,同時(shí)允許插入特定語言顯示函數(shù),如僅顯示中文文本。html文件轉(zhuǎn)換成任意格式電子書也較為方便。使用tag_handling="xml"參數(shù)后,DeepL API返回的譯文格式規(guī)整,保留所有html標(biāo)簽,且與原字符串相同,便于判斷翻譯情況。
為了清理html文件,可以使用BeautifulSoup模塊。該腳本主要工作包括去除不必要的標(biāo)簽、將特定標(biāo)簽單獨(dú)放置、處理樣式鏈接等,以優(yōu)化翻譯后的文本格式。通過調(diào)整路徑和文件名,該腳本可以高效處理html文件。
隨后,通過腳本逐行提交至DeepL API進(jìn)行翻譯。腳本支持指定開始和結(jié)束行進(jìn)行翻譯操作,以避免重復(fù)處理。在處理html文件后,執(zhí)行翻譯腳本,實(shí)現(xiàn)文本自動(dòng)化翻譯。
最后,結(jié)果展示部分通過圖像呈現(xiàn)翻譯前后對(duì)比,直觀展示了翻譯效果。完成程序運(yùn)行后,用戶可獲得所需翻譯的電子書。
總的來說,這篇文章介紹了使用Python腳本結(jié)合DeepL API Pro進(jìn)行電子書行中英文自動(dòng)翻譯的完整流程。該方法已被驗(yàn)證可行,適用于各種需求。鼓勵(lì)大家嘗試此方法,以提高工作效率。在面對(duì)需要自動(dòng)翻譯的場景時(shí),考慮調(diào)用此類API,或許能實(shí)現(xiàn)事半功倍的效果。
多重隨機(jī)標(biāo)簽