網(wǎng)站制作NEWS
手把手教你用 Python 腳本調用 DeepL API Pro 進電子書的行進行中英文自動翻譯
關于電子書中英文自動翻譯的,確實是個有趣且實用的項目。本篇文章將分享一個使用Python腳本結合DeepL API Pro進行電子書自動翻譯的方法,旨在提供一種高效解決方案。
項目源自一位名為“xiaolai”的開發(fā)者,項目發(fā)布至今僅14天。通過此方法,處理一本約39萬字的中文譯本電子書,大約只需1.5小時,包括格式編輯。這無疑展現(xiàn)了該工具的高效性。
首先,需要將電子書從Kindle設備導出,并利用ePubor進行去DRM處理,隨后轉換為epub格式。從Amazon上購買電子書后,通過安裝老版本的Kindle App,使用鼠標右鍵下載電子書,避免打開。接著,使用收費軟件ePubor Ultimate移除DRM,將awz文件轉換為epub文件。之后,使用免費軟件Calibre將epub文件轉換為htmlz壓縮包,便于后續(xù)處理。
選擇html格式作為翻譯對象,是因為它能較好保留書籍中的腳注、尾注及其鏈接,DeepL API支持xml標簽處理,便于原格式保持。此外,html格式支持通過css自定義樣式,靈活性高,同時允許插入特定語言顯示函數(shù),如僅顯示中文文本。html文件轉換成任意格式電子書也較為方便。使用tag_handling="xml"參數(shù)后,DeepL API返回的譯文格式規(guī)整,保留所有html標簽,且與原字符串相同,便于判斷翻譯情況。
為了清理html文件,可以使用BeautifulSoup模塊。該腳本主要工作包括去除不必要的標簽、將特定標簽單獨放置、處理樣式鏈接等,以優(yōu)化翻譯后的文本格式。通過調整路徑和文件名,該腳本可以高效處理html文件。
隨后,通過腳本逐行提交至DeepL API進行翻譯。腳本支持指定開始和結束行進行翻譯操作,以避免重復處理。在處理html文件后,執(zhí)行翻譯腳本,實現(xiàn)文本自動化翻譯。
最后,結果展示部分通過圖像呈現(xiàn)翻譯前后對比,直觀展示了翻譯效果。完成程序運行后,用戶可獲得所需翻譯的電子書。
總的來說,這篇文章介紹了使用Python腳本結合DeepL API Pro進行電子書行中英文自動翻譯的完整流程。該方法已被驗證可行,適用于各種需求。鼓勵大家嘗試此方法,以提高工作效率。在面對需要自動翻譯的場景時,考慮調用此類API,或許能實現(xiàn)事半功倍的效果。
多重隨機標簽