Skip to content

RiddleMa/my_translator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

本代码实现两个功能,识别pdf文档文字,翻译为中文。具体操作如下:
1.替换file_path为要翻译的文件,修改trans_txt的tol参数为baidu或youdao,默认为baidu
2.运行程序,按照提示修改txt文件,规则如下:
人工修改:
段落中文本间不能有空行。造成这样可能的原因有:
    加粗、特殊字符【】等导致换行。
    换页导致空行。
    插入图表导致空行。
段落间文本保持至少一行的间距。
删除段落中存在的图表等多余字符。
3.修改完后键入enter继续程序,开始翻译
4.翻译完全后生成baidu/youdao后缀的txt

About

识别并翻译pdf文件

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages