Linux下安装ocrmypdf工具

1. 简介

OCRmyPDF 工具通过 OCR 技术扫描出 PDF 文件中的文字部分,可将不可复制的 PDF 文件(扫描版)转换为可复制的 PDF 文件(文字版)。除此之外,OCRmyPDF 还有诸如 PDF 渲染、优化等功能。最重要的是,OCRmyPDF 是开源免费的。

2. 安装

OCRmyPDF 工具在 Windows 和 Linux 上都可以安装使用,详细参见 OCRmyPDF 官方手册

3. 使用

示例:

  • 将扫描版 inputfile.pdf 转为可复制的文字版 outputfile.pdf
1
ocrmypdf inputfile.pdf outputfile.pdf