article_image

Adobe Acrobat 或 ABBYY FineReader Pro 或许是终极 OCR 工具,但如同越野车,大家都知道性能好,可真正买的人却不多。一般人更愿意使用 PDF 阅读器或文件管理工具中的 OCR 功能,而 DEVONthink 刚好内置了稍旧一些的 ABBYY OCR 引擎,堪称 OCR 处理中的 SUV:马力够,买得起,也用得起——意思是,性能最差的 MacBook Air 也跑得动。

但有个问题。DEVONthink 通常只能处理其数据库内的文件,最起码也要把文件索引(Index)到其库中,处理完再导出或者复制一份出去,导入导出频繁。而处理一份 PDF 文件并不意味着要永远将其存于 DEVONthink 数据库中。例如我每天收到少则几份、多则几十份的扫描版文件,大多需要转为可复制文本的版本,但绝大多数属于工作文件,用完就移到硬盘里归档,不会留在 DEVONthink 里。

此事令我介意很久,甚至一度想再买一个 ABBYY FineReader Pro,免得反复导入导出。^1理想情况下,OCR 应当成为复制粘贴一样的基础设施,在文件右键上下文菜单或 Finder 中有现成的按钮,点一下,即可就地 OCR——至少只有几页或十来页的小文件应当如此。

就像下图。易言之,我已经找到了用 DEVONthink 处理几乎任何 PDF 的方法。

Alt text
处理不在 DEVONthink 库中的文件
当然,还可以做成自动化动作,通过 LaunchBar、Keyboard Maestro 或 Shortcuts 启用,但只要掌握后文的原理,相信各位都能自己做出喜欢的自动化版本。

author_avatar

Lawyer, macOS/iOS Automation Amateur