article_image

注:本系列文章专卖湿货,以期提供更多真实案例,调动读者兴趣,而技术细节可以参考引用的文章。其实写这一系列文章,也是因为以前的干货内容多被埋藏于时间线里,希望能够用讲故事的方式盘活旧资源。

北美软件市场和大陆至少差了一到两个世代。那些在 YouTube 上侃侃而谈新技术的家伙,不乏满脸落腮胡的大叔,甚至满头银丝的老爷爷。这种景象在大陆无法想象。

代际差异带来了巨大的信息差,尤其是那些在北美热销多年的老牌效率软件,要么就是被某些厂商一比一像素级别抄袭后转销国内1,要么就是在一批不懂装懂的互联网小编文章里被吹捧为效率神器、葵花宝典、屠龙心法。

DEVONthink 也是前述信息差的受害者之一。固然,那些近年发家的时髦软件在国内曝光率不错,大家的认知和老外差不多在同一起跑线上,但是像 DEVONthink 这样的老牌软件,至今仍然深受早期传销文章之荼毒。在最近十年的中文互联网上,关于 DEVONthink 的介绍总是过犹不及,而当你拷问那些作者他们究竟用 DEVONthink 做了什么时,一部分人只能老老实实承认只是写毕业论文时临时用了几个月2,还有一批人则是用 DEVONthink 搭建色情影片数据库,在深夜享受犹如古代皇帝去后宫翻牌子的独特趣味。3

我曾经也浅浅地介绍过 DEVONthink,但至少有一点很幸运:我并没有在应届生精神崩溃或者中年危机的状态之下介绍它,而当年粗略勾勒出的认知轮廓,在正式工作之后逐渐清晰明朗。在从事法务和律师工作的几年里,我与 DEVONthink 高强度搭档,用它搭建个人资料库并获益良多。这篇文章将从真实的法律工作切入,希望能够为中国互联网增加一则真实可靠的 DEVONthink 使用案例。

什么时候需要 DEVONthink

不同于介绍一般的工具,DEVONthink 毕竟是一款文件管理工具,甚至有人把它作为 Finder 替代品。如果一上来就不分青红皂白推荐大家把身家性命交给 DEVONthink,万一最后发现作者的使用场景与读者八字不合,那岂不是耽误人?

易言之,介绍 DEVONthink 者有责任先划定一个较小的范围,就某一类文件实话实说。而我的回答,其实在当年的那篇《库管理工具:DEVONthink》中就非常明确了——你不应该把所有文件都放在 DEVONthink 中,只有那些相对专业的工作、Finder 应付不了的,才有必要求诸 DEVONthink。在 DEVONthink 论坛和国外博客上,有人用它搭建摄影素材库,有人用它搭建视频资源库,更多的人用它整理学术资料,而我则用它来搭建法律数据库,收集、整理并为参考资料编目。4

借用一下早年那篇文章的比喻,如果说整台电脑就像一栋房子,那么 DEVONthink 就像是专用的书房或者工作室。如果工作并不繁重,那么在餐厅或者卧室里——即 Finder——也可以就地开工,但是如果工作过于复杂,自然就需要专门空间。无论是视觉上、技术上还是心理感受上,DEVONthink 都提供了独立于 Finder 的工作空间——空间(Space),就是 DEVONthink 在数字世界中的定位。

注:很多人购买 DEVONthink 的一个现实原因是它提供了移动版本,虽然功能有限,但是至少可以作为文件浏览器,在手机和平板电脑上查看一些 Files 无法打开的特殊格式。一言以蔽之,DEVONthink 就像一把瑞士军刀,每个功能可能都不是特别好,但对于不满足 Finder 的人来说,它是很好的通用工具。不过我本人很少在手机上处理工作,并且很多年没有用过平板电脑,故本文不会介绍 DEVONthink To Go。

但是,仅仅指出 DEVONthink 适合处理专业工作,也还是过于模糊,就以法律工作来说,难道所有与之搭边的文件都要放在 DEVONthink 里面吗?绝非如此。我早年的文章已经初步摸到了方向:

周期长、重积累,绝不是不是用完就丢、日后找不着得到都无所谓的文件。很大程度上,DEVONthink 发挥了书房或资料库的作用,给一批需要长期使用、日积月累的文件提供了容身之所。

Alt text
DEVONthink 法律资料库

工作过一段时间的读者——或者读书时就用心整理文件的读者——不难发现,文件可以粗略划分为横向和纵向两类。一类是随着工作进行不断产生的项目文件,另一类则是时间属性并不强烈的参考资料,他们就像是现实世界中的档案柜和图书馆。5

DEVONthink 更擅长整理长期资料,而不是囤积项目文件。一部分原因是使用习惯上的。项目文件很可能在归档之后就不再打开,不少律师事务所就要求为每个项目留一份程序性资料和办案报告,而完整的过程性文件一般没必要也吃不消留在电脑上——是在太多太大了。除非翻案,没人会再去看。

另一部分原因纯粹是技术上的:项目文件很容易瞬间爆炸,增加电脑压力,而在 DEVONthink 中,压力又翻了好几倍。不知道你有没有发现,每次重启电脑后,硬盘上都会多出少则几个GB多则十几个GB的空间,这些被清理掉的文件就是缓存文件。很不凑巧,DEVONthink 也是缓存文件生产大户。而项目文件往往不可控,例言之,有一次办建设工程案件,当事人给了我一个压缩包,打开后像潘多拉魔盒一样刷刷蹦出几万个设计图、源代码、财务表……如果把这些文件放在 DEVONthink 中6,估计配置最好的电脑也吃不消吧。

一句话,DEVONthink 更像是一间图书馆或资料阅览室,而不是流水文件的停尸间。

从 PDF 起步:OCR 一条龙处理

DEVONthink 功能琳琅满目,即便是放在官网上当作卖点者,也让人应接不暇。不过从法律工作的角度切入,却很好取舍:搞法律的人总是苦于 PDF 文件,而 DEVONthink 恰为集中式 PDF 处理中枢。而在关于 PDF 的种种功能中,最紧迫、最靠前也最硬核的便是 OCR(光学字符识别)。随着 Apple 为首的一帮厂商大力推广这种从屏幕上随意抓取文字的魔法,大家想必已经对 OCR 见惯不怪。不过,以整本 PDF 为单位的 OCR,仍然需要专业扫描工具。7

在我的工作中,大量地方性规范文件都是扫描版 PDF,甚至只是几张图片,上面的文字根本没法复制。而在某个地区办案时,这些红头文件很可能才是最具体的参考依据。为此,我一般都会把扫描版 PDF 转成带文字图层的版本,方便复制文本,同时也保留原始排版,可以随时和原件核对——识别难免会有错漏和错别字,而法律文件差之毫厘谬以千里。

DEVONthink 内置的引擎来自 ABBYY,抛开足够让多数人皱眉头的 Adobe 不说(太贵),ABBYY 大概是唯一选择。DEVONthink OCR 设置中有一些基础参数,我主要调整分辨率,在体积和清晰度之间取个平衡,希望文件不要太大,但也不要太模糊而影响阅读。DEVONthink 还可以在识别完成后运行任何自定义操作,但我已经有了其他文件自动化工具,暂时没有什么相关经验可以分享。8

Alt text
比较实用的 OCR 参数设置

但实话实说,DEVONthink 外挂的 OCR 引擎并非最新版本,虽然缺乏客观数据,但估计和官方还是有所差距。不过,只要扫描的文件本身清晰度不要太差或者扭曲别太严重,以我扫过的几千个文件来看,似乎也没遇到过错字。

除了红头文件,各种扫描版理论书籍、实务指南以及论文9,我也都会放到 DEVONthink 里面识别一遍。在法国烹饪界有个术语 Mise en place,意思是在正式烹饪前要先把食材和工具都备好,不准备妥当就不开工。OCR 堪称处理 PDF 前的 Mise en place。

话说回来,在谈论任何一款软件时,最好先明确要处理的数据是何种类型,就像在介绍一把日本料理刀或者西餐刀时,如果连打算切是面包还是牛骨都不知道,那么接下来的讨论又有什么意义呢?很不幸,中文互联网上大多数关于 DEVONthink 的讨论都是这种在空气中挥舞菜刀同时大赞刀刃锋利的滑稽剧。

即刻预览与即刻编辑

DEVONthink 自称文件管理工具或信息管理工具,不过更朴实的称谓或许是“文件浏览器”(File Browser)。浏览者,不仅是手指匆匆扫过书脊式的蜻蜓点水,也包括驻足某处,翻开文件扫视几眼。Finder 凭着 Quick Look 帮忙,积攒了良好的预览口碑,但是 DEVONthink 更胜一筹:你不仅不点开文件就查看其内容,还能轻度编辑。

例如,同样一份 Markdown 文件,在 Finder 中仅能显示开头部分的文本,并且无法选中、无法复制10,而 DEVONthink 中的 Markdown 文件都可以即刻编辑。PDF 也一样,可以随时批注,仿佛是坐在自己的书房里,想到什么提笔就写。

Alt text
DEVONthink 中的 PDF 文件随时可以批注

目前,在 DEVONthink 中“立等可读”的文件类型有 PDF、Markdown、CSS、HTML、Webarchive、RTF、CSV 和 TSV 等等,Scapple 等私有格式也能预览。

深度链接,打通诸器

“体系”“库”等称谓意味着文件不是简单堆放,而是相互关联。在技术层面上,最重要的关联方式就是各种链接,尤其是直达目的地的深度链接。链接并不新鲜,只是在近几年双向链接笔记的浪潮把链接推回风口,甚至有一批老外在搞宣言做软件,好不热闹。

DEVONthink 历来深耕链接,支持文件种类足够多,并且颗粒度足够细。 诸如打开数据库中的任何一个文件这种初级链接,自不在话下。更进一步,若是 PDF 文件,DEVONthink 还可以打开特定页面;换作视频或音频文件,DEVONthink 则可以精确跳到某一秒。

每次办理案件,我都会积累一些新案例和说理,要回过头去给法条写点评注、做些笔记——毕竟就像法律界的老话所言,法律上的每一个字你都看得懂,但是你很可能不知道它在说什么,否则也就不需要那么多律师和法官了——而法律诠释必须面对原文11,此时就少不了高精度的链接,只需点击一次,就可以找到原始资料,前后核对避免记忆出错。下图截自笔记软件 FSNotes,其中的文件同时也索引到 DEVONthink,两个工具各司其职,分别负责快速记录和统一检索。

Alt text
在笔记中插入 DEVONthink 链接

很多资料并不需要全文引用,比如最高人民法院整理出版的案例集,厚厚一本,但通常只用到其中一两则,此时高精度的深度链接就派上了用场:据以打开 PDF 文件中的任何一个案例或者翻到规范性文件的任何一个条款。

Alt text
为某一类型的案件编辑参考资料索引

在 DEVONthink 内部生成和插入链接就更方便了,只需按下快捷键 ⌃Control-⌘Command-E——DEVONthink 的快捷键太多而不好记,建议用 Keyboard Maestro 等工具自己改——就能弹出文件搜索框,确定目标后按一下回车键,链接就落在当前光标处。每办一个新类型的案子,我都会制作参考资料索引,汇编相关法律、法规、规章、案例以及学者观点,做成参考资料清单并附链接,日后再遇类似模式的案件,就把参考资料翻出来,如同手握通关地图。

脚本自动化和批量搜索

前几节介绍种种现成功能,类似者甚多,不遑多论。必须指出,DEVONthink 并不是现成功能大杂烩,它还提供文件自动化(smart rules)并支持 AppleScript,这些进阶功能令其从瑞士军刀一跃成为万能工具箱:凭着现成零件,总能够搭建出个性化的工作流。

既然这篇文章介绍律师工作,请容许我展示一个门槛较高但很有代表性的例子——批量检索。上一节提到,我编辑了不少参考文件索引,尽管如此,日后搜索时若要逐个打开里面列出的文件,工作量还是让人却步。我进而编写了一个批量检索脚本,可以识别当前索引文件中提及的全部文件,然后批量打开、统一搜索。

Alt text
批量检索

以法律法规等规范性文件为例,我预先将其转换为方便搜索的纯文本(Markdown 格式),方便统一检索——而传统的 Word 文档就彻底没辙了。

衍生阅读:《为什么,以及如何深度搜索 DEVONthink 文件清单内的所有文件》

这类高度定制化的功能,基本不能指望开发商。上文提及的批量搜索功能,在我印象中就只有另一款天价搜索软件 FoxTrot Search 勉强能为之,然而它也不如 DEVONthink 灵活:FoxTrot 需要手动划定搜索范围,而 DEVONthink 则可以——在脚本的借助下——自动瞄准当前文件中提到的资料。

开发商真正需要解决的,是那些用户没有明说但是也没有被满足的需求。尽管理论上没有这种肚中蛔虫般的开发商,但 DEVONthink 的工具箱式布局,至少给了一个起点。

重返 DEVONthink 必要性之问

尽管在工作中高强度使用 DEVONthink,我对它还是有一些保留意见。这类思考不仅是我个人的,而是多数 DEVONthink 进阶用户都会遇到的一道坎:DEVONthink 究竟是不是 just another file manager?早在十多年前,就有职业作家意识的 DEVONthink 有很多功能和 Finder 重叠。在大多数情况下,DEVONthink 都像是一个增强版的文件浏览器,进而变成“多余的代码层”,令人尴尬。

本文前几节算是对陈年诘问的回应:DEVONthink 是数字世界中的专业工作间或专用书房,而不是单纯堆砌功能的博物馆或杂物间。

但是我也不得不考虑未来。DEVONthink 确实把我绑住了,尤其是散落在笔记中的成千上万个深度链接,假如有一天 macOS 像 iPhone 那样被禁止带入敏感场合12,那对我的数据库将是致命打击。我不可能再把贯穿着 DEVONthink 链接的文件迁移到 Windows 电脑上,那不如从零开始另起炉灶。不管是未雨绸缪还是杞人忧天,我已经着手制作与软件解耦的深度链接,一步一步连上文件PDF视频。目前发表的文章均以 Keyboard Maestro 为轴,但我已经全部实现了 Shortcuts 版本,并在 Windows 和 Linux 上移植成功——毕竟,我设计的是通用方法,而不囿于具体实现。

链接依赖是实实在在的技术问题,而习惯上的影响则更为深远。若是将各个功能挑出来单打独斗,恐怕 DEVONthink 连一个回合都撑不下来,但偏偏是一种德国学究式的功能集合,让多数严肃做事的人和 DEVONthink 一见如故:深度链接、文件自动化、即时预览和编辑、PDF 处理……DEVONthink 刚好填上那些 Finder 的致命缺口。长此以往,容易将把原本分散的功能当作自然的集合,忽略了轻型工具和用户自动化的可能——虽说这是使用者的问题,而不是 DEVONthink 的。只是在有点近乎新兴宗教的 Roam Research、Notion 以及 Obsidian 用户那里,我们看到了更严重的大一统意识形态,或许在(未经思考的)整体论之外,还需要考虑更加透彻的还原论。

话说回来,我开始使用 DEVONthink 那会儿确实也是临阵磨枪,哪有什么文件体系可言,还不是一头扎进正式工作,一边打官司、一边读材料、一边慢慢回过来填补文件系统。事后回想起来,很多事情肯定能够找到更好的工具,然而 DEVONthink 至少没有怎么掉链子,仅凭这一点,如果要我推荐一款个人信息管理工具给别人,或者当我自己进入新领域,我大概还是会是先想到 DEVONthink。

虽有隐忧,但在滚滚数据洪流面前,DEVONthink 过去是、目前是、未来的几年里大概率也将是我的资料中枢。

如果这篇文章让读者多了解哪怕丝毫 DEVONthink 的真实样貌,而不止步于“终极文件管理工具”的虚名,那么我的时间就没有白费了。

🛍 我撰写的付费栏目《信息管理,文件为本位的方案》正在 UNTAG 售卖,对本文话题有进一步讨论,欢迎选购:付费内容链接

信息管理,文件为本位的方案
信息管理,文件为本位的方案

  1. 著名的 Notion 在国内有好几个复制品。
  2. 写论文请用文献管理工具,用 DEVONthink 就是花钱买罪受。
  3. 这也就不奇怪,我在四五年前写的那篇粗浅介绍为何曾在搜索引擎中位于前列了,这实在是矮子里拔将军。
  4. 不过文献引用是学术写作中无法绕开的一环,而 DEVONthink 并不精于此道,我并不建议用 DEVONthink 来写论文。如果一个人因为文献用格式不标准而被判定为剽窃,那么责任来自使用者,而不是开发商。DEVONthink 从来没有建议你用它搞引用。
  5. 注意不是两个维度,而是几乎平行而偶尔会相切的两个类别。关于文件分类,拙作《信息管理,文件为本位的方案》第三章有更进一步的讨论。
  6. 无论是导入(Import)还是索引(Index),都会生成缓存文件。在技术上,DEVONthink 会为每一个文件生成一对一的链接文件,这已经足够让电脑崩溃,更不要说其他不为人知的“暗文件”了。
  7. 移动端的 DEVONthink To Go 接入了 OCR API,但是质量和桌面端无法相提并论。特别让人费解之处是,很多方形的文本都无法被正常识别,或者被当作异体字,而中文偏偏是方块字!
  8. 先后是 Hazel 和 Keyboard Maestro。我的文件仍然留在 Finder 里,DEVONthink 只是索引可原始文件,故可以用更顺手的第三方工具自动处理文件,但如果你更乐意导入文件——这是官方推荐做法——则可能用得上 DEVONthink 内置文件自动化处理机制。
  9. 有些早年发表的论文,流传在网上的版本可能识别率准确率不高,或者因为年代较久已经成了乱码。
  10. 可选的操作甚至不如 Spotlight 丰富,不过自 macOS 11 开始,桌面端日益低龄化、弱智化、倒车开得比上高速还快,现在的 Spotlight 基本没有任何进一步的文件处理功能。
  11. 法学可以粗略分为解释论和立法论,后者不是一介布衣有资格碰的。
  12. 已经有律师因携带 MacBook 而被禁止会见当事人,尽管事情有回转,但关键是,被拒绝本身就是无法承受的风险。

author_avatar

Lawyer, macOS/iOS Automation Amateur