出于各种原因,我在工作中常常需要去除 PDF 文件中的水印。此水印,特指“watermark”,既非以标注格式浮于 PDF 页面的文本,这种情况,在多数阅读器中可当即移除,毫无技术难度;也非和正文融为一体、展平后的图像,这种情况恐怕只能期待人工智能有所表现。^1

在技术上,这些水印其实是难以直接编辑的文本层。如果你把 PDF 视作一场皮影戏,或者回忆一下 Photoshop 中分图层的编辑界面,那么 PDF 大约也有类似的分层构造,而那些顽固的水印也只是其中的一层。问题在于,文本层形式的水印通常不能直接删除,要么得去一些很吊诡的软件里碰运气,看看有没有擦除功能;要么一步到位,怒斥重金买下万能 PDF 编辑工具 Adobe Acrobat Pro^2,但问题都在于,你可能得用橡皮擦一点一点扣掉它们,非常浪费世界。
但如果转换视角,避免在“移除水印”的功能主义小道上走到黑,转向材料思维,将 PDF 作为一种材料,追问消除水印背后的对象和原理,则不难找到更简单的方法,并且可以一次性、批量、瞬间移除水印。本文介绍一简一繁两种方案,供诸位参考。