article_image

各种网页剪藏格式中,毫无疑问,PDF 会第一个被普通人 pass,原因很简单,PDF 本质上就是一页一页的电子纸张,至少看上去足够死板,不符合如今的跨设备阅读潮流,也不能满足赛博文玩收藏家。然而,你是否享受漂亮的过渡动画是一回事儿,你是否拥有一个“原版”网页又是一回事儿,你从中读到多少东西则完全是另外一回事儿,正如 LiquidText 所观察到的,多数阅读工具和服务旨在让你爽,而不在乎你学到多少。

在找到更好的方法之前,或许最可靠的方法仍然是:用 PDF(半)模拟纸笔时代的阅读方式。如果要给自己脸上贴金的话,可以说选择 PDF 就像巴菲特投资糖业和汽水,看似无聊透顶,但绝对收益可期。

但,选 PDF,就要承担各种修整工作,像一个收集剪报的人一样亲历亲为,而不能指望阅读器施展美化魔法。在《如何修正对照翻译中的排版瑕疵:首字下沉篇》《如何修正对照翻译中的排版瑕疵:保留原标题篇》《如何修正对照翻译中的排版瑕疵:修复数学公式》等文章中,我指出一个通用的排版修整思路:把(待打印为 PDF 的)网页视作一个 HTML 文件,调整其源代码就几乎能做出人 任何排版效果。

当然也包括本文的:把被挤到后续页面的图片拉回第一页。这是什么乖僻的需求?稍安勿躁,只要你喜欢读文章,而文章又带配图,相信你大概率会希望图片出现在文章开头,例如下面的食谱 PDF,没有比第一页更适合放主图的的位置了,图片在此既好看,也便于一眼看明白文章主要内容。其实,就连刻板印象中的“文章”图标——包括 SF Symbol——也是由标题、图片和正文组成的。

Alt text
第一页带图的PDF更加直观

很不幸,如果你直接保存网页为 PDF,相当一部分页面头部的图片会被挤到后面,徒留一大块儿空白……


author_avatar

Lawyer, macOS/iOS Automation Amateur