现代浏览器几乎都配备阅读模式,读者除了在浏览器中直接看,也可以进一步剪藏保存,获得较为干净的 PDF 文件,供后续批注收藏。不过,网页千变万化,阅读模式偶有内容丢失。
如果不凑巧,自己常逛的某网站经常出问题——对我来说,主要是 Serious Eats——那真是如同每天穿着一双夹着鹅卵石的鞋子。下图中,原文图文并茂,而阅读模式不仅丢失了所有图片,也仅仅获取到半篇文章。

当然,你可以换浏览器,或者装第三方插件,但任何方法都是在迁就网站:阅读模式就像各种型号的筛子,没有一只筛子可以照顾到所有东西。如果有哪个开发者敢胡乱吹嘘,我可以马上修改这篇文章的 HTML 代码,让他的阅读插件失效,同时您不会察觉原网页有任何异常。
在尝试更伤筋动骨的方案之前(例如直接修改源代码),我注意到一个现象:同一个网页,在不同宽度的窗口中布局不一,打印效果也有差异,最典型的就是在半屏时很可能没有侧边栏,而到达某个阈值时则展开它。
这是一个好迹象。固然,网页直接打印的效果由其自身的代码控制,和网页上显示的内容并不一一对应,但阅读模式并不受网页的打印代码影响,而是尝试从网页中抓取内容,既然不同宽度下的同一页面效果有异,那么很有可能阅读模式也能抓到不同的内容——最好,是能够完整抓取正文。
我的运气不错,就 Serious Eats 网站而言,似乎在压缩到三分之一屏幕宽度左右时,阅读模式就能正常抓取全文。

视电脑屏幕物理分辨率、逻辑分辨率、浏览器和网页字体大小设置差异,触发完整内容显示的宽度有所差异,不过在多数情况下,当你把网页窗口宽度压到类似于手机时——你可以直接压到最窄,有问题的话再慢慢往回放——阅读模式很有可能会正常工作。