如何保存 Twitter 上的长推文到本地

在 Twitter 上写长 Thread，已然成了博客的替代品，尤其科技行业的名角儿，也多喜欢在 Twitter 上发声。Hum 曾把在微博上写长文的人称作微博艺术家（不过他已经好多年不看微博了），借他雅言，Twitter 上发 Thread 之士，也可以称为推文艺术家。

然而，Twitter 上的内容来也匆匆，去也匆匆，发布者自己一个不爽就随手删了——一句话，Twitter 上的内容，比网页更容易消逝，也就更需要保存到本地。这篇文章沿着《一种将线上内容精简格式后保存到本地的方法》、《剪藏网页到本地的自动化思路（以 Keyboard Maestro 为例）》和《剪藏网页到本地的轻量化思路》的思路，尝试将长推文保存为 PDF，以供日后阅读和参考。

杂症诊断

保存 Thread 难于普通推文，一般的内容，只是寥寥数语配上几张图，丢进网页剪藏工具，如同伸手摘下低垂的果子；而 Thread 则堪比文章，篇幅甚巨，有些人在 Twitter 上长篇大论（比如这个），有的则开列清单喋喋不休（比如这个（存档）），Thread 下不经意间就有几十条回复，一般的网页剪藏工具很难悉数摘取——何况在线工具本身说不定比在线内容更早灭绝，我怎么敢把鸡蛋放在它们的篮子里？

过去十年里，我在 Evernote、Instapaper、Pocket 和 Notion 等工具中颠沛流离。这些工具获得的剪藏内容好像落叶堆，最顶上的叶片新鲜靓丽，但稍微往下挖一点，就会发现缺胳膊少腿者；而一旦深挖到底，则是彻底腐烂的内容，超链接丢失、图片打不开、文章被拦腰截断，比比皆是。毕竟我们没有为存储服务掏钱，这些工具也没有必要做老好人。

于是我们还得自己动手。就保存网页内容为 PDF 而言，有两个核心步骤。

清理网页版面的工具。通常可以用浏览器的阅读模式，但如果网页本身广告不多，我还是愿意保留其版式，毕竟网页设计就像杂志装帧，本身就是阅读体验的一部分；苟一律套用阅读模式，难免要失去一些风味。
打印 PDF 的服务。可以是 DEVONthink 或 Javascript 脚本等复杂方案，也可以是 Safari 自带的导出功能，对于图文混排的文章来说，导出单页的连续 PDF 效果更好，图片不会被硬生生裁开搁在两页。同样，如果网页广告没有堆成九龙城寨，我更倾向于使用 Safari 原生导出功能，而不愿动用 DEVONthink 等重型工具。

而 Twitter 在上述两步都可谓坎坷。一般而言，我们习惯在手机上刷 Twitter，理想情况就是转到 Safari 打开 Twitter 链接，截屏后查看缩略图，然后找到导出全页面 PDF 的选项，前述两步本可并作一步。然而，直接打印的尝试将以失败告终。

处理步骤

首先是 Twitter 官方限制。如果你使用客户端，那几乎上就别指望导出任何东西；即便使用网页版，Twitter 也设下重重藩篱，就算你能够浏览网页上的全部内容，也不能将其保存下来——你可以试试复制 Twitter 网页，得到的甚至不是富文本，而只是开头的少许图文加上大量空白内容——并且打印网页也做不到，只会得到长长的白色空白页面，仿佛除了故障的超市小票打印机。其次，即便 Twitter 破天荒地拆除栅栏，Thread 中也有大量读者评论，这些玩意儿根本没资格和作者的推文黏在一起，我们还得想办法将其刨除。

跟随保存普通网页为 PDF 的思路，处理长推文也有两个步骤。起手仍然是清理格式，把推文转换为传统的网页文章。不少 Twitter Bot 都致力于这一工作，例如 Thread Reader、Threader 和 Unroll Thread，但我不愿意在别人的推文下写到此一游，因此倾向于使用这些工具的网页服务。我最常用 Thread Reader，并为之写了一个 Bookmarklet 小插件——你可以把这个链接加入浏览器收藏夹，之后在 Twitter 页面打开它，就能将当前推文发送给 Thread Reader，稍等几秒就会获得重新排版完毕的长推文。Bookmarklet 源码随后，请随意使用；另外，Shortcuts 版本的下载链接在此，可以在 Twitter 或第三方客户端内部使用。

javascript:location.href%3D&#039;https://threadreaderapp.com/search%3Fq%3D&#039;%2BencodeURIComponent(location.href)%3B

Thread Reader 处理后的 Thread 就是一篇规矩文章，直接打印也不再有限制，还可以搭配阅读器模式，尽管我并不这么干，因为 Thread Reader 的界面已经足够简单。但某些浏览器或插件可以自定义 CSS，对版式有需求的读者，还是可以再作调整。

总之，Thread Reader 排好的图文已经可以交付打印。在手机上直接截图，然后导出整页 PDF；而在电脑上，则是点击菜单栏中的“Export as PDF…”选项，方能得到整页不断的 PDF，一如浏览 Twitter 时那样连续不断。Thread Reader 也有自己的推广内容，好在但凡能打印成 PDF，控制权就交到了我们手上：我们可以像裁切照片一样，直接的截图编辑界面下裁掉尾部的多余内容。

小结

我一直将信息采集比喻为食物采集：只在连接到网络时尽可能采集资料，最终全部贮藏在本地——打印为可靠的 PDF 格式。两年前，我知悉 Hum 同样苦恼于链接腐烂（Link Rot），于是我们编写了一些摘取网页内容的自动化工具；而微博（我们都不看）、公众号（Hum 不看）、Twitter 等现实意义上的局域网，却不能以通用方案解决，于是我仍然在摸索专用方法。

这篇文章针对 Twitter Thread 给出了一套思路，其中涉及的软件都是可以替换的（很庆幸不需要放出 DEVONthink），尤其是随时可能失效的在线服务。而剪藏网页，或许最需要鲁棒的方法。

如何保存 Twitter 上的长推文到本地

目录

更多文章

Obsidian 的 PC 端同步方案，无代码搞定 Git 同步

如何解决 iPhone 拍照过度锐化的问题

将外文电子书翻译成双语对照版本，并在任何设备上阅读

如何用 RSS 订阅 YouTube 和 Bilibili 频道

为什么要禁止 RSS 阅读器中出现图像

杂症诊断

处理步骤

小结