article_image

维德像一个黑色的鬼魅,只有双眸的冷光时隐时现。“只送大脑。”他说。——刘慈欣《三体III·死神永生》

注意:本文所说的书签,仅仅指内容类的网站,而不包括工具性质的页面。比如说,一篇博客、一个 Twitter 帖子或一篇在网上公开全文的论文,都在本文讨论范围内,而一个在线 PDF 处理工具或者比价插件的网页则不作考虑。另外,作者本人近一年来未在手机上安装任何信息消费类软件(包括 RSS 阅读器),故无力涉及移动端内容,确有需要者,可参考本文思路自制 Shortcuts 动作,或留言提问。

浏览器书签管理仿佛是无法根治的遗传性疾病,一如每逢雨季就会浮上皮肤的疹子,一个 Power User 总有几次被书签管理闹到瘙痒难耐而无可奈何的经历:如何分类管理?怎样快速找到目标书签?怎样跨平台同步数据?要不要用专业剪藏工具代替浏览器自身的书签……云云。

管见以为,上述种种疑难杂症,均源自浏览器这个不甚理想的书签容器;而在浏览器外另添书签管理工具,很可能还没捞到好处,开发商就先把你的数据出卖一波或者倒闭跑路。

本文取道纯文本(Plain text),以 Markdown 链接附注释的形式存储书签,以简驭繁,方便检索,数据自主,不乞援特定管理工具,亦无跨平台同步之虞,

书签隐喻的反思

马克思曾批评哲学一味只求理解世界而不是改变世界。在超现实主义感受力的范围里作业的摄影师则告诉我们,就连试图理解世界也是徒劳的,并提议我们搜集世界。——Susan Sontag《论摄影》

书签这个词本应轻盈,没有多少重量,却能承担指示阅读目标的重要职责。在现实世界中,书签管理这四个字闻所未闻,毕竟不管是三块钱一大碟的便宜货还是几百块钱一小盒的金属书签,在现实世界中似乎远未达到需要管理的地步。但是浩浩荡荡的电子数据不仅让书签管理却有必要,而且也提供了种种手段。

然而,虚拟世界中的书签管理却让这根轻盈的羽毛沾满了水渍甚至泥灰。或许真正的质变发生在我们对待虚拟书签的态度上面,而不仅仅是书签数量的几何增长:在现实世界中,书签寄生于书册之上,而虚拟世界中的书签则可以和网页分离,导致我们产生了一种占有书签的幻觉,似乎书签是某种实体。著名服务 Pinboard 将厚重的书签隐喻推到极致,当你在这个服务中创建书签后,只要付得起钱,服务商就会为你剪藏完整网页,此时的书签早已脱离原意,实际上成了一个稍后读、网页剪藏甚至知识管理工具。

易言之,我们所谓的书签,早已经变异到无所不在又认不出来的程度,任何书签、星标、喜欢和收藏等能够给网页加上标记的功能,统统(在软件商的教育下)被我们用成了书签:

  • 浏览器的稍后阅读列表和书签收藏夹本身;
  • 稍后读工具和 RSS 阅读器里的星标;
  • Twitter 上的“喜欢”和“收藏”;
  • ……

这篇文章的读者可能相对年轻,并没有经历过稍后读服务攻城略地的岁月,甚至很有可能在他们拥有第一台个人电脑时,默认的必装软件中就已经包括了稍后读工具乃至 Notion 这样的超级利维坦,而最原始书签,很可能根本没有在他们脑海中留下任何印象。这些话只是在陈述一个事实,并没有倚老卖老(可况我也未及而立之年),因为在写杂文的这几年里,无数次发现读者并不知道书签和书签栏为何物,甚至不知道如何创建一个书签!

在这里,消费主义已经获得了彻头彻尾的胜利,许多人甚至没有意识到这场战争的硝烟,而战争的后果就是人们开始收集一切;至于传统的书签——只包括网页标题和链接——则成了战争最大的牺牲品:不是战败,而是彻底被遗忘。即便有人尝试去整理浏览器自带的书签栏,很可能也带着 All in One 工具的视角,积重难返。

注:本文主要阐述方法论,我也编写了一批自动化工具,不够工具较为细碎,日后将另行介绍,不占本文篇幅。UNTAG 会员读者可私下找我获取资源。

重新思考书签收集

书签本来的姿态,应当是一身轻松,毫无负担。

一种比较理想的书签管理态度,应该向对待地图上的私藏餐厅一样:其中一部分是你去过的,承载着一段回忆;另外一部分——很可能是更大的一部分——则是你想去的,留着念想。苟若有人打算把所有著名地点都打卡一遍,任何一个理智的人都会揶揄他是特种兵式旅游。

当然,现实世界中,这些地点的问题在于你不可能真正拥有他们,甚至连一处都不可能买下来。然而虚拟世界中的对象很容易获得其副本,于是我们倾向于搜集一切——就像所有目前买不下来的著名景点一样,至少可以拍个照而拍照,这种行为本身就可以被解读为拍摄你理论上能够购买的东西。电子世界中的书签让人以为自己可以占有一切

相对于这种占有一切的态度,或许还有另外一种更加潇洒自如的姿态,那就是把整个在线浏览视作一场游猎:书签成了标记,告诉你某个地方曾经发生过一场成功的狩猎,或者某处有着猎物的痕迹。1

书签之轻盈,应当贯穿收集、检索取用和数据存储各个阶段,而理想和现实之间的差距,否定了几乎所有的现有方案,同时又指向了纯文本这条出路。

数据自主权问题

从书签采集的顺序上看,采集方式碎片化问题是第一道坎,而鉴于各个工具往往高筑围墙、争抢用户数据,采集方式多样的经验结果就是数据碎片化:RSS 浏览器、稍后读工具、浏览器里各自躺着一堆书签(或星标文章)。零落的数据难以统一检索、取用,就像在每只包里都塞着随手抓来的一把餐巾纸,最后往往洗烂了也没想起来用,散落的书签也只是数字墓地上的一座座新坟冢

苟回避主权问题而单纯完善器物,则一切只是隔靴搔痒。解决之道必然在于数据独立,这意味着摆脱软件自己的书签功能。2根本上,只要统一存储容器,其余问题往往迎刃而解。从《用 DEVONthink 做网页摘抄,夺回数据所有权》开始的系列文章中,我就转向本地存储摘抄数据,用一个纯文本文件作容器,借自动化工具,可从常用软件中采集摘抄,亦能置于主流网盘中同步。

而书签其实更简单。其核心数据是标题、链接和注释,它们完全可以写成纯文本。实际上,浏览器导出的书签也简洁如斯。而且承载书签的纯文本文件更是轻若无物,以我收集一万余篇文章的情况来看,所占体积不过 5MB;纯文本的采集和同步之便,也一并继承。

Alt text
纯文本书签渲染效果(左)和浏览器导出书签(右)

为方便浏览,我最终选取的存储形式是 Markdown 格式的链接,并随附注释:[标题](链接)注释。在上图中,渲染后的效果已与浏览器直接导出的书签近似,可以滚动浏览、随意复制或点击打开网址——自然,这并非我所求,后文将提出全然不同的使用方式。

采集碎片化问题

从根本上夺回数据主权后,方可回过头解决采集中的不便。采集目标是 [标题](链接)注释 格式的文本。

采集之际,又难以回避浏览工具之多样,如何一以贯之?或许需要一个采集工具的原型(prototype),再推而广之;而浏览器自带的书签收藏功能恰给人启发:在 Safari 等浏览器中,快捷键 ⌘Command-D一般用于添加书签,而随后弹出的小窗口则包括标题、网站和描述三项内容,恰是我所需。最终我不会用这个界面,但采集方式却正中下怀,于是我用 Keyboard Maestro 做了一个采集工具,自动抓取当前网页的标题与链接,同时可手动添加注释——标题和链接也可以改,以便修复抓取失败的标题或删掉多余的推广信息。——至于触发方式,则接过 ⌘Command-D 的衣钵,覆盖原有键位。3

Alt text
在 Safari 中收藏链接

三项数据加上 ⌘Command-D,这一交互并非浏览器专属,亦可推至其他软件。以《当代人的丛林狩猎》所勾勒的阅读流程为例,至少还需要解决 RSS 阅读器中的采集问题。

我本人同时在使用 DEVONthink 和 NetNewsWire 两款 RSS 阅读器,将其作为主要的,就像在溪边放了两只鱼篓,隔几天就会检查收获。4在浏览 RSS 文章列表时,很多文章我们不会打开细看,传统做法是加上星标,但这样就产生了压力,随手创建了一堆最终很可能稍后不读的条目。

在“过滤—略读—精度”的逻辑中,RSS 工具只是第一道闸门,要后续处理的就创建任务或马上转到浏览器里读掉,而有点意思但不需要马上处理的,则统统加上书签了事,以后要翻找就去同一个地方,不用先思考一下要打开哪个阅读器(前提是服务商还没跑路)。我在 DEVONthink 和 NetNewsWire 中也设置了采集工具,键位同样是 ⌘Command-D,界面与 Safari 中的采集窗口一致。

Alt text
在 DEVONthink 中收藏链接
Alt text
在 NetNewsWire 中收藏链接

其他能够轻易获得标题和链接的 RSS 阅读器,也可以仿制上面的动作;如果是相对封闭的软件,则要看看有没有导出按钮(分享按钮),若完全锁死,则自动化工具也无能为力。采集阶段的关键在于,尽可能统一操作,在不同软件中保持操作的连贯。

检索取用问题

注:本节的具体实现以 LaunchBar 为主,细节较多,将另行撰文。

书签最终是要拿来用的,而书签数量又很容易膨胀,这就考验书签工具的检索能力。显然,多数浏览器的书签检索是一场灾难,例如 Safari 的地址栏和快捷键之王固然都支持检索书签,却限于标题和链接,除非你记忆力超群,否则多数书签恐怕都会石沉大海。

Alt text
Safari 很难检索书签

标题与链接远非良好的记忆线索,相比之下,手写的注释更加有效。原因很简单,标题与链接是网站拟定的,而注释则由使用者自己撰写,可以写下任何有助于记忆的文字——而自己写的东西、会具有“提取优势”,正如亲自标注的资料,当然记得比单纯扫一眼的更牢靠。

例如,《一种将线上内容精简格式后保存到本地的方法》这篇文章,标题中并不包含 剪藏 二字,但显然在探讨另一种意义上的剪藏,我就注上 剪藏,以表达其主题,以后只需键入关键词,不仅可以找到此文,还能抓出一把相关文章。

Alt text
通过关键词检索书签

也可以说,注释其实是广义上的标签管理,只不过不囿于软件自己的标签机制,转向功更自由的纯文本,只要是能写成文本、有助于检索的内容,都可以纳入注释,例如:

  • 作者名:非常重要,很多时候我们可能把文章的标题忘个一干二净,或者拼不对一些外文文章的标题,但起码还记得是谁写的;
  • 文章所属专题、专栏:可以一次性检索出同系列的文章,我给自己写的文章加书签时,就会注明所属栏目(如有),以后给别人分享自己的作品时,也可以分享整个系列;
  • 作者自己给文章打上的标签:除了读者自己添加的注释,作者自己打上的标签也是描述文章的一个维度,有的话就复制下来加进注释,当然,有些标签带有推广或引流性质,不一定能够客观描述文章内容,取舍请自己定夺。

例如《特殊情形之下保证期间的计算三论 》为例,我取其作者、来源期刊5以及自带标签写入注释,再添上我自己关注的方面,组成下面的文本:

[高圣平:特殊情形之下保证期间的计算三论 - 民商法律网](https://www.civillaw.com.cn/zt/t/?id=37804#)债的担保, 保证合同, 保证期间, 《法学杂志》, 展期, 不承担保证责任

正如周作人所言,重要的,是读者和文章之间的历史;而手写的注释,正是这种不可替代的记忆线索。

小结,以及再谈链接腐烂问题

总览本文方案,其实是在改良和独立浏览器书签,而市面上的稍后读工具和我也不知道怎么定义的 All in One 弗兰肯斯坦(对,我说的就是 Notion 和 Readwise),则更倾向于剪藏网页全文。有必要对这类“书签”作一回应。

管见以为,剪藏其实旨在满足收集欲,而不是真正解决问题;而在我们所处的这片月下世界中,网页也会腐烂,剪藏服务自身也随时会倒闭。敢不敢打开你的 Instapaper、Pocket 或 Evernote,拉到底看看最早的几篇文章是不是已经一片空白?

——抱歉,我忘了 Evernote 好像要付钱才能观看原本属于用户自己的东西。还有比这更屈辱的吗!

不朽的数据,只存在于本地。剪藏这条路,只要不是浅尝辄止、满足于囤积(而不回顾),其逻辑结论就是保存通用格式的独立文件,正是在这个逻辑延伸线上,从《一种将线上内容精简格式后保存到本地的方法》开始,我和 Hum 各自写了一系列保存网页到本地的文章。

显然,我们又不可能保存一切,无论硬盘还是大脑都不堪重负,收藏家和搜集者将另觅出路或重新审视来路,但无论如何,都不应继续往已如累卵的书签上放稻草。书签不是这么用的。

唯在此际,书签终于同剪藏解耦,恢复最单纯的标记、指引功能。

抖落风雪与泥泞,羽毛再次轻盈。


  1. 但如果有人把书签作为所有权的象征,即便仅仅是针对数据副本的那么这种行为就从猎人留下标记降格到狗撒尿宣示地盘了。
  2. “导出”和数据独立是两回事,何况服务商可以随时违约、取消导出服务而实际上不承担任何责任——是的,或许你是一个血气方刚的维权斗士,但是互联网服务几乎全部约定了仲裁条款,起步就是高端商务套餐,你需要预缴付几千上万的费用并买机票飞去维权。
  3. 至于如何直接添加书签到浏览器,则可用快捷键之王,当然,这里假设采集网页链接到本地的频率远远高于添加到浏览器。
  4. 为区分严肃的阅读和娱乐性阅读,我同时使用两款阅读器,相关讨论详见《为什么要使用两个 RSS 阅读器:一种信息过载的特效药》
  5. 示例文章来自期刊,并有增改、加了不少论述,故我特意收藏了其书签。一般情况下,则直接下载论文就好,不需要再采集一个内容相同的二手版本。

author_avatar

Lawyer, macOS/iOS Automation Amateur