article_image

我不是被纷繁的搜索技术所吸引,而是被如何找到这些搜索技术所吸引。——伪麦克斯韦

直达鹄的:在线搜索指津
直达鹄的:在线搜索指津

🛍付费内容链接

良好的搜索习惯是现代人的基本功。然而,这种能力却在不同场合下被高度神化,有时我们会认为,那些搜索又快又准的同学或同事一定让偷偷买了天价软件,或者充了专业数据库的会员,另一些时候,我们则会假设那些出色的家伙或许有某些常人难以企及的天才,把原因归结于玄学。而人工智能造成的互联网垃圾化互联网黑暗森林的成形,无非增加了更多的技术借口和不可知论因素。

练习多数技能,都有一个循序渐进的过程,但传统印象中的搜索好像不是这样:一谈到搜索,那些以“老师”自居的家伙,恨不能给你列一个长长的表单,举出复杂的搜索语法,而话题到此又戛然而止,不仅起步就是山顶,往后也没有继续攀登的余地。

实则不然。搜索与多数技能一样,是一个近似于登山的过程,半桶水的家伙,总是最为聒噪,那些站在半山腰稍微瞥到一眼远方风景的家伙,声音往往最为洪亮。是故本作从一开始就要揭示搜索的三阶段,以免迅速落入纯粹技术的枝节泥淖。

采集式的搜索

最原始的搜索阶段,也配得上这个原始社会的隐喻:采集社会。

采集社会最明显的特征,就是高度依赖地理环境。现代人在数字地理环境依赖上,并不比祖先好太多。赛博空间中的不同站点,如同地理上的不同区域,正如一个原始人可能守株待兔或者在躲一片树林里吃到死,一个现代人很可能只用一个搜索引擎,或总是在同一个网站找资料,不会考虑别的工具、站点或数据库。我不介意透露,即便是被认为技术门槛很高的法律行业,多数律师也会吊死在一个数据库上,要劝一个用习惯了北大法宝的律师换到其他平台,并不比劝一个抖音成瘾者换一款新闻软件来得容易。

每一代人好像都有一种厚古非今综合症,总觉得上个时代的东西比较经典,而当下流行的东西则不如以前,这在搜索领域同样有所体现。八零九零后的一代,可能觉得国外搜索引擎更胜一筹,而百度则充斥着广告,让人如鲠在喉。但据说,零零后已经不太熟悉“搜索引擎”这个概念了,他们更喜欢在抖音、微信、微博、小红书或哔哩哔哩中找东西,我曾给不少后辈——大部分是985名校出身——演示百度搜索的进阶语法,每次都让只会微信“搜一搜”的他们世界观崩塌。

关键不在于选择抖音、百度、Google 或是专业法律数据库,而在于能不能从搜索的人类学和地理学角度看待问题,看到相对性。任何吊死在一个工具上的人,无论所用工具多么高级,也仍然处于搜索的采集社会——或者说,成了 Matrix 中的一节电池,完全放弃了独立思考、主动检索。不知道未来会不会出现追忆百度的文章,我很期待。

打猎式的搜索

采集式的原始社会可说是听天由命,捡到什么吃什么,捡不到就勒紧裤腰带或者等着饿死。而相比纯粹的采集,打猎者有了长足的进步。相比之下,打猎的社会完全建立在工具之上——采集社会当然也有工具,比如镰刀,但这里我们毕竟不是严肃的人类学讨论,大家能读懂我的比喻就好——原始人手中的火把和燧石长矛到了我们手中,就是搜索软件及各种强化插件。

在这个阶段,搜索引擎使用者的侵略性显露无余。他可能收集一长串的搜索引擎,充实自己的浏览器书签文件夹,也可能在 Chrome 浏览器中装满了搜索插件,似乎要把各个网站的资源一网打尽。这个阶段还会出现一些 Nerd 用户,他们熟悉常用搜索引擎的语法,甚至可以编写一些复杂的检索表达式。我们在网上常常看到的那些技术达人,大多处于——或至少处于,褒义的——这一阶段,其中多数是热心肠,愿意分享自己的搜索经验,但如果一直徘徊在工具层面,则很可能会成为《现代鲁滨逊》的主角,把性冲动瞄准每一个网站。

狩猎文明固然比采集好得多,但问题在于它并不安定。为什么电影里的原始人总要去围猎长毛象?刻板印象里,猎人应该吃穿不愁才对。原因很简单,原始的猎人缺少盐,如果他们不能长期保存猎物,那就只能每次花大力气出去狩猎——而长毛象毕竟不是麻雀,并不随处可见。一旦在某个区域找不到长毛象,猎人唯一的选择就是迁居到别处。印第安人据说就追着猎物越过了白令海峡,来到美洲大陆。在历史上,这当然是一次波澜壮阔的旅途;但是在搜索中,类似的行为则不再可取,相信没有多少人乐于翻山越岭、跨越海峡。

赛博空间中的猎物(信息)和活生生的动物一样,不仅会移动,还会死亡链接腐烂问题被频频提上议程,有统计发现《纽约时报》中约有25%的链接已无法点开,至于那些规模更小的网站则更不乐观,甚至无人统计它们。面对这种环境,书签、收藏夹、或剪藏恐怕只是在赛博空间版的刻舟求剑。真的要回溯资料时,估计猎物早已杳无踪影,于是你又得开始一场漫长的狩猎。

现代人的游徙性和祖先一脉相承,而我们的处境不见得比非洲大草原更舒适。我们很少明白,如果长毛象(信息)已经灭绝的话,就算穿着迷彩服、扛着自动步枪、开着吉普越野车也抓不到它。

农业(或工业)革命后的搜索

潦草的在线搜索几近于采集瓜果根茎,而配备了高级检索工具后的在线搜索则进化到了狩猎社会。惟打造个人本地数据库后,搜索方进入农业(工业)社会。再强大的搜索引擎也不过是手里的一把武器,而个人数据库则是一座庄园。前者是掠夺性的,后者是生产性的。

个人数据库最直接的功能,当然是减少搜索量,例如,既然我们已经从网上收集了一批数据,那么日后再解除同一问题时,就不用重新梳理——直接翻出上一次的检索结果就好了。即便互联网上的数据永远不会消失,永远不会腐烂,我们也同样需要个人数据库,就好像你可以随时到楼下的便利店里买东西,但我相信百分之九十九的读者家里还是有一台冰箱,不至于喝口水或吃块饼干都要跑下楼。

而在意识到链接腐烂问题后,个人数据库就更有必要。例如,一些私人博客基本靠爱好者在颤颤巍巍地维持着,说不定哪一天整个站点就没了,域名都是待价而沽。读到一篇好文章,尤其是私人博客上的好文章时,我第一反应就是把它保存到本地。

进言之,搜索的结果乃至过程都可以留在本地,做成个人数据库。保存搜索结果不必多说,整个搜索过程也值得记录——在权衡成本之后(本文将详加讨论)。诚然,通常只有专业检索机构才会保留过程,例如做一份专利风险分析报告,往往就得留下关键词和表达式,以便阅读报告之人能够重新实现。这样严格的工序并不值得所有人借鉴,但是尝试做一两次记录,据此分析检索习惯,却不无裨益。

不过,搭建本地个人数据库,也不是松鼠症发作、无目的地囤积过冬粮食,本地的数据库同样需要取舍和整理,同时在线搜索的诸多技巧,也可用于本地数据库(包括哪些魔法咒语一样的高级语法)。

小结

搜索信息与获取食物,有着太多类似之处。我们可能都会对采集式的搜索一笑了之,但仅仅停留在狩猎式的搜索阶段,某种意义上也只是五十步笑百步。任何拘泥于工具的讨论都过于局限,当然,本文也只是多了一种视角,但尝试爬到更高的地方,这本身就超越了以往。

在本作布局上,第一章、第二章乃至第三章主要讨论狩猎阶段的工具与方法,而第四章则转向农业(工业)阶段,但是你可以看到,这两个阶段并没有明显的先后,因为在理想情况下,它们是平行的策略。只不过就阅读和操作的难度而言,如此布局更方便罢了。此外,考虑到搭建个人数据库很难避开信息管理,且恕我在本作中点到为止,继续深入的部分,我另著有《macOS 文件管理》《信息管理,文件为本位的方案》

“索”者,既表示求索,亦有绳索之意,或许除了搜索目标本身,我们也需要握紧反思的绳索,找到更好的搜索方法。讨论大多数问题,总是涉及道、术、器几个层面,而诸位想必蹙眉远之的“百度专家”们恰恰无视了术的修炼,遑论道的参悟,局限在器的粗浅层面——或者连器与术也不顾,借口反正学不会道——把搜索想象成如同用勺子从碗里舀水那么简单:如果别人做得比我好,那一定是因为他有更大的勺子(或者买了一台抽水机),不然就是因为别人有某些我无法理解的特异功能或特殊品质。

本作旨在打破上述勺子模型。我将在本作中尝试还原搜索的真实面貌,提出自己的三阶段模型,揭露那些通常被视为玄学的成分,并最终将道与术落实到工具层面。鉴于整个市场早已经历了好几代人时间的能力剥夺教育,多数人只能想象他们所接触过的工具,我将提供大量自己制作的搜索辅助工具,免得空口说白话。只要你有心,本作将介绍的方法和技术并不比GPT难学——GPT难学吗?

登高望远,有的放矢,方能直达鹄的。


author_avatar

Lawyer, macOS/iOS Automation Amateur