article_image

一款把网页转化为 epub 的工具。

为什么会有 Epublifier?

Epublifier 的开发初衷很简单:有时候我们想把某个网站的内容整理成电子书,但现有的工具都不太好用。像是一些命令行脚本或者浏览器插件,要么需要复杂的设置,要么只能处理固定类型的网站。尤其是那些内容是动态生成的(比如用 JavaScript 加载出来的),这些工具就有点力不从心了。

而 Epublifier 就是为了让大家更轻松地抓取任意网站的内容,生成 ePub 格式的电子书,这样就能直接在各种阅读器上看了。

🔗 项目链接

Epublifier 能帮你解决什么问题?

  1. 搞定动态内容:有些网站的内容是通过 JavaScript 动态加载的,传统的命令行抓取工具根本搞不定。而 Epublifier 在浏览器中运行,可以更好地处理这些动态内容,还不容易被网站屏蔽。
  2. 操作更简单:很多抓取工具都要求用户自己写配置文件或代码,太麻烦了。Epublifier 就是要让这件事变简单:提供了用户界面,只要点几下,就能选中要抓取的网页元素,不用写任何代码。
  3. 灵活应变:Epublifier 是个轻量的工具,适合那些不在预设范围内的网站。它很灵活,能让你快速抓取偶尔访问的网站内容,不用再花时间去搞复杂的设置。

以下是 Epublifier 官方的效果展示,可以更好地理解它能为你做哪些事情——

提取页面列表
提取页面列表
通过“Next”按钮自动处理跨页内容
通过“Next”按钮自动处理跨页内容
提取其他文档
提取其他文档

怎么用 Epublifier?

首先你要安装插件,Epublifier 支持 Firefox 和 Chrome 浏览器,点击下面的链接安装就好:

  1. 抓取页面列表:你只需要提供一个网页链接,Epublifier 就会自动帮你提取这个网站上的页面列表,并把它们编译成 ePub 格式的电子书。比如,你可以从小说更新网站上抓取章节列表。
  2. 自定义解析规则:如果你是进阶用户,Epublifier 还支持用 JavaScript 写自己的解析规则,以适应某些网站的特殊格式。插件的 Wiki 页面有详细的教程和例子,供你参考。
  3. 界面操作更直观:直接用界面选中页面上的标题和“下一页”按钮,Epublifier 就会根据你的选择,自动遍历内容并生成电子书。比如像网文小说类的站点,经常会将内容分为很碎的页面,你只需选好“下一页”按钮,它就能一章一章帮你抓取下来。

Epublifier 支持哪些类型的页面?

Epublifier 可以应对各种类型的网页,包括但不限于以下几类:

  • 小说网站:比如一些流行的小说网站,它都能搞定。
  • 文档网站:能从各种文档网站抓取内容,比如 FastAPI 的文档。
  • 自定义页面:适用于那些用 UL/OL 列表当目录的网站,或者通过正则表达式解析链接文本的页面。你还可以手动选择页面上的标题和“下一页”按钮来抓取内容。

总的来说,Epublifier 是一个灵活又强大的浏览器抓取工具,非常适合那些想要快速生成电子书但不愿意花太多时间配置的用户。不论是想处理动态内容,还是希望快速生成电子书,Epublifier 都是一个省心的选择。


author_avatar

UNTAG 官方