目录
很多人都有保存网页的习惯。看到一篇好文章、一份重要资料,想存下来以后离线看。用浏览器自带的“另存为”功能,要么保存不完整,图片丢了;要么生成一个html文件再加一个带一堆零碎文件的文件夹,挪个位置就失效了。用截图又只能存看得见的部分,长文章根本截不全。
SingleFile就是解决这个问题的。它像一个“网页打包工”,点一下按钮,它会自动把当前网页里所有的内容——文字、图片、CSS样式、字体文件、甚至视频播放器——全部抓取下来,内嵌到一个HTML文件里。保存好的文件体积会稍微大一点,但好处是只有一个文件,你把它拷到U盘、发邮件给别人、或者存到手机里,在任何浏览器上打开,都能看到跟原网页基本一样的排版和内容。
这个项目是法国开发者Gildas Lormeau做的,代码开源在GitHub上,已经积累了超过2万颗星。它支持Chrome、Firefox、Edge、Safari,甚至手机版Firefox也能装。除了浏览器插件,还提供一个命令行版本,可以批量处理网页,适合技术人员搭建自己的网页存档系统。
官网入口地址
https://www.getsinglefile.com/
下载地址
官网下载页面:https://www.getsinglefile.com/#download
GitHub开源项目地址:https://github.com/gildas-lormeau/SingleFile
也可以直接在浏览器扩展商店搜索“SingleFile”安装:
-
Chrome应用商店:https://chromewebstore.google.com/detail/singlefile/mpiodijhokgodhhofbcjdecpffjipkle
-
Firefox商店:https://addons.mozilla.org/firefox/addon/single-file
-
Edge商店:https://microsoftedge.microsoft.com/addons/detail/efnbkdcfmcmnhlkaijjjmhjjgladedno
-
Safari商店:https://apps.apple.com/us/app/singlefile-for-safari/id6444322545
功能介绍
完整保存为单文件
这是核心功能。SingleFile会解析网页的所有资源,图片转成base64内嵌,CSS和字体也内嵌进去,最终生成一个独立的HTML文件。用浏览器打开这个文件,即使没有网络,也能看到完整的网页内容。它比MHTML格式兼容性更好,比“网页+文件夹”的方式更整洁。
多种保存方式
-
保存当前标签页:点击工具栏图标即可
-
保存选中的内容:右键选择“保存选中部分”,只保存你框选的那一块区域
-
保存选中的框架:对于网页内嵌的iframe,可以单独保存里面的内容
-
保存多个标签页:可以一次性保存所有打开的标签页,或者只保存选中的几个
自动保存
开启自动保存后,每次页面加载完成,或者在你关闭标签页之前,SingleFile会自动把网页存下来。这个功能适合用来备份浏览历史,或者保存每天必看的某个网页的版本。
批处理与命令行
如果你需要批量保存很多网页,可以使用SingleFile CLI(命令行版本)。提供一个包含几十个网址的文本文件,命令行工具会自动逐个保存,适合服务器端或者定时任务场景。
注释与标注
在保存之前,你可以对网页进行标注:高亮某段文字、添加浮动笔记、甚至删掉不想保留的广告区域。这些标注会作为修改嵌入到保存的HTML文件里,方便做资料摘录和批注。
云存储集成
保存的HTML文件可以直接上传到Google Drive、GitHub、Amazon S3或者WebD服务器。设置好之后,每次保存完就会自动同步一份到云端,不怕本地文件丢失。
防篡改证明
SingleFile有一个比较硬核的功能:在保存网页时,可以计算文件的SHA256哈希值,并将这个哈希值记录到区块链上。未来你可以用这个哈希值证明这份网页在某个时间点确实存在过且没有被修改。这个功能对于法律取证或者学术引用有特殊价值。
丰富的自定义选项
用户可以在设置里调整很多细节,比如:
-
是否移除脚本(保存纯静态内容)
-
是否压缩HTML和CSS代码
-
是否保存页面上的延迟加载图片
-
是否添加保存时间戳到文件名
-
设置不同网站的保存规则
自解压ZIP格式
除了保存为普通HTML文件,你还可以选择保存为“自解压的ZIP文件”。这是一种特殊的HTML文件,里面压缩了网页资源,打开时会自动解压再显示。这种格式的文件体积更小,适合归档存储。
开源与跨平台
项目采用AGPL开源协议,代码公开。除了浏览器扩展,还有Windows、macOS、Linux的命令行版本,可以集成到自动化工具链里。
应用场景
学术研究资料收集
研究生、学者在查阅文献时,可以把重要的网页完整保存下来作为参考文献。保存的HTML文件可以用浏览器直接打开,里面的图片、表格、参考文献链接都不会丢失。配合注释功能,还能直接高亮关键段落。
技术文档离线备份
程序员经常要查阅各种技术文档、API参考。把这些页面用SingleFile保存下来,放在笔记本里,坐飞机或者去没有网络的地方也能随时查看。不用依赖文档站点的在线服务。
法律或合规证据留存
遇到侵权网页、不当言论,需要保留证据。用SingleFile保存下来,可以开启“存在证明”功能,把哈希值写入区块链。将来打官司或者投诉时,你能证明这个文件在某个时间点确实是那个网页的内容,没有被篡改。
个人知识库构建
配合Obsidian、Trilium等笔记软件,把SingleFile保存的HTML文件作为知识库的一部分。很多笔记软件支持HTML渲染,或者有专门的插件来读取SingleFile格式。这样你收藏的文章就不再只是书签链接,而是实实在在有内容副本的。
网页归档与数据迁移
企业或者机构需要对旧网站进行归档下线。用SingleFile把所有页面批量保存为HTML文件,然后刻盘或者存到NAS上。即使以后原来的服务器关了,这些存档文件依然可以打开查阅。
定价及支持
定价策略
SingleFile免费。无论是浏览器插件还是命令行工具,都不收取任何费用。项目在GitHub上接受捐赠,开发者通过PayPal和Liberapay接受自愿赞助,但普通用户不需要花一分钱。
开源协议
采用AGPLv3协议。这意味着你可以自由使用、修改、甚至分发,但如果你把修改后的版本作为网络服务提供给他人,你也需要开源你的代码。对于个人使用和内部使用来说没有限制。
开发者背景
作者Gildas Lormeau是一位法国的独立开发者。他长期维护SingleFile项目,从2015年左右开始,到现在已经持续了将近10年。GitHub上活跃度不错,Issue回复比较及时。
用户规模
SingleFile在GitHub上拥有超过2.1万颗星,是所有网页存档类工具中热度的之一。Chrome商店有超过30万用户,Firefox商店也有10万左右。很多开源存档项目如ArchiveBox、Linkwarden都基于或兼容SingleFile。
注意事项
由于把所有资源都内嵌到一个文件里,保存后的HTML文件会比原网页所有资源加起来还要大一些(因为base64编码会增加体积)。对于图片特别多的长页面,文件达到几十兆。另外保存包含大量脚本的复杂网页时,需要几秒甚至十几秒的时间。建议保存时关掉不必要的标签页,给浏览器留足内存。
| 源码反馈/咨询 (共有 条反馈) |
SingleFile常见问题
不是公司产品,而是一个个人开源项目。作者叫Gildas Lormeau,是法国的一位软件开发者。他一个人长期维护这个项目,也接受社区贡献者的代码提交。所以没有“XX公司”这个说法,它就是独立开发者的作品。
是一个能把整个网页打包成一个文件的工具。你正常打开一个网页,里面有图、有字、有各种样式。浏览器自带的保存功能,要么存成不完整的网页,要么存成一个html文件再加一个装图片的文件夹,文件多了不好管理。SingleFile点一下,就把所有东西都塞进一个html文件里了。这个文件你存到哪都能打开,没网也能打开,排版还跟原网页差不多。
装好插件之后,浏览器右上角会出现一个灰色带折角的文档图标。打开你想保存的网页,点一下这个图标。这时候它会开始处理,页面右上角或者底部会显示进度,比如“正在保存 15/42个资源”。等进度条走完,浏览器就会自动下载一个.html文件,文件名就是网页的标题。你双击这个文件用浏览器打开,就能看到跟原网页几乎一样的内容。如果你只想保存网页的一部分,可以先用鼠标选中一段文字和图片,然后右键点击,在菜单里选择“保存选中部分”,它只会保存你圈的那个区域。
免费。开源软件,不收钱。没有专业版,没有会员,没有任何内购。开发者靠捐赠过日子,你用着觉得好可以给他买杯咖啡,但不给也不影响使用所有功能。
相当可靠。它是开源软件,源代码谁都可以去看,有没有后门一目了然。事实上GitHub上两万多颗星,很多人审查过代码,没有发现恶意行为。它处理网页的过程在你本地进行,不上传任何数据到服务器。你保存的网页内容不会经过第三方。唯一如果你开启了上传到Google Drive或者GitHub的功能,那当然会上传到那些云服务,但那是你主动授权的。这是一个可以放心用的工具。
第一,善用快捷键。默认按Ctrl+Shift+Y可以快速保存当前页面,不用去点图标。第二,对于经常更新的网页,比如新闻首页或者股票行情,可以开启“自动保存”功能,设置成每次加载完页面自动保存一份,这样你就有了这个页面的历史版本记录。第三,如果你用笔记软件比如Obsidian,可以把SingleFile的保存文件夹直接设置成你的笔记附件文件夹,保存的HTML文件可以直接在笔记里引用和显示。第四,批量保存时别一次开太多标签页,浏览器容易卡,建议分批次,一次保存五六个。第五,在选项设置里开启“压缩HTML”和“移除未使用的CSS”,可以显著减小保存文件的大小,而不太影响显示效果。
特色的功能是“单一文件保存”和“存在证明”。大多数保存网页的工具要么生成多文件,要么依赖特定浏览器才能打开。SingleFile生成的HTML文件,任何浏览器都能打开,而且只有一个文件,这属于独一份的优势。存在证明功能更硬核,能把网页的哈希值写入区块链,证明这个网页在某时间点确实存在。用途方面,它不只是“保存文章”那么简单。研究人员用它建立可引用的离线资料库;律师用它保全网页证据;IT人员用它归档旧网站;还有人用它配合自动化工具,每天定时备份自己关注的竞品网页。
安全。强调一下:所有处理都在你的电脑上完成,保存的html文件也直接存在你的硬盘里。插件不会把你的网页内容上传到任何服务器,除非你自己主动配置了云存储同步功能。作者明确写了隐私政策,不收集用户数据。而且因为是开源软件,你不放心可以关了网抓包看它有没有偷偷上传。结论是:对于普通用户的日常保存需求,它的数据安全性是没问题的。
在“保存完整网页”这个领域,它可以说是用的之一。用户普遍夸它“保存得全”、“干净利落”、“兼容性好”。尤是和浏览器自带的保存功能比,优势非常明显。但也不是无缺:保存复杂的现代网页(比如无限滚动、大量动态加载内容的单页应用)时,会丢失部分内容,需要额外设置等待时间。另外保存的文件体积偏大,一个图片多的文章十几兆,存多了占硬盘。不过这些都是技术上的取舍,为了“完整”付出的代价。如果你需要经常保存网页离线看,它会让你觉得很好用。
保存网页的时候会占用一些资源。它需要解析当前页面的DOM树,下载所有图片和样式,然后重新打包。这个过程对于复杂页面会用掉几百兆内存,并且CPU会短暂跑高。不过这只是保存过程中那几秒到十几秒的事情,保存完成后资源就释放了。平时插件不活动的时候,几乎不占资源。老电脑保存特大网页会稍微卡一下,建议保存前关闭他不必要的标签页。
浏览器插件支持Chrome、Edge、Firefox(电脑版和安卓版)、Safari(macOS和iOS)、Opera、Vivaldi、Brave等主流浏览器。操作系统方面,只要有这些浏览器,Windows、macOS、Linux、Android、iOS都可以用。另外SingleFile CLI(命令行版)支持Windows、macOS、Linux,适合服务器环境。可以说覆盖了绝大多数用户的使用场景。
能,而且这恰恰是它的强项。你安装插件本身需要联网,但安装完之后,你可以把网断了,然后用SingleFile保存当前已经打开的网页。因为所有资源都在浏览器缓存里或者页面本身已经加载完了,它可以离线完成打包。它保存出来的HTML文件是完全离线的,你把这个文件拷贝到任何没网的电脑上,双击打开,内容都在。这是它跟很多在线“网页截图”或“网页存档”服务的区别。