目录
dupeGuru是一款在重复文件清理领域口碑很好的开源工具。它的名字有点难念,但功能非常实在。很多人电脑用久了,各种下载、备份、同步会产生大量重复文件,不仅占空间,还让文件夹变得杂乱。普通的重复文件查找工具只能找相同的文件,而dupeGuru的特别之处在于它的“模糊匹配”能力。
举例来说,你从不同网站下载了同一张图片,文件名分别是“风景.jpg”“风景(1).jpg”“view.jpg”,普通工具只看文件名就认不出来。但dupeGuru可以设置相似度阈值,把这些“看起来像”的文件都找出来。同样,对于音乐文件,它的音乐专用版可以读取ID3标签(歌手、专辑、歌名),即使文件名乱七八糟,只要标签信息相似,也能识别为重复。
dupeGuru采用Python 3开发,界面基于Qt构建,在三大主流操作系统上都能获得一致的使用体验。软件设计时特别注重安全性,引入了“参考文件夹”和“分组”机制,可以防止误删重要文件。比如你可以把系统文件夹设为参考,只扫描他文件夹里的重复项,避免动到系统文件。
目前dupeGuru的GitHub仓库有超过7.4k星标,社区活跃,持续维护更新。软件支持中文界面,只需在设置中简单切换即可。
官网入口地址
dupeGuru官方网站:
https://dupeguru.voltaicideas.net/
下载地址
官网下载页面:
https://dupeguru.voltaicideas.net/ (进入后根据操作系统选择对应版本下载)
项目源代码仓库:
https://github.com/arsenetar/dupeguru
功能介绍
dupeGuru的核心功能是查找重复文件,但它的设计非常灵活,提供了多种扫描模式和操作选项:
-
三种扫描模式:
-
标准模式:可同时按文件名和文件内容查找重复。文件名扫描支持模糊匹配,能找出拼写相近或仅数字编号不同的重复文件。
-
音乐专用版(dupeGuru Music Edition):专门针对音频文件优化。它会读取音乐的ID3标签(歌名、歌手、专辑、音轨号),即使文件名随机,只要音乐标签内容一致,就会被识别为重复。结果窗口会显示音乐时长、比特率、专辑封面等信息。
-
图片专用版(dupeGuru Picture Edition):针对图像文件优化。通过感知哈希算法比较图片内容的相似度,即使图片分辨率不同、格式不同、稍有裁剪或压缩,也能找出视觉上相似的重复图片。
-
-
灵活的扫描设置:
-
你可以自定义扫描的文件夹,支持同时添加多个目录。
-
设置“参考文件夹”功能:把某个文件夹标记为“参考”,扫描时会把他文件夹里的文件与参考文件夹对比,但不会把参考文件夹内的文件列入删除建议,保护重要目录不被误清理。
-
调整匹配精度:从宽松(找出更多相似项)到严格(只找几乎相同的项),你可以根据实际需要滑动调节。
-
-
结果筛选与操作:
-
扫描结果按重复组分组显示,每组内列出所有重复文件,并标注匹配百分比。
-
支持按文件名、路径、大小、修改时间排序,方便快速定位。
-
提供多种筛选器,比如“只显示非参考文件夹内的文件”“只显示特定格式文件”。
-
对于重复组,你可以一键选择“保留最旧”“保留”或手动勾选要删除的文件。
-
对选中文件可执行的操作包括:删除(移至回收站或删除)、移动、复制、重命名、用默认程序打开。
-
-
安全机制:
-
分组系统确保你不会意外删除某个重复组的一个文件。
-
操作前可预览将要删除的文件列表,确认后再执行。
-
支持将文件移动到回收站而非直接删除,给误操作留出恢复余地。
-
-
多语言与跨平台:
-
界面支持中文、英语、法语、德语、捷克语、意大利语、俄语、乌克兰语、巴西葡萄牙语、亚美尼亚语、越南语等。
-
在Windows、macOS、Linux上均提供原生安装包或便携版。
-
应用场景
-
清理音乐库重复歌曲:同一张专辑从不同平台下载,文件名格式各异。用dupeGuru音乐版,按歌曲标签查重,快速保留一份高质量版本,删除他冗余。
-
整理照片库:相机连拍产生的多张相似照片、不同分辨率保存的同一图片、从手机和相机分别导入的重复照片。图片版能按视觉相似度找出它们,帮你精简图库。
-
释放系统盘空间:很多软件在安装和运行时会在不同位置产生重复文件。扫描整个硬盘,找出重复的安装包、备份文件、临时文件,安全清理。
-
多设备备份去重:如果你有多台电脑或移动硬盘备份数据,经常会产生大量重复文件。用dupeGuru跨设备扫描,统一整理。
-
下载文件夹整理:浏览器下载目录里往往有同一文件多次下载的副本。定期扫描清理,避免积压。
定价与开源信息
dupeGuru是免费的开源软件,基于GPL v3许可证发布。源代码托管在GitHub上,任何人都可以免费下载、使用、修改和分发。软件没有任何收费版本、广告或内购功能,由社区志愿者维护。
| 源码反馈/咨询 (共有 条反馈) |
dupeGuru常见问题
它不是商业公司产品,而是一个开源社区项目。主要维护者是Andrew Senetar(GitHub用户名arsenetar),项目最初由Virgil Dupras创建,现在由社区共同维护。软件免费,没有任何公司背景。
dupeGuru没有网页版,它是一款需要下载安装到电脑上的桌面软件。官方网站是https://dupeguru.voltaicideas.net/,上面提供Windows、macOS、Linux版本的下载链接,但无法在线使用。
dupeGuru就是帮你把电脑里重复的文件、重复的歌、重复的照片都揪出来的工具。它比普通的重复文件查找器聪明的地方在于,它懂得“模糊匹配”。比如两张照片文件名不同,但内容看起来很相似;或者同一首歌在一个文件夹叫“十年.mp3”,在另一个文件夹叫“陈奕迅-十年.mp3”--它都能认出来,告诉你这些是重复的,由你决定删哪份留哪份。
用起来很直观。第一步,去官网下载对应你系统的版本,安装后打开。如果界面是英文的,点菜单栏的“View”->“Options”->“Display”,把Language改成Chinese,重启软件就是中文了。第二步,点“添加文件夹”,选你要扫描的目录(比如整个“下载”文件夹)。第三步,点底部的“扫描”按钮,软件就会开始比对。扫完后结果会分组显示,每一组里是同一份文件的不同副本。你勾选想删除的,点“操作”->“删除到回收站”就行。如果想更精细地找相似图片或音乐,可以在官网下载对应的“图片版”或“音乐版”。
它是免费的,没有任何收费版或内购。作为开源软件,你可以免费所有功能,包括标准版、音乐版、图片版,也没有广告或功能限制。
从软件本身来说,是安全可靠的。它只读取你指定文件夹里的文件,不会修改系统文件。它有一个“参考文件夹”功能,你可以把系统文件夹或重要文件夹设为参考,这样扫描时会把他文件夹里的文件和它对比,但不会建议你删除参考文件夹里的文件,避免误删。删除时默认是移到回收站,不是删除,给了你反悔的机会。因为是开源软件,代码公开,安全性经得起检验。
有几个小技巧能让它更好用。第一,善用“参考文件夹”。比如你有一个“重要资料”文件夹,里面的文件不能删,就把这个文件夹设为参考,然后扫描整个硬盘。结果里所有与参考文件夹重复的他副本都会被标出来,你可以放心清理。第二,音乐版扫描时,先勾选“按标签比较”再勾选“按内容比较”,这样能先快速找出标签相同的重复歌,再深度检查,速度更快。第三,图片版如果相似度调得太低会找出很多不相关的图,建议先从80%左右开始,如果漏掉再调低。第四,每次清理完一批重复后,可以“另存结果”为文件,方便以后追溯清理了哪些。
特色是“模糊匹配”和“专用版本”。普通查重工具只能找相同的文件,dupeGuru能找到文件名相似、音乐标签相似、图片内容相似的文件,这对整理音乐库和照片库特别实用。另一个特色是“参考文件夹”机制,让你能放心扫描整个硬盘而不怕删错重要文件。用途上,它既适合普通用户清理个人电脑,也适合需要管理大量素材的设计师、摄影师、音乐爱好者。
dupeGuru的设计比较周到。它默认不会自动删除任何文件,所有操作都需要你手动确认。删除前可以预览文件列表,也可以选择先移到回收站而不是直接删除。它的“分组”逻辑确保你不会删掉某个重复组的一份文件,避免了彻底丢失的风险。软件本身不联网,不会上传你的文件信息,隐私方面也没有隐患。
对于查找和清理重复文件这个需求,它是非常好用的。尤是处理音乐和照片时,它的专用版本比普通工具强一大截。界面虽然不算华丽,但功能布局清晰,扫描速度也够快(取决于文件数量和硬盘速度)。唯一需要适应的是,中文界面需要自己手动在设置里切换,默认是英文。如果你经常需要整理电脑里的重复文件,尤是照片和音乐,dupeGuru值得一试。
能。在扫描设置里,你可以选择扫描方式。标准模式下,默认是同时比较文件名和文件内容,但你可以取消勾选“内容”选项,只留“文件名”,这样它就只根据文件名来查找重复了。如果你还想模糊匹配(比如“照片1”和“照片2”也算重复),可以再勾选“模糊匹配”并调整相似度。
音乐版和图片版是标准版的“增强特化版”。标准版可以处理所有类型的文件,主要依赖文件名和文件内容的精确哈希对比。音乐版内置了对音频文件的专门处理逻辑,会读取ID3标签信息,在结果窗口显示歌曲时长、比特率、专辑封面等,并且可以基于标签信息进行匹配,比标准版更懂音乐。图片版则内置了图像感知哈希算法,可以找出视觉上相似的图片(比如同一张照片的不同尺寸、不同压缩质量),而标准版只能找相同的图片(二进制相同)。如果你主要是想整理音乐或照片,用专用版会更高效。