Diffree是一个基于扩散模型的AI图像编辑工具。它的核心能力是“用文字给图片加东西”。你不需要像用传统软件那样抠图或画蒙版，只要用句子描述你想添加什么，AI就能自动找到合适的位置，生成一个看起来毫无违和感的新物体放进你的照片里。

对于普通用户来说，目前使用Diffree有一定的技术门槛。你需要访问它的GitHub项目页面，按照说明将代码和模型下载到你的电脑上，并在配置好的Python编程环境中运行它。使用过程包括：准备一张图片，输入描述新物体的文本指令，然后运行模型脚本生成编辑后的图像。

对于开发者和技术爱好者而言，它是一个强大且前沿的工具。但对于没有编程基础的普通用户来说，目前的使用门槛较高，不如那些有现成网页或App的AI工具“好用”。不过，它在解决“文本驱动加物”这个具体任务上的效果，在学术界被认为是领先的。

Diffree：一句描述精准加物，你的AI创意图像编辑师-代码号

Name: Diffree
Author: 原创

Diffree

用户：原创发布日期：2026-01-23 已有人查阅

Diffree是一项的图像编辑AI技术，它允许用户仅通过简单的文字描述，就能在现有照片中无缝添加全新的对象。这项技术免去了传统方法中需要手动绘制选区、蒙版或边界框的繁琐步骤，由AI自动预测新物体的位置和形状，并确保与原始图像的光影、色调和空间透视融合。

在当今的数字创作时代，图像编辑是一项核心技能，但传统的专业软件操作复杂，门槛较高。由厦门大学多媒体可信感知与高效计算教育部重点实验室、上海人工智能实验室OpenGVLab和香港大学联合研发的Diffree，正是为了降低这一门槛而诞生。

Diffree的核心是基于扩散模型的“文本引导无形状对象修复”技术。在于，它将“添加物体”这一复杂任务简化为一个自然对话过程：你只需要告诉AI“在桌面上添加一个咖啡杯”或“在天空中添加一群飞鸟”，模型便能理解意图，并智能地完成从位置布局到最终合成的所有工作。

这项技术不仅在学术界受到关注，背靠的研发机构也实力雄厚。厦门大学的多媒体可信感知与高效计算教育部重点实验室是人工智能领域的重要研究基地，而上海人工智能实验室的OpenGVLab团队则以领先的“书生”系列多模态大模型闻名。强强联合，确保了Diffree技术的前沿性与可靠性。

Diffree的项目主页与研究论文地址为：https://diffree.org/zh

作为一个前沿的AI研究项目，Diffree的主要获取方式是代码开源。源代码和模型已发布在GitHub上，感兴趣的开发者、研究人员或技术爱好者可以访问项目仓库进行下载和本地部署。这意味着用户可以在本地环境中运行它，无需依赖在线服务。

Diffree的功能围绕“智能”、“自动”和“一致”三大核心构建，具体体现在以下方面：

全文本引导的智能对象添加：这是Diffree最根本的功能。用户无需任何绘画或选区操作，仅通过输入文本指令，即可指定要添加的物体。模型内置的掩码预测模块会自动推断出物体在图像中最合理的位置和形状轮廓。
卓越的背景一致性保持：许多早期文本编辑工具在修改图像时容易导致背景失真或改变。Diffree经过专门训练，能够在添加新对象的同时，严格保持原始图像背景的像素几乎不变，确保编辑后的照片看起来真实自然，毫无PS痕迹。
出色的空间适应性与光影融合：模型不仅放置物体，更理解场景。它会根据原图的视觉上下文（如光照方向、阴影、纹理和透视关系），自动调整新增物体的外观，使在光影、色调和空间比例上与周围环境和谐统一。
支持迭代式编辑：你可以对同一张图片进行多次“添加对象”的操作。Diffree能够基于之前编辑的结果，继续添加新元素，而不会导致图像质量下降或背景混乱，这为复杂的场景构建提供了。
生成对象实例掩码：Diffree在添加物体的同时，还能输出该物体的精准掩码（Mask）。这个掩码可以被他图像处理工具或工作流利用，用于进一步的精细化编辑，或与像AnyDoor这样的对象替换模型结合，开发出更丰富的应用。