详情介绍
Duix(全称Dialogue User Intece System)是由国内AI数字人领军企业硅基智能(Silicon Intelligence)打造并开源的数字人智能交互平台 。与众多仅提供SaaS服务的数字人工具不同,Duix的核心定位是成为数字人产业的“底层基建”或“智能底盘” 。它通过将核心的数字人驱动技术——包括语音识别(ASR)、语音合成(TTS)、多模态大模型接入、实时渲染等——封装成标准化的SDK和API接口,全面开源 。这意味着,无论是企业开发者还是个人技术爱好者,都可以基于Duix提供的开源源码和开放文档,以极低的成本和门槛,在Android、iOS、鸿蒙等操作系统上,快速构建并部署属于自己的、具备实时交互能力的AI数字人应用。硅基智能的这一战略举措,通过开源生态的力量,推动数字人技术在客服、教育、医疗、娱乐、政务等千行百业的普惠化与规模化落地 。
官网入口地址:
下载地址:
Duix本身是开源的开发平台,核心资源是代码和文档,而非一个供普通用户下载的App。主要的资源获取渠道有两个:
-
开源代码仓库:项目核心代码托管在GitHub上,地址为
https://github.com/duixcom/Duix-Mobile。开发者可以在此获取源码、参与社区贡献。 -
官方文档中心:详细的SDK集成指南、API参考和FAQ可以在
https://docs.duix.com/找到。
功能介绍:
Duix作为一个面向开发者的开源平台,功能是通过开发者集成后,在最终产品中体现的。它的核心功能模块包括:
-
开源核心SDK:这是Duix的基石。平台开放了从底层推理引擎到上层商业化应用逻辑的源代码 。开发者获得的不只是一个API调用接口,而是完整的、可自主掌控的技术能力,这为深度定制和创新提供了无限。
-
多终端一键部署:Duix SDK 针对移动端进行了深度优化,支持在Android和iOS设备上一键部署 。同时,它也能很好地适配平板、车载系统、智能大屏等多样化的终端,让数字人真正无处不在 。
-
多模态AI能力集成:平台本身是一个“智能底座”,它允许并鼓励开发者灵活接入业界秀的第三方大模型、ASR和TTS引擎 。这意味着你可以为你的数字人自由选择的大脑、最精准的耳朵和最动听的声音。
-
低延迟实时交互:Duix 的核心技术在于实现真人级的实时交互。模型支持50帧/秒的超流畅画面质量,视频生成效率超过1:0.5(即生成速度是原始视频长度的一半),能够精准同步动作、微表情和唇形,让对话体验无比自然 。
-
低算力与低网络依赖:得益于高效的算法优化,Duix数字人对硬件算力要求不高,普通的手机、平板都能流畅运行 。同时,它对网络的依赖也较小,非常适合在地铁、银行、偏远地区等网络条件不佳的环境下部署 。
-
丰富的形象与个性化定制:平台内置了多个(如14个)不同风格的公共数字人形象模板,供开发者快速上手和测试 。对于有深度定制需求的客户,硅基智能也提供基于真人视频的付费数字人形象和声音克隆服务,打造独一无二的专属分身 。
-
灵活的开发与集成支持:Duix提供了详尽的开发文档和SDK接口,支持开发者进行二次开发和创新。通过OpenAPI可以获取对话详情,并在业务层实现唤醒词、打断语等高级逻辑控制 。
应用场景
由于开源、灵活、低门槛的特性,Duix几乎可以被应用于所有需要“人机交互”的领域:
-
恋爱社交与情感陪伴:开发者可以快速创建虚拟男友/女友应用,为用户提供情感支持和社交体验 。
-
智能客服与公共服务:在地铁、银行、政务大厅部署数字人自助服务机,提供24小时不间断的业务咨询和办理引导 。
-
企业服务与商业应用:作为虚拟客服、产品代言人或内部培训讲师,集成到企业的APP、官网或大屏中 。
-
教育娱乐与内容创作:创建虚拟教师进行互动式教学,或打造虚拟主播用于游戏直播、短视频内容生成 。
-
行业专家与知识传播:结合私有知识库,打造特定领域的“数字人专家”,一对一解答专业咨询 。
定价或应用示例等主要信息
-
开源模式与收费策略:Duix的核心平台是开源免费的,这极大地降低了开发者和企业尝试数字人技术的门槛 。硅基智能的商业化模式主要依托于“开源生态 + 高端定制”的双轮驱动 。这意味着,基础的技术能力是开放的,但以下几类服务是付费的:
-
高端定制服务:为客户提供专属的、高质量的数字人形象和声音克隆服务。定制价格为9800元/套(包含形象和声音),需要客户提供3-5分钟的真人出镜口播视频作为训练素材 。
-
企业级解决方案与支持:为大型客户提供从0到1的全流程技术支持和项目定制开发服务。
-
云服务与API调用:如果客户不想自己部署维护,会使用硅基智能提供的云端托管和API按需调用服务。
-
-
技术实力与行业地位:Duix的背后是硅基智能强大的技术护城河,公司拥有137项授权专利,自研的“炎帝大模型”为数字人提供了多模态的“行业脑” 。公司已累计交付超8万个数字人,服务用户超50万,市场份额在国内数字人智能体提供商中位居第一 。
-
战略升级:硅基智能正从产品竞争转向底层能力输出,提出了“硅基 inside”战略,而Duix正是这一战略的核心载体,成为数字人产业的“英特尔” 。
-
应用示例:
-
开发者应用:一位独立开发者可以基于Duix的开源代码,在几天内就开发出一款属于自己的“虚拟历史老师”App,让学生与爱因斯坦的数字人形象实时对话。
-
银行智能大屏:某地方银行在营业大厅部署了一体机,集成了基于Duix SDK开发的数字人大堂经理“小慧”。客户可以直接通过屏幕与她对话,咨询业务办理流程、查询利率,大大减轻了人工柜台的负担。
-
情感陪伴创业:一个初创团队利用Duix的开源能力,迅速搭建了一个面向独居老人的“虚拟伙伴”小程序,提供日常陪伴、健康提醒和简单聊天服务。
-
Duix常见问题
Duix数字人平台是由国内领先的AI数字人企业南京硅基智能科技集团股份有限公司开发的 。这家公司成立于2017年,是腾讯重点投资的AIGC数字人公司,也是国家级专精特新“小巨人”企业。
Duix的官网是 https://duix.com/ 主要提品理念和战略介绍。对于想使用的开发者来说,更重要的两个入口是:开源代码仓库地址(https://github.com/duixcom/Duix-Mobile)和官方技术文档中心(https://docs.duix.com/)
你可以把Duix理解为数字人领域的“安卓系统”。它不是一个直接面向普通用户的App,而是一个开源的、供开发者使用的“技术底座”。的不同在于,它把核心的SDK代码都公开了,开发者可以免费下载、自由修改,然后用它来搭建自己的数字人应用,而不是只能使用别人做好的成品。
如果你不会编程,直接使用Duix会有点门槛。最直接的方式是,你可以联系硅基智能官方,购买他们的“数字人形象克隆”付费服务 。你提供一段3-5分钟的视频,他们就会为你训练出一个专属的数字人分身。然后,你可以找开发者朋友,或者委托技术团队,基于这个分身的模型和Duix的开源代码,为你定制开发一个专属的数字人App或应用。
Duix的核心技术平台是开源免费的,任何人都可以免费下载源码、接入使用 。但如果你想拥有一个专属的、高度逼真的个人数字人形象,就需要支付形象定制费用。根据息,定制价格为9800元/套(包含形象和声音) 。如果企业需要深度的技术支持或复杂的项目定制,也会产生相应的商业服务费用。
对于开源平台来说,“安全可靠”主要体现在两个方面。一是代码本身的安全性,硅基智能作为拥有137项专利的成熟AI公司,核心算法的质量和稳定性是经过市场验证的 。二是使用过程中的安全性,开源意味着你可以审查代码,确保它没有后门或恶意行为,这在某种程度上反而比闭源的“黑盒”更安全。在你自己部署和应用时,数据安全和网络安全就需要你自己来负责和保障了。
有几个小建议。第一,善用社区和文档,Duix的官方文档和GitHub社区是解决问题的第一站 。第二,灵活集成大模型,Duix允许你自己接入进的LLM作为数字人的大脑,比如OpenAI、Claude或国内的优秀模型,这样能让你的数字人更聪明。第三,关注移动端特性,Duix对手机端的适配做得很好,开发时可以优先考虑利用手机的摄像头、麦克风等硬件,创造更有趣的交互体验 。
特色就是开源和作为技术底层的灵活性。这就带来了很多独特的用途:你可以用它在无网络或弱网络的环境下(如地铁、井下)部署数字人 ;你可以把它嵌入到车载系统、智能家电等物联网设备中 ;创业公司可以基于它快速构建原型产品,拿到融资后再进行商业化开发;甚至你可以用它来创建一个私有的、离线运行的数字人,保护个人隐私。
当你使用Duix的开源代码时,代码是公开的,不存在“交给”平台的问题。但当你使用付费定制服务,需要上传视频素材时,就涉及数据安全。硅基智能作为服务众多大型银行、运营商的企业,会遵循严格的隐私政策和数据安全协议,对上传的数据进行加密处理和保护 。在定制前,建议你仔细阅读相关的用户协议和隐私政策,了解他们如何处理你的数据。
从技术指标和行业反馈来看,Duix的数字人交互效果非常好。它支持50帧/秒的超流畅画面,远超电影级标准,动作和表情非常自然 。同时,它的唇形同步技术能做到像素级匹配,延迟极低,再加上它对低算力的友好,能确保在各种终端上都有流畅、逼真的用户体验。
Duix本身是一个交互式开发平台,它的核心是“实时对话”,而不是像Sora或HeyGen那样的“批量视频生成工具”。所以它不能直接生成PPT。但是,你可以基于它开发出一个能讲解PPT的数字人应用。比如,你在手机上打开基于Duix开发的App,上传一个PPT,然后你的数字人助理就能看着PPT,实时地为你或你的同事讲解每一页的内容。
对于有开发经验的工程师来说,这非常快。第一步,去GitHub下载Duix-Mobile的源码。第二步,根据官方文档,在Android Studio或Xcode中打开项目,配置好你的ASR和TTS API密钥(或者先用示例的)。第三步,在代码里找到初始化数字人的部分,替换成一个公共形象或者你定制的数字人模型ID。第四步,编译运行到手机上,一个能跟你实时对话的数字人就出现了。整个过程熟练的话用不了一个小时。
在纯开源的本地部署模式下,没有限制。你可以和你的数字人聊一整天,因为所有计算都在你本地的设备上完成,不依赖于云端服务。但如果你在应用中接入了第三方的云端大模型API(比如GPT-4),那么对话长度和次数就会受到那个API的限制。所以,Duix本身不设限,最终的限制取决于你为数字人选择了什么样的“大脑”。
| 分享笔记 (共有 篇笔记) |