详情介绍
腾讯云智能数智人是腾讯云推出的一站式虚拟数字人解决方案。它解决了传统视频拍摄成本高、后期修改难,以及真人客服响应时间受限等问题。用户只需提供少量视频与音频素材,即可获得一个外貌、声音与真人近似的“数字分身”,或者使用平台预设的卡通/写实形象库。这个分身能根据输入的文本自动生成口型、表情和肢体动作,完成新闻播报、产品讲解等视频内容,也可以被集成到App或网页中,作为虚拟客服与用户进行实时语音对话。该产品已在媒体、教育、政务、金融和文旅等多个行业落地应用。
官网入口地址
腾讯云智能数智人产品官网:https://cloud.tencent.com/product/ivh
下载地址
腾讯云智能数智人本身不是一个需要用户下载安装的独立App软件,而是云服务产品。用户通过腾讯云官网控制台在线使用和管理数智人。交互能力通过SDK集成到企业自己的应用(如微信小程序、PC软件、Web网页)中,终端用户无需单独下载“数智人App”。
功能介绍
-
多样化形象生产:
-
2D真人类:包含“精品”与“小样本”两档。精品版需在摄影棚录制,支持在播报时精准匹配预设手势(如伸手、点头);小样本版仅需3分钟真人口播视频和100句语音,24小时内快速生成形象。
-
3D类:提供写实、半写实、卡通三种风格。支持照片建模,可通过照片快速生成3D头像,并搭配整套身体模型。
-
-
双模式驱动交互:
-
播报模式:输入文本或上传音频,系统自动生成由数智人播讲的视频文件,支持调整语速、音色及插入指定动作。
-
交互模式:提供API/SDK接口,集成后可实现用户提问、数智人实时响应的语音对话,并做到唇形、表情与语音同步。
-
-
多模态技术融合:底层整合了腾讯云的语音识别、语音合成、自然语言理解及唇形驱动技术,确保虚拟人口型准确、表情自然。
-
灵活部署与管理:支持在云控制台统一管理多个数智人角色,可随时切换服装、姿态和声音,并支持按并发路数扩容。
应用场景
-
媒体内容生产:为记者、主持人制作数字分身,快速生成财经播报、天气提醒等常态化短视频,7×24小时不间断发稿。
-
企业培训与教育:将名师的课程制作为数智人版本,高效产出多语言版本教学视频,或作为助教回答学生重复性问题。
-
政务与公共服务:部署在博物馆、办事大厅的自助查询机上,作为虚拟导览员,提供沉浸式交互指引。
-
金融与客服:在银行App或证券交易软件中嵌入交互数智人,协助客户办理业务查询、理财产品介绍。
-
品牌营销:利用腾讯IP授权(如QQ family形象)或定制品牌虚拟代言人,在电商直播、虚拟展厅中与消费者互动。
定价与应用示例
-
定价模式:产品主要采用预付费资源包的计费方式,分为“交互数智人”和“播报数智人”两类。
-
播报数智人:主要按视频生成时长购买。“2D小样本”形象有1小时、10小时、50小时、100小时等规格的资源包。制作形象本身不单独收费,但调用服务生成视频需消耗时长。
-
交互数智人:主要按并发路数购买。“2D精品”形象有特惠体验包(1并发)、月包、年包等,适合用于实时对话场景。
-
定制服务:特殊的2D精品形象(需影棚录制)或3D模型定制,需要联系销售人员进行线下报价。
-
-
应用示例:国家博物馆利用该技术打造了数智人“艾雯雯”,为线上观众提供文物讲解和虚拟导览;蒙牛乳业在内部培训及对外宣传中启用了“数字总裁”形象;澎湃新闻总编辑通过自己的数字分身在外滩新媒体年会亮相发言。
腾讯云智能数智人常见问题
是腾讯公司旗下腾讯云开发的,核心技术来自腾讯优图实验室和腾讯AI Lab。
网页版管理后台没有公开的直接链接,你需要先登录腾讯云官网,在产品搜索框输入“智能数智人”,进入产品页后点击“立即使用”或“管理控制台”才能进入操作界面。
你可以把它理解成一个能快速复制你(或者你公司IP形象)的数字替身。给它一段文字,它就能像真人一样口齿清晰地念出来,表情和嘴型都对得上,要么帮你批量生成口播视频,要么放在App里当智能客服。
分两种情况。做视频的话,在控制台选好形象、输入文案,点生成就能导出MP4。做交互客服的话,需要技术人员把你的App或小程序接入腾讯云的SDK,用户说话,数智人就能回答。
不是免费的,是付费云服务。如果你只是偶尔玩玩,可以买个便宜的“播报数智人小时包”试试水,几百块钱能生成1小时视频。如果是企业做7x24小时的客服,那就得买“交互数智人”的并发套餐,几千到上万一年都有。
基本不会读错常用字。遇到多音字或特定专业术语(比如人名“区”这个姓),你可以在文本里用拼音纠正,比如打“ou”,它就能读准。
视频内容的版权算你的。但数智人的形象版权要看情况,如果你用的是腾讯官方提供的通用模特形象,你不能拿去申请商标;如果是用你自己的脸定制的,那形象版权就是你自己的。
静态截图仔细看能看出是合成的,但放在手机小屏上看短视频,神态和口型已经很自然了。尤适合不需要太强情感表演的新闻稿、产品说明书播报。
腾讯云在这方面有严格的安全认证。你上传的训练素材在数字人制作完成后,可以选择删除。数据存储和传输都是加密的,不会随意泄露。
生成视频非常好上手,就像发朋友圈一样,选照片、写文字、点发送。但制作你自己的专属2D形象,对视频素材要求比较高,需要纯色背景、光线均匀、人像不能切边,这个需要稍微花点心思。
不能直接生成PPT文件。但你可以做好PPT,然后对着PPT讲一遍录制视频,把录音和PPT发给它,它能生成一个站在大屏幕前讲PPT的数智人讲师视频,效果比你直接录屏好。
播报数智人单次生成视频最长支持1小时,但一般建议一次生成5到10分钟,这样万一中间说错字,修改成本更低。
交互模式下,用户每次提问的语音时长建议在1分钟以内。文本驱动播报的话,一次输入几千字的文稿都能处理,只是生成时间会相应变长。
| 分享笔记 (共有 篇笔记) |