详情介绍
在人工智能飞速发展的今天,大模型的训练对算力、平台和算法的要求达到了前所未有的高度。商汤科技凭借在AI领域的深厚积累,推出了SenseCore商汤大装置——一个解决AI发展瓶颈的基础设施新范式。
SenseCore的名字蕴含着“核心”与“感知”的双重意义,它不仅仅是算力的堆砌,而是一个从底层硬件到顶层应用的全栈式解决方案。核心架构由算力层、平台层和算法层三部分有机组成。
在算力层,SenseCore拥有覆盖全国、统一调度的超大规模GPU集群,管理着超过46,000张GPU,峰值算力高达23,000 PFlops,能够支撑超过20个千亿参数超大模型同时训练,并支持万亿参数大模型的全生命周期。训练效率极高,单卡效率可达千卡的90%以上,并具备分钟级异常检测与断点续训能力,确保长时间训练的稳定性。
平台层则构建了从数据存储、标注,到模型训练、部署、测试的全链路批量化工具链。推出的“日日新SenseNova”大模型体系,涵盖了自然语言处理、图像生成、多模态理解等多种能力,用户可以在此平台上快速开发、微调和部署自己的大模型。同时,平台也提供弹性算力池、云服务器、裸金属服务器等多种AI云计算服务,满足不同客户的灵活需求。
算法层是SenseCore的灵魂。商汤开放了强大的算法库,如业界知名的OpenMMLab和OpenDILab,以及自主研发的算法工具链SensePPL。这些开源工具涵盖了计算机视觉、深度学习、强化学习等各个领域的算法,让开发者可以站在巨人的肩膀上,快速构建和验证自己的模型。
SenseCore的目标是让AI研发像使用电力一样便捷。通过这个“超级工厂”,无论是科研机构探索AI for Science的前沿,还是初创企业训练自己的垂直大模型,或是大型企业实现智能化转型,都能获得从算力、平台到算法的全面支持,大幅降低AI研发的门槛和成本。
官网入口地址
SenseCore商汤大装置的官方信息和服务入口官网为:
通过官网,可以详细了解算力布局、产品服务、解决方案、成功案例,并获取商务联系渠道。
下载地址
SenseCore商汤大装置不提供面向公众的免费模型或软件下载。它是一个企业级的基础设施服务平台,服务主要通过以下方式提供:
-
云服务:客户通过官网联系商务,开通云服务账号,即可在线使用弹性算力池、云服务器、大模型即服务等。
-
私有化/一体机部署:对于有数据合规要求的客户,商汤提供大模型一体机等产品化交付模式。
-
开源框架:商汤的算法库,如OpenMMLab和OpenDILab,是独立开源的,开发者可以直接访问GitHub仓库下载使用,这部分与SenseCore平台相对独立。
功能介绍
SenseCore商汤大装置是一个功能全面、层次清晰的AI基础设施服务平台,核心功能可以按照架构层次和产品形态来划分:
核心架构功能
-
算力层:超大规模AI计算集群
-
弹性算力池 (ECP):面向大模型训练和部署场景,提供企业级的算力管理、角色管理、训练加速、容错和弹性调度。支持分钟级的异常恢复和秒级的模型CheckPoint保存,保障训练任务的稳定性。
-
高性能AI算力池 (ACP):为AI打造的高性能、弹性扩展的算力平台,支持Pytorch、MPI等多种训练框架,适配多种异构芯片,提供大规模分布式训练加速和全生命周期稳定性保障。
-
云容器实例 (CCI):Serverless架构的容器服务,支持一键部署在线服务,秒级启动,自动弹性伸缩,适合AI推理和微服务。
-
云服务器 (ECS):提供CPU和GPU实例的全生命周期管理,支持挂载高性能云盘,适用于开发调试、中间件部署等场景,单实例可用性达99.9%。
-
弹性裸金属服务器 (BMS):提供安全物理隔离的专属高性能物理机,分钟级交付,满足对计算性能和安全性要求极高的业务。
-
-
平台层:全链路AI开发平台
-
大模型即服务:基于“日日新SenseNova”大模型体系,提供包括语言模型、多模态模型、语音模型等在内的多种模型服务。支持在线检索、数据分析、知识库检索等插件,满足客户多样化场景需求。
-
模型开发方案:提供一站式的模型开发平台(如万象模型开发平台ModelStudio),涵盖数据处理、模型训练、微调、评估和部署的全流程。
-
数据平台与工具:集成数据存储、标注、版本管理等功能,为模型训练提供高质量的数据支持。
-
-
算法层:开源与自研算法库
-
OpenMMLab:业界知名的计算机视觉算法开源体系,涵盖分类、检测、分割、姿态估计等数百种算法和预训练模型。
-
OpenDILab:专注于决策智能和强化学习的开源算法库。
-
SensePPL:商汤自主研发的生产力算法工具链,用于模型的推理部署和优化。
-
服务生态与支持
-
专家服务:提供从业务咨询、场景设计、模型训练到推理部署的全栈AI专家服务。
-
安全保障:提供实时监控、分析、预警等安全防护服务,保护用户云上资源的安全。
-
售后保障:汇聚AI行业专家,提供及时、专业的售后技术支持。
应用场景
SenseCore商汤大装置作为基础设施,赋能了众多行业和领域的智能化升级:
-
大模型研发与创新:无论是初创AI公司还是大型科技企业,都可以利用SenseCore的强大算力和平台工具,高效训练自己的基础大模型或垂直领域模型。智象未来(HiDream.ai)利用SenseCore构建领先的视觉多模态基础模型。
-
智慧城市与公共安全:在智慧城市领域,SenseCore支撑大规模的视频分析、事件检测、交通调度等应用,提升城市管理效率。
-
智能汽车与自动驾驶:车企和自动驾驶公司利用SenseCore的算力和算法库,进行海量数据的模型训练和仿真测试,加速自动驾驶感知算法的研发与优化。
-
AI for Science:科研机构和高校利用SenseCore的大规模算力,进行生命科学、材料科学、气象预测等领域的科学计算和模型模拟,推动科研创新。
-
企业智能化转型:传统企业可以利用SenseCore的大模型即服务和弹性算力,快速构建智能客服、智能营销、智能文档处理等应用,实现业务流程的智能化升级。深信服基于SenseCore训练安全大模型。
-
机器人:具身智能和机器人公司,如银河通用机器人,利用SenseCore进行多模态大模型的训练和优化,赋能机器人的感知与决策能力。
必要补充信息
-
定价:SenseCore是面向企业客户的服务平台,无公开的统一标价。服务模式多样,定价方式也比较灵活:
-
云服务按需付费:使用弹性算力池、云服务器等资源,根据资源规格和使用时长计费。
-
大模型API调用:调用“日日新”大模型服务,按Token数量或调用次数计费。
-
一体机/私有化部署:对于大模型一体机等产品化方案,为一次性采购费用。
具体价格需要企业用户通过官网联系商务,根据实际需求(如算力规模、模型调用量、部署方式)获取详细报价。
-
-
算力规模:截至官网信息,SenseCore管理的GPU数量超过46,000张,峰值算力达到23,000 PFlops,并包含2,000 P的国产化算力,支持10,000卡级别的大规模并行训练。
-
全国算力布局:SenseCore实现了算力的全国联网统一调度,节点覆盖上海、深圳、广州、福州、济南、重庆等城市,可支撑超过20个千亿超大模型同时训练。
-
交付模式:平台提供灵活的交付模式,包括云服务交付和产品化License交付(如一体机),以满足不同客户对数据安全和部署方式的差异化需求。
-
生态贡献:商汤通过开源OpenMMLab、OpenDILab等项目,为AI开发者社区做出了重要贡献,也通过这些开源项目吸引了大量开发者,形成了良好的技术生态。
商汤大装置常见问题
SenseCore商汤大装置是由商汤科技开发并运营的。商汤科技是行业领先的人工智能软件公司,在计算机视觉和多模态大模型领域拥有深厚的技术积累。
平台的统一官网入口是 sensecore.cn 不过,这个网站主要是产品介绍、解决方案展示和商务接洽入口,并没有像普通聊天软件那样对公众开放的免费网页版试用。企业和开发者可以通过官网联系商务,申请开通云服务账号或咨询产品方案。
你可以把它理解成一个“AI超级工厂”或者“AI发电厂”。它不是一个软件,而是一整套强大的基础设施。它把几万张高性能GPU、全流程的AI开发平台和顶级的算法库整合在一起,让企业能像用电一样,方便地获取训练大模型所需的算力、工具和技术支持,自己不用从头搭建复杂的系统。
企业可以通过两种主要方式使用。一种是使用云服务:联系商汤开通账号后,就可以在云端直接使用弹性算力池、云服务器,或者直接调用“日日新”大模型的API,像用水电一样按需付费。另一种是私有化部署:如果企业数据特别敏感,可以采购大模型一体机,把整套能力部署在自己公司内部。
SenseCore是面向企业客户收费的商业服务平台,没有免费的公众版本。它的收费模式比较灵活,包括云资源的按量付费、大模型API的调用付费,以及一体机的一次性采购费用。具体价格需要企业根据自身需求和商务团队沟通确定。
非常可靠。在稳定方面,SenseCore具备分钟级的异常检测与自动恢复能力,支持秒级的模型CheckPoint保存,即使遇到硬件故障也能快速恢复训练,确保长时间的大模型训练任务不会中断。在安全方面,平台提供多方位的监控、分析和安全防护服务,保护用户数据和计算资源的安全。
有的。对于不稳定的研发任务,可以多用弹性算力池 (ECP),按需申请和释放资源,避免资源闲置浪费。对于常规的推理服务,可以部署在云容器实例 (CCI)上,利用自动弹性伸缩能力,在访问量低时自动缩减资源,降低成本。商汤的专家服务团队也可以帮助优化模型和训练流程,间接节省成本。
特色是“”和“算法基因”。它不只是卖算力,而是把商汤自研的算力层、平台层、算法层深度整合。特别是它开放了业界顶尖的OpenMMLab等算法库,用户可以直接使用这些经过验证的先进算法,相当于站在商汤的肩膀上搞研发。同时,它深度支持“日日新”大模型的全周期开发,从训练到部署的链条非常顺滑。
平台提供了多层次的数据安全保障。使用云服务时,数据在传输和存储时会加密,并有访问控制和审计机制。如果对数据安全有级别的顾虑,可以选择私有化部署方案,将整套平台部署在企业内部,所有数据由企业自己掌控。
SenseCore主要面向企业客户,尤是有大规模AI研发需求的客户。对于个人开发者或小型创业团队,虽然直接采购云服务的门槛稍高,但可以利用商汤开源的OpenMMLab等免费算法库进行前期研发。当项目发展到需要大规模算力训练时,再考虑接入SenseCore平台。
SenseCore是底层基础设施,不能直接生成PPT文件。不过,你可以利用基于SenseCore构建的上层应用,比如“日日新”大模型平台上的“商量”或“小浣熊”等工具,让它们帮你生成PPT大纲、文案和图表,然后再手动整合到PPT里。
SenseCore本身不直接生成视频,但它是生成视频的“动力源”。基于SenseCore的强大算力,商汤科技训练出了能够生成视频的大模型(如“日日新”体系中的相关模型),你可以通过上层应用(如“如影”数字人生成平台)来生成数字人播报视频等内容。
对于平台提供的“大模型即服务”API,会有一定的初始调用配额或速率限制,具体取决于你选择的服务套餐。企业客户可以根据业务需求,与商汤商务团队协商定制符合预期的调用额度、并发量和服务等级协议。
| 分享笔记 (共有 篇笔记) |