声明:本文来自于微信公众号 光锥智能,作者:魏琳华,授权Soraor转载发布。
大模型落地如火如荼,从上一代AI浪潮中杀出来的商汤,嗅到了这里面新的机会。
在最火的具身智能赛道,这两年诞生了许多明星创业公司。这些创业公司的创始人往往拥有技术明星的光环,不少都是在学术界中某个技术领域中响当当的领头人。
这些初创公司虽然在某一个单点技术上遥遥领先(大脑、小脑或者本体),但在机器人落地过程中,要突破从单一技术到整体复杂产品的整合。
比如,机器人要做到“能听会看”,就要深度集成AI大模型的能力,需要与AI服务商有密切的合作。
“大家不需要从头再去做视觉算法研发,这样效率比较低。”商汤科技联合创始人、大装置事业群总裁杨帆对光锥智能称,“比如在一些特定的任务抓取识别上,只要能快速满足需求,厂商可能就多卖出去几十台机器人。”
商汤科技联合创始人、大装置事业群总裁杨帆
除了AI模型,不少具身智能公司也面临“数据缺失”“模拟物理规则”等难点。“商汤有这方面的能力和积累,比如之前做自动驾驶就会有一些历史的数据和解决方案,这些和具身智能是相通的。”杨帆称。
“不只是基础设施,算力之外,还有很多相关服务。”在具身智能行业的实践,体现出商汤在生成式AI时代的新商业思考——要围绕AI做从模型、数据、算力等多个方面的技术服务商。
包括具身智能在内,加上AIGC、AI4S(AI 科学)、传统企业智能化转型,商汤在4月10日的技术交流日上给出了四个行业的解决方案。这些方案,并不是商汤一厢情愿的臆想,而是过去两年中,在行业中淬炼出的“金丹”。
扎根行业,商汤的AI 基础设施——大装置落地就成了有根之木,有源之水。
一个不懂模型的AI 基础设施厂商,不是一个好服务商。商汤用大装置证明了这一点,也希望利用这一点赚取新时代的“技术溢价”。
受够了传统企业服务的苦,对商汤而言,从上一代项目制的业务中脱身,转而做含金量更高的AI技术服务,才能真正体现技术的商业价值。
低门槛、高性价比
AI基础设施怎么做?
直到今天,“性价比”仍然是AI大模型的生死线。
虽然DeepSeek在年初极大地推动了大模型的普及和成本降低,但在如何让大模型变得便宜好用的命题上,AI 基础设施的潜力还远远没有挖掘完毕。
“今天,AI 基础设施供应商对客户的需求满足度还远远不够。”杨帆说,“今天最优秀、效果最好的模型,厂商还没办法拿到市场上直接提供服务,因为它的性价比太低。”
平衡大模型的性能和成本,却不是一个简单的命题。一个不同的选择,会造成截然相反的效果。
杨帆举了一个例子:
一家厂商需要做一个基于DeepSeek的对话产品,并根据自有数据库再进行定制化训练。但对于这样一个模型来说,在调用量高和低两种情况下,如果都采用分布式部署架构,两者的性价比相差极大。
由于分布式架构本身硬件成本较高,在QPS(每秒查询数)高的情况下,它可以高效利用资源,实现极致性价比;但在QPS低的情况下,反而会造成硬件资源闲置过多,从而让成本比传统部署更高。
所以,AI基础设施从来不是一门只靠硬件就能做好的生意,从算力到模型,每一层都有无数个细小的选择会决定最终的成果。
商汤正在做的,就是通过AI基础设施和模型训练的配合,结合AI基础设施的三要素:算力、算法和数据,将大模型的性价比压缩到极致。
作为底层架构的硬件端,商汤算力充足。到2024年底,商汤大装置的算力规模比去年翻了近一倍,达到23000PetaFlops,超过了整个北京的公共智能算力。
同时,商汤算力的构成一部分来自于国产芯片,避免被单一GPU“卡脖子”风险。但多种芯片难免会降低数据处理效率,商汤国产芯片异构训练效率为同构的95%,保持效率的同时,商汤还能做到保持算力稳定、充足,其算力利用率高达80%。
在优化算力的基础上,商汤通过算法优化策略,实现大模型训练、推理两部分的性能大幅提升。以推理为例,针对DeepSeek V3等第三方模型,商汤每秒处理Token数(TGS)已达1600+,在未做专项优化下,训练效率竟然能优于DeepSeek的官方成绩,要知道,DeepSeek可是以效率和成本著称。
除了把性价比压到极致,商汤的另外一个努力方向,就是把大模型业务做到更加易用。
当开源成为行业主流,商汤拥抱开源,是为了让厂商能够自由调用开源工具,降低大模型训练门槛。
“今天有很多好的开源产品,它们帮助厂商更快地迭代自己的模型。”杨帆举了个例子:
一个做模型同时做应用的极客团队,在研发阶段先用纯开源的工具体系做快速搭建,验证PMF(Product Market Fit,产品市场匹配度),但在业务上量的情况下,企业就需要选择一个能帮助商业化的AI基础设施服务商。在这个过程中,客户希望继续使用原来的开源工具,但服务平台往往接口无法对齐,需要重新实现。
针对一系列开源衍生的需求,商汤升级的大装置2.0版本给出了三个能力支持:开源兼容接口帮助厂商实现零成本迁移;模型广场让用户自由选择多种开源大模型并提供调用,实现零门槛使用;商汤的SenseCore平台还提供优化过的各种开源组件,让用户可以根据自己的需求来自由调用。
当千行百业对于大模型的需求提高到“拿来即用”的标准上,商汤想做的,就是把模型的性价比打下来,同时让厂商自身业务融入大模型的门槛降得更低。
懂客户
商汤怎么做差异化壁垒?
不过,在竞争激烈的AI基础设施供应商赛道中,商汤要想把营收做到第一梯队,它面临的竞争压力依然不小。
面对硬件资源更加充沛,同时靠边际效应把成本打得更低的云厂商来说,商汤们难以烧钱奉陪打价格战。
竞争密切的领域,商汤怎么厮杀出重围?
除了懂模型,更要懂客户。
在和千行百业的客户探索AI技术落地的十年中,商汤在无数个实践结果后,最终推出了目前需求密切、落地更成熟的四大行业解决方案——具身智能、AIGC、AI4S(AI for Science)和传统企业智能化转型。
作为既做模型,也做AI基础设施的服务商,商汤内部的产品、技术部门拥有成熟技术,把具体行业需要的对应能力直接“复制粘贴”提供给用户,免去后者从头钻研的时间和精力成本。
以具身智能行业为例,针对数据短缺的问题,商汤能通过“仿真+真机”双通道的解决方式,生成大量可用数据,直接用到模型的训练中。将这些能力整合到一起,商汤针对具身智能行业拿出了“端到端”式的方案,从数据生产、工具支撑到模型研发,都能一手包办。
这种“拿来即用”的产品在商汤内部还有很多。比如具身智能同样需要应用的视觉算法,再到自动驾驶的历史数据,还有模型训练中需要的适配工具。
除了具身智能行业外,商汤还把这种能力延伸到了其他行业。
“实际上,无论是互联网类客户,还是一些线下传统行业客户,他们除了资源、平台、训练和推理的成本和性价比之外,还有很多不同的需求。”杨帆列举了很多来自客户的具体需求:
比如,有的厂商需要做模型定制,但模型需要在网信办备案审核,但整体流程对于厂商来说复杂耗时,商汤可以把审核能力开放给用户;有的厂商需要数据私有化,不仅要保护数据安全,甚至可能需要国密认证,商汤也能提供对应关键能力。
拿出成熟技术、打出“更懂客户”旗帜的商汤,并未止步于基础的MaaS服务,而是选择再加码人才,帮客户走完落地的每个关键点。
在技术交流日中,杨帆提及,商汤在2023年专门成立了一个子业务板块“AI专家服务”。
“其实在给产业智能化客户提供服务时,我们发现,追求一键式部署、无代码编辑等自动化功能对于这些厂商来说意义甚微。”杨帆说。
企业一般的需求是希望基于一个基础模型,根据自己已有的数据做定制化模型,并且要求推理能够满足他们对性价比的要求。
对于需求明确,但对AI技术不够熟悉的客户来说,标准化的解决方案没办法解决所有问题。在这种情况下,商汤往往需要在配置AI基础服务的基础上加上服务能力,派出专家提供支持。
靠着人才服务的支持和技术know-how的输出,商汤拥有了超越其他AI企业的差异化壁垒。
抓住生成式AI浪潮
商汤蝶变
技术的浪潮滚滚向前,一个残酷的事实是,能真正穿越周期的企业是极少数。
2016年的深度学习浪潮中,如今留下还能坚持做通用大模型的已经寥寥无几;2023年的大模型浪潮中,六小虎也开始分化,不少已经退出通用大模型的研发。
在巨头之外,商汤是一个幸运儿。
目前,商汤自己一边做模型,一边把这个过程中习得的能力和优势复制给客户,把经验做成真正有用的商品,成为了AI基础设施服务中价值更高的附属品。
在AI基础设施服务+大模型服务的配合下,商汤的转型已经初见成效。
根据IDC报告,2024年H1,商汤以14.8%的市场份额位居中国大模型解决方案市场第二。
目前,生成式AI也成为了商汤营收的中流砥柱,这代表了营收质量的提升。据财报,2024年,商汤生成式AI相关业务收入超过24亿元,同比增长103%;其收入占总业务比例从2023年的34.8%,升至2024年的63.7%。商汤董事长兼CEO徐立曾表示,生成式AI也是商汤最快突破20亿元规模的业务。
从AI1.0时代到2.0时代,生存超过十年的商汤,一直埋头做AI技术,保证核心技术在第一梯队。
大装置业务,是商汤“反向求解”的一次实践。
早在2018年,由于做感知智能时遇到了海量数据处理的问题,商汤基于技术需求,打造了国内首个AI千卡集群原型机。2020年,商汤又建立了国内首个智算中心。彼时,这样的重资产投入对于商汤来说,是一笔不小的成本。
但正如英伟达为了游戏的极致视觉体验钻研GPU,从而在深度学习的时代“无心插柳柳成荫”,成为当下AI时代的最大赢家。商汤在AI1.0时代的资产投入,变成了AI大模型训练的“矿井”。
再以AI基础的三要素算力、算法和数据作为维度评判,商汤在拥有充足算力的基础上,既有底层硬件优化、自研大模型的经验,又有合成数据的能力和历史数据沉淀。这就使商汤从一般的AI基础设施供应商中脱颖而出。
技术交流日上,商汤大装置面向具身智能、AIGC、AI4S以及传统企业智能化转型推出四大行业解决方案,则又是一次“反向求解”的成果。
对于一家公司而言,高举高打的战略固然重要,但贴地飞行的经验总结才是制胜关键。毕竟,实践出真知。
商汤在和客户合作的过程中,能深度洞察到行业的痛点和需求,再根据自身落地的实践成果,把成功的经验重点做批量复制,最终完成商业的闭环。
重技术的商汤,在一次次反向求解中,终于找到了属于技术主义者的胜利。