ChatGPT引发的大模型热潮依然汹涌,吸引着企业和资本争相涌入。
在市场喧嚣之前,商汤科技在对AI基础设施SenseCore大装置进行研发投入的路上已经走过了多年,甚至显得有些孤独。
(相关资料图)
2023年,AI赛道被重新点燃,厚积薄发的商汤科技终于晒出了深耕AI领域多年的成果。4月10日,商汤分享了以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布了“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
在活动现场和直播平台上,商汤大模型引发了观众轰动:“超出预期”“主播和UP主要失业了”。更有投资者发出感叹:商汤大模型目前几乎秒杀前期已经发布的其他大模型。
对商汤科技而言,从2014年成立开始,其对大模型及相关技术的积累就贯穿企业生命线之中。此间,质疑也好、赞誉也罢,商汤始终坚持着自己的独特发展路径。
多年前瞻布局
2022年末,大模型ChatGPT横空出世掀起市场热潮,资本终于意识到了超大模型的研发价值。一夜之间,AI投资再度火热,国际大厂纷纷入局;二级市场上,人工智能概念股更被炒作得“沸反盈天”。
但,人工智能产业发展永远不是依靠投机和市场情绪的追逐,技术才是“硬道理”。
“在商汤,我们这么多年来一直在积极投入建设超大规模的算力,也一直在训练越来越大的模型。”商汤科技董事长兼CEO徐立在技术交流日上表示。
2018年,商汤开始了AI大模型的研发,一年之后已经具备了千卡并行的系统能力。那两年是商汤在大模型研发的起步。2019年,商汤自研了一个10亿参数的CV大模型,实现了当时业界最好的算法效果。
2022年,商汤科技人工智能计算中心(AIDC)在上海临港正式投用,成为SenseCore大装置的重要算力基座,也是亚洲最大的人工智能计算中心之一。
经过5年的探索,商汤建设的AI大装置已处于业界领先,大装置上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
至今,商汤科技仍保持着稳定、高水平的研发投入。2022年,商汤科技研发投入达到40.14亿元。同时在2022年,商汤科技的人均研发效率持续提升,人均每年研发模型数相较于2021年进一步提高了90%,达到9.35个。
商汤此次发布的“日日新SenseNova”大模型体系下的语言大模型,以及AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,是商汤大模型技术突破的最新动向,更是这些年商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新研发体系下的成果展示。
具体来看,在“日日新SenseNova”模型下,各应用各有特色,比如:
“秒画SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成;客户还可根据自身需求训练生成模型。
商汤表示, “秒画SenseMirage”是一个包含商汤自研AIGC大模型和便捷的LoRA训练能力,并提供第三方社区开源模型加速推理的创作平台,旨在为创作者提供更加便利、完善的内容生产创作工具。
“秒画SenseMirage”不仅融合了超10亿参数的商汤自研文生图生成模型,还支持一键导入多个平台的开源模型或上传用户本地模型并对其进行特异性推理加速优化,结合自研模型及训练能力,用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。
在商汤技术交流会现场演示环节中,不仅演示了基于商汤自研AIGC模型的作图(MiaoHua team作品),也介绍了用户可导入开源模型并通过秒画平台对该模型加速推理(作画)的能力。
“如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
大模型驱动产业升级
依靠领先的“大模型+大装置”技术路径,商汤科技在国内人工智能领域拔得头筹,建起以AI赋能的四大业务板块——智慧生活、智能汽车、智慧商业与智慧城市,抢先实现商业化。
商汤发布的2022年报显示,营收来源呈现多头并进的趋势,业务收入格局更为均衡健康。
其中,智慧生活业务在2022年出现爆炸式增长,营收规模同比增长130%,收入金额达到9.55亿元,冲击10亿元大关。另一项同比增长达到59%的收入来源为智能汽车业务。该项业务贡献收入从上年同期的1.84亿元一口气增长至2022年的3亿元。
两项业务在商汤科技的营收贡献也有较大提高,占比分别从2021年的9%和4%提升至25%和8%。原先收入占比较高的智慧商业与智慧城市业务,在2022年收入占比与智慧生活和智能汽车两大新兴业务呈现板块轮动趋势。
不难发现,商汤更专注在服务B端客户。商汤认为,AI大模型发展最本质的是要解决生产力的进步问题。而在上述业务增长的背后,到处可见商汤大模型的身影。
比如商汤“SenseAuto绝影”智能汽车平台,以SenseCore商汤Al大装置为基石,以SenseAuto Empower绝影赋能引擎为底座,通过智能车舱、量产智能驾驶及车路协同构成全栈体系,全面赋能国内外车企客户的智能化升级战略。目前来看,商汤绝影智能驾驶覆盖L1-L4的全栈自研自动驾驶技术。接下来,商汤的目标是打通L1至L4的全栈软件算法能力。
智慧生活业务更是商汤科技赋能生产力升维的生动体现。去年公司智慧生活整体收入大幅增长,主要是智慧生活AI内容生成(AIGC)、AI传感器、AI ISP芯片、智慧医疗四项产品实现商业化突破。披露的数据显示,在智能手机和智能终端领域,商汤科技提供AI SDK、AI传感器和AI ISP芯片的产品组合,为客户提供强大的AI能力。2022年,搭载商汤AI SDK的新增量产智能手机达4.5亿台。
随着商汤科技“日日新”大模型体系不断优化,未来将更大程度上驱动产业升级。
从技术交流日来看,“日日新SenseNova”为政企客户提供了多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
“日日新SenseNova”也已为商汤的自身业务带来了诸多突破。例如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。
更大范围内破局AGI
商汤科技在AI领域留给外界的想象不止于此。
市场人士认为,“日日新SenseNova”带来的这些强大而易用的内容生成能力,将会改变内容生产行业的生产范式,突破内容创意的天花板,将会重塑内容生产行业生态并打开新的增长空间。
浙商证券就指出,大模型将商汤在CV领域的深厚积累予以变现,多模态实力超预期看好商汤充分利用CV技术经验,通过跨模态和三维化相结合形成模型差异化竞争优势,并在游戏、直播等领域打开商空间。
值得注意的是,无论是语言大模型,还是文生图或数字人生成,都离不开大规模AI基础设施的算力支持。商汤AI大装置SenseCore,拥有行业领先的算力输出能力、超大模型训练及大规模推理能力,将会成为AGI和大模型时代的基础设施服务领导者。
当前业界训练大模型,对大算力的需求非常旺盛,真正好用的基础设施十分稀缺。“在AI大模型时代,数据、算法和算力这三要素在经历新的演变,大模型参数量将以指数级速率提升,而数据量随着多模态的引入也将大规模增长,因此必然会导致对算力需求的剧增。”徐立表示。
“我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”他补充道。
据悉,基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务。
“基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。”商汤科技联合创始人、大装置事业群副总裁陈宇恒介绍,“而模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。”此外,商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能开发效率。
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”商汤科技联合创始人、首席科学家王晓刚表示:“商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地,场景的多样性,任务的复杂度,数据的丰富度均充分展示了我们大模型的能力和未来潜力。”
可以说,在当前的AI竞赛中,商汤科技因其长期主义和独特的技术路径,找到了关键破局点,走出了一条新商业模式。